Przejdź do treści

Newsletter Dane i Analizy, 2022-02-14

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj coś trudniejszego niż MNIST oraz ściągawka z algorytmów grupowania elementów (clustering). Do tego ciekawy projekt wizualizacji danych z meczów piłki nożnej.

A jeśli myślisz o projektowaniu systemów a nie tylko o samej analizie danych to wykład Sławka Sobótki o Domain Driven Design powinien Cię uradować.


#AI_ML

Using Google Cloud Machine Learning APIs
Jak korzystać z interfejsów machine learning API od Google w Pythonie? Część pierwsza cyklu

Using FastAI to classify Japanese kanji characters
Rozpoznawanie pisanych ręcznie cyfr – czyli zbiór MNIST – to może być zbyt prosty problem dla adeptów sztuki nauki o danych

#analiza_danych_koncepcje

Clustering cheat sheet
Nienadzorowane grupowanie elementów zbioru – metod na clustering jest wiele, tutaj zostały zebrane w jednym miejscu z objaśnieniem każdej z nich

#analiza_danych_projekty

Visualizing Football Game Data
Python, JSON, Matplotlib i Streamlit – wszystko po to, aby pokazać dane zgromadzone podczas meczu piłki nożnej.
Szkoda tylko, że takie dane nie są dostępne dla każdego ze spotkań…

Rule-Based Matching with spaCy
Dopasowywanie tekstu na podstawie reguł (dopasowanie fraz, tokenów, encji)

#architektura

DDD Q&A
Sławomir Sobótka o Domain Driven Design – wersja rozszerzona

#bazy_danych

Tricking Postgres into using an insane query plan
Ekstremalna optymalizacja Postgresa – przyspieszenie zapytań około 200 razy! Ciekawy przykład poszukiwania wąskich gardeł w zapytaniu i ich optymalizacji

#big_data

Learn All About Kafka Consumers
Głównie o offsetach i rebalancingu

#ciekawostki

Portfolio Products to Showcase Your Data Skills
Szukasz pracy? Zrób portfolio tego co potrafisz. Jeśli zajmujesz się danymi to te wskazówki mogą być przydatne

The Economics of Data Businesses
Jak powstają biznesy oparte na danych i rosną, rosną, rosną…

Loaded Words in Wordle
Wordle ciąg dalszy :)

#deep_learning

How to Build an Image Search Engine to Find Similar Images
Wyszukiwarka podobnych obrazków – jak ją przygotować?

#programowanie_ogólnie

What’s in a Good Error Message?
Jak tworzyć użyteczne komunikaty z błędami? „Coś poszło nie tak” to nie jest najlepszy z komunikatów o błędzie.
Artykuł wyjaśnia, że nawet na pierwszy rzut oka dobrze wyglądające i informatywne komunikaty z błędami można niekiedy jeszcze ulepszyć

#python_junior

Data Collection With API
Korzystanie z API (tutaj w celu zbierania danych) w Pythonie dla początkujących

#python_mid

Neat Time Series Aggregations with Core PySpark
Istnieje mnóstwo metryk szeregów czasowych, a wiele z tych metryk ma te same kroki przetwarzania wstępnego i przypadki użycia. Przykładowe, a zgrabne metryki pozwalają na wykrywanie wartości odstających albo wykrywanie trendów

#wizualizacja_danych

A subplot manager for intuitive layout in matplotlib
Jak zarządzić layoutem wykresów w Pythonie w przynazny sposób?


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *