Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Dzisiaj coś trudniejszego niż MNIST oraz ściągawka z algorytmów grupowania elementów (clustering). Do tego ciekawy projekt wizualizacji danych z meczów piłki nożnej.
A jeśli myślisz o projektowaniu systemów a nie tylko o samej analizie danych to wykład Sławka Sobótki o Domain Driven Design powinien Cię uradować.
#AI_ML
Using Google Cloud Machine Learning APIs
Jak korzystać z interfejsów machine learning API od Google w Pythonie? Część pierwsza cyklu
Using FastAI to classify Japanese kanji characters
Rozpoznawanie pisanych ręcznie cyfr – czyli zbiór MNIST – to może być zbyt prosty problem dla adeptów sztuki nauki o danych
#analiza_danych_koncepcje
Clustering cheat sheet
Nienadzorowane grupowanie elementów zbioru – metod na clustering jest wiele, tutaj zostały zebrane w jednym miejscu z objaśnieniem każdej z nich
#analiza_danych_projekty
Visualizing Football Game Data
Python, JSON, Matplotlib i Streamlit – wszystko po to, aby pokazać dane zgromadzone podczas meczu piłki nożnej.
Szkoda tylko, że takie dane nie są dostępne dla każdego ze spotkań…
Rule-Based Matching with spaCy
Dopasowywanie tekstu na podstawie reguł (dopasowanie fraz, tokenów, encji)
#architektura
DDD Q&A
Sławomir Sobótka o Domain Driven Design – wersja rozszerzona
#bazy_danych
Tricking Postgres into using an insane query plan
Ekstremalna optymalizacja Postgresa – przyspieszenie zapytań około 200 razy! Ciekawy przykład poszukiwania wąskich gardeł w zapytaniu i ich optymalizacji
#big_data
Learn All About Kafka Consumers
Głównie o offsetach i rebalancingu
#ciekawostki
Portfolio Products to Showcase Your Data Skills
Szukasz pracy? Zrób portfolio tego co potrafisz. Jeśli zajmujesz się danymi to te wskazówki mogą być przydatne
The Economics of Data Businesses
Jak powstają biznesy oparte na danych i rosną, rosną, rosną…
Loaded Words in Wordle
Wordle ciąg dalszy :)
#deep_learning
How to Build an Image Search Engine to Find Similar Images
Wyszukiwarka podobnych obrazków – jak ją przygotować?
#programowanie_ogólnie
What’s in a Good Error Message?
Jak tworzyć użyteczne komunikaty z błędami? „Coś poszło nie tak” to nie jest najlepszy z komunikatów o błędzie.
Artykuł wyjaśnia, że nawet na pierwszy rzut oka dobrze wyglądające i informatywne komunikaty z błędami można niekiedy jeszcze ulepszyć
#python_junior
Data Collection With API
Korzystanie z API (tutaj w celu zbierania danych) w Pythonie dla początkujących
#python_mid
Neat Time Series Aggregations with Core PySpark
Istnieje mnóstwo metryk szeregów czasowych, a wiele z tych metryk ma te same kroki przetwarzania wstępnego i przypadki użycia. Przykładowe, a zgrabne metryki pozwalają na wykrywanie wartości odstających albo wykrywanie trendów
#wizualizacja_danych
A subplot manager for intuitive layout in matplotlib
Jak zarządzić layoutem wykresów w Pythonie w przynazny sposób?
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)