Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Czy mniejsza liczba artykułów (nie wiem czy to zauważalne…) to dla Was lepiej czy gorzej? Przeczytacie w związku z tym więcej (wszystkie?) czy tak samo jak zwykle 2-3, a reszta to nuda?
Dzisiejszy numer to nieco eksperyment ale – przyznajmy to szczerze – wynik sezonu wakacyjnego. Oj ciężko się zebrać do roboty, ciężko…
#AI_ML
MLU-Explain
Jak działają lasy losowe? Co to jest krzywa ROC i AUC? Jeśli nie wiesz to ten serwis w przystępny, graficzny sposób pomoże to zrozumieć
Multi-Task Learning for Classification with Keras
Multiple-Task Learning – czyli krótko mówiąc jeden model do dwóch zadań. Jedno z zadań (w przykładzie) to rozpoznawanie czy na obrazku jest zwierze czy pojazd (klasyfikacja binarna), a drugie – co konkretnie jest na obrazku (tutaj: samolot, auto, ptak, kot itd)
#analiza_danych_koncepcje
How Autoencoders Outperform PCA in Dimensionality Reduction
Autoenkodery to modne ostatnio pojęcie. Zobaczcie na przykładzie redukcji wymiarów dlaczego
#analiza_danych_projekty
Time Series Prediction using Spark
Jak za godzinę będzie wyglądał ruch w mieście? Ciekawe zagadnienie, Spark (i Kafka Streams) przychodzą z pomocą
#big_data
Building CQRS Views with Debezium, Kafka, Materialize, and Apache Pinot
Jak budować szybkie, właściwie realtime’owe widoki na ciągle zmieniające się dane? Poznajcie Apache Pinot
Spark Tips: optimizing JDBC data source reads
Sprytny trick przyspieszający odczytywanie danych przez Sparka ze źródeł JDBC (w przykładzie z PostgreSQL)
#ciekawostki
Build Your Own Mobile Proxy for Web Scraping
Rozwiązanie bazuje na Raspberry Pi i modemie GSM: Malinka steruje modemem, cyklicznie zmieniając sobie adresy IP i uruchamia aplikacje do pobierania danych ze stron docelowych
Control all GPIOs with the Raspberry Pi REST API via Python
API do sterowania podłączoną do Raspberry płytką (i na przykład znajdującymi się na niej diodami)
Generate regular expressions from test cases
Podaj próbki tekstów, które powinny przechodzić przez Twoje wyrażenie regularne, rozdzielając je spacją lub pipem. Generator przygotuje dla Ciebie wyrażenie, do którego pasują jedynie podane przez Ciebie próbki
#devops
VSCode Extensions for DevOps
DevOps Engineer też może używać VSCode. I nawet znajdzie do swojej pracy kilka przydatnych rozszerzeń (Ansible, Docker, Kubernetes)
#kafka
Understanding Kafka key concepts
Po co są klucze w komunikatach przesyłanych przez Apache Kafka? Ostatnio pytamy na to na rozmowach kwalifikacyjnych, więc to może się okazać przydatna wiedza. Ale nie tylko z tego powodu
#python
FastAPI Best Practices and Conventions
Świetne repo ze zbiorem najlepszych praktyk przy używaniu FastAPI. Zebrane z konkretnego projektu, więc można ufać
#wizualizacja_danych
The Magic of Matplotlib Stylesheets
Wykresy generowane w pythonowej bibliotece matplotlib nie należą do najpiękniejszych. Ale biblioteka ta umożliwia w pewnym sensie „stylowanie” wszystkich wykresów poprzez zmianę domyślnych parametrów
Visualize Gender-Specific Tweets with Scattertext
Scattertext to biblioteka dla Pythona pozwalająca na przedstawienie na interaktywnym wykresie danych tekstowych
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)