Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Dzisiaj mamy fajną paczkę tekstów o hiperparametrach, skalowaniu cech i innych rzeczach związanych z uczeniem maszynowym i podkręcaniem modeli. Tradycyjnie też kształcimy i rozwijamy się nieco w Pythonie.
W bardziej zaawansowanych tematach coś, czym firma Dane i Analizy zajmuje się na co dzień: inżynieria danych, przepływy głównie z wykorzystaniem Apache Kafka czy też projektowanie architektury zbliżonej do tej którą wykorzystuje Airbnb.
Polecam też nową inicjatywę Krzysztofa Sopyły – Podcast Biznes AI. Zapowiada się dobrze, powodzenia Krzysiek!
#analiza_danych_koncepcje
Can AutoML Beat My Model?
Machine learning (tutaj w R) dla leniwych – czy AutoML da lepsze efekty niż ręcznie przygotowany model?
7 Data Pre-Processing Methods With SciKit-Learn
Fajny tekst pokazujący jak działają transformacje zmiennych (na podstawie SciKit-Learn w Pythonie)
Grid Search vs Random Search vs Bayesian Optimization
Która z tych metod doboru hiperparametrów do modelu jest lepsza?
What Is the Effect of Batch Size on Model Learning?
Czy parametr batch_size ma znaczenie? Jakie?
#analiza_danych_projekty
How to Use Wikipedia as a Data Source
Wikipedia może być ciekawym źródłem danych. Pandas pomoże w ich pobraniu
#architektura
Airbnb’s Microservices Architecture Journey To Quality Engineering
Od monolitu do mikroserwisów w Airbnb – inspirujące
#ciekawostki
Combining the power of Jupyter and SQL editors for data analytics
Inzynierowie w Meta (Facebook) wymyślili sobie SQL Notebooks
#kafka
Five tools to manage/develop with Apache Kafka
Skoro mamy Kafkę to czy istnieją inne niż konsola narzędzia do jej monitorowania?
Exploit Apache Kafka’s Message Format to Save Storage and Bandwidth
Jak zmniejszyć ilość danych używanych przez Apache Kafka – na dysku i podczas przesyłania komunikatów siecią?
#management
Podcast Biznes AI – sztuczna inteligencja i uczenie maszynowe w biznesie
Podcast Biznes AI to nowa inicjatywa, która ma na celu pomoc w zrozumieniu w jaki sposób prowadzić i wdrażać rozwiązania ML i AI w biznesie
#programowanie_ogólnie
Logging Best Practices
Logowanie działania aplikacji – spora garść przemyślanych dobrych praktyk
All You Need to Know about Writing Effective Comments in Your Code
Logowanie logowaniem, ale komentarze w kodzie też istotne
#python_mid
Instance Methods vs Class Methods vs Static Methods
Sensowne wyjaśnienie czym jest „zwykła” metoda w klasie w Pythonie, czym jest @classmethod a czym @staticmethod
How to Use the Factory Design Pattern in Python
Jeden z wzorców projektowych opowiedziany na przykładach
How To Easily And Confidently Implement Unit Tests In Python
Testy jednostkowe w Pythonie – wprowadzenie dla początkujących
Dynamically Add Arguments to Argparse
A gdyby tak parametry wywołania skryptów byłe nieco „mądrzejsze” i bardziej przyjazne dla użytkownika?
Create Searchable Audio Using Python and NLTK
Jak przełożyć mowę (z pliku audio) na zapis tekstowy i później go przeszukiwać?
#wizualizacja_danych
Data Is An Art, Not Just A Science
Dane same w sobie mogą zawierać cenne informacje, ale trzeba umieć te informacje przekazać
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)