Przejdź do treści

Newsletter Dane i Analizy, 2022-05-09

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj mamy fajną paczkę tekstów o hiperparametrach, skalowaniu cech i innych rzeczach związanych z uczeniem maszynowym i podkręcaniem modeli. Tradycyjnie też kształcimy i rozwijamy się nieco w Pythonie.

W bardziej zaawansowanych tematach coś, czym firma Dane i Analizy zajmuje się na co dzień: inżynieria danych, przepływy głównie z wykorzystaniem Apache Kafka czy też projektowanie architektury zbliżonej do tej którą wykorzystuje Airbnb.

Polecam też nową inicjatywę Krzysztofa Sopyły – Podcast Biznes AI. Zapowiada się dobrze, powodzenia Krzysiek!


#analiza_danych_koncepcje

Can AutoML Beat My Model?
Machine learning (tutaj w R) dla leniwych – czy AutoML da lepsze efekty niż ręcznie przygotowany model?

7 Data Pre-Processing Methods With SciKit-Learn
Fajny tekst pokazujący jak działają transformacje zmiennych (na podstawie SciKit-Learn w Pythonie)

Grid Search vs Random Search vs Bayesian Optimization
Która z tych metod doboru hiperparametrów do modelu jest lepsza?

What Is the Effect of Batch Size on Model Learning?
Czy parametr batch_size ma znaczenie? Jakie?

#analiza_danych_projekty

How to Use Wikipedia as a Data Source
Wikipedia może być ciekawym źródłem danych. Pandas pomoże w ich pobraniu

#architektura

Airbnb’s Microservices Architecture Journey To Quality Engineering
Od monolitu do mikroserwisów w Airbnb – inspirujące

#ciekawostki

Combining the power of Jupyter and SQL editors for data analytics
Inzynierowie w Meta (Facebook) wymyślili sobie SQL Notebooks

#kafka

Five tools to manage/develop with Apache Kafka
Skoro mamy Kafkę to czy istnieją inne niż konsola narzędzia do jej monitorowania?

Exploit Apache Kafka’s Message Format to Save Storage and Bandwidth
Jak zmniejszyć ilość danych używanych przez Apache Kafka – na dysku i podczas przesyłania komunikatów siecią?

#management

Podcast Biznes AI – sztuczna inteligencja i uczenie maszynowe w biznesie
Podcast Biznes AI to nowa inicjatywa, która ma na celu pomoc w zrozumieniu w jaki sposób prowadzić i wdrażać rozwiązania ML i AI w biznesie

#programowanie_ogólnie

Logging Best Practices
Logowanie działania aplikacji – spora garść przemyślanych dobrych praktyk

All You Need to Know about Writing Effective Comments in Your Code
Logowanie logowaniem, ale komentarze w kodzie też istotne

#python_mid

Instance Methods vs Class Methods vs Static Methods
Sensowne wyjaśnienie czym jest „zwykła” metoda w klasie w Pythonie, czym jest @classmethod a czym @staticmethod

How to Use the Factory Design Pattern in Python
Jeden z wzorców projektowych opowiedziany na przykładach

How To Easily And Confidently Implement Unit Tests In Python
Testy jednostkowe w Pythonie – wprowadzenie dla początkujących

Dynamically Add Arguments to Argparse
A gdyby tak parametry wywołania skryptów byłe nieco „mądrzejsze” i bardziej przyjazne dla użytkownika?

Create Searchable Audio Using Python and NLTK
Jak przełożyć mowę (z pliku audio) na zapis tekstowy i później go przeszukiwać?

#wizualizacja_danych

Data Is An Art, Not Just A Science
Dane same w sobie mogą zawierać cenne informacje, ale trzeba umieć te informacje przekazać


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *