Newsletter Dane i Analizy, 2024-09-23

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj nieco później niż zwykle, nieco skromniej i bez zbędnego lania wody. Taki eksperyment.

#ai_ml

50 Handpicked GitHub Repositories to Master Data Science Skills
Najlepszym sposobem na naukę jest praktyka. Własna – pisanie kodu, albo cudza – czytanie kodu. Aby ułatwić to drugie – zbiór materiałów.

#analiza_danych_projekty

Feature Engineering in XGBoost
Więcej tutaj operacji na danych w Pandasie niż samego XGBoosta, ale o inżynierii cech nigdy za wiele.

Football and Geometry
Wprowadzenie do grafów na podstawie siatki podań piłkarzy podczas meczy.

#big_data

From MySQL to Hadoop and Beyond
Setki petabajtów, opóźnienia w minutach – droga Ubera od MySQL

Building a Log Analysis Data Pipeline Using Kafka, Elasticsearch, Logstash, and Kibana
A gdyby tak logi wysyłać na Kafkę i potem wszystko „zlać” do Elastica? Brzmi znajomo?

#powerbi

Save dashboard in .pbix and PDF format under 2 mins
Kiedy już mamy przygotowany dashboard w PowerBI to chcemy go pokazać światu. Ale nie każdy musi mieć PowerBI, żeby obejrzeć nasze dzieło…

#programowanie_ogólnie

Optimal Approaches for Structuring API Responses
Jak budować struktury odpowiedzi API? Jedno z podejść, które sprawia że JSON jakim API odpowiada jest czytelny i w stosunkowo przewidywalnej strukturze.

#python

FastAPI: SOLID Principles and Design Patterns
Architektura kodu serwisu napisanego w FastAPI, która podąża za pryncypiami SOLID

MongoDB Pagination in FastAPI
Być może mamy dużo danych w MongoDB. Być może piszemy API, które te dane wyciąga. A jeśli danych jest bardzo dużo to warto rozważyć stronicowanie wyników. Jak je zrobić?

Comprehensive Guide on Python Namespaces & Variable Scopes
Zasięg zmiennych w Pythonie – pełna informacja. Dla początkujących.

Next-Gen Python Environment, Redefining Jupyter Notebooks
Marimo to alternatywa dla Jupyter Notebooka, która m.in. wprowadza interaktywność – zerknij na pozycję „Use Cases” w głównym menu.

#spark

The InferSchema Problem
Co powoduje użycie InferSchema (na przykładzie plików CSV) i jak ten problem zniwelować?

#sql

CTE Vs. Subqueries In SQL
CTE i podzapytania mają własną przestrzeń w SQL. Jeżeli wiesz, kiedy używać każdego z nich, możesz znacząco zwiększyć przejrzystość i wydajność swojego zapytania.

#ux

I Analyzed 4 Successful Products to Find These Powerful UI Design and Implementation Principles
Autor wyjaśnia kilka zasad projektowania zaczerpniętych z udanych produktów. W jaki sposób te produkty ściśle przestrzegają zasad?

#zestawy_danych

12 Must-Use Datasets for Data Visualization
Przy ćwiczeniach z danymi (czy to ich przetwarzaniem czy wizualizacją) największym zagadnieniem może być zdobycie danych. To zestawienie może rozwiązać problem braku danych.

Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)