Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Dzisiaj nieco później niż zwykle, nieco skromniej i bez zbędnego lania wody. Taki eksperyment.
#ai_ml
50 Handpicked GitHub Repositories to Master Data Science Skills
Najlepszym sposobem na naukę jest praktyka. Własna – pisanie kodu, albo cudza – czytanie kodu. Aby ułatwić to drugie – zbiór materiałów.
#analiza_danych_projekty
Feature Engineering in XGBoost
Więcej tutaj operacji na danych w Pandasie niż samego XGBoosta, ale o inżynierii cech nigdy za wiele.
Football and Geometry
Wprowadzenie do grafów na podstawie siatki podań piłkarzy podczas meczy.
#big_data
From MySQL to Hadoop and Beyond
Setki petabajtów, opóźnienia w minutach – droga Ubera od MySQL
Building a Log Analysis Data Pipeline Using Kafka, Elasticsearch, Logstash, and Kibana
A gdyby tak logi wysyłać na Kafkę i potem wszystko „zlać” do Elastica? Brzmi znajomo?
#powerbi
Save dashboard in .pbix and PDF format under 2 mins
Kiedy już mamy przygotowany dashboard w PowerBI to chcemy go pokazać światu. Ale nie każdy musi mieć PowerBI, żeby obejrzeć nasze dzieło…
#programowanie_ogólnie
Optimal Approaches for Structuring API Responses
Jak budować struktury odpowiedzi API? Jedno z podejść, które sprawia że JSON jakim API odpowiada jest czytelny i w stosunkowo przewidywalnej strukturze.
#python
FastAPI: SOLID Principles and Design Patterns
Architektura kodu serwisu napisanego w FastAPI, która podąża za pryncypiami SOLID
MongoDB Pagination in FastAPI
Być może mamy dużo danych w MongoDB. Być może piszemy API, które te dane wyciąga. A jeśli danych jest bardzo dużo to warto rozważyć stronicowanie wyników. Jak je zrobić?
Comprehensive Guide on Python Namespaces & Variable Scopes
Zasięg zmiennych w Pythonie – pełna informacja. Dla początkujących.
Next-Gen Python Environment, Redefining Jupyter Notebooks
Marimo to alternatywa dla Jupyter Notebooka, która m.in. wprowadza interaktywność – zerknij na pozycję „Use Cases” w głównym menu.
#spark
The InferSchema Problem
Co powoduje użycie InferSchema (na przykładzie plików CSV) i jak ten problem zniwelować?
#sql
CTE Vs. Subqueries In SQL
CTE i podzapytania mają własną przestrzeń w SQL. Jeżeli wiesz, kiedy używać każdego z nich, możesz znacząco zwiększyć przejrzystość i wydajność swojego zapytania.
#ux
I Analyzed 4 Successful Products to Find These Powerful UI Design and Implementation Principles
Autor wyjaśnia kilka zasad projektowania zaczerpniętych z udanych produktów. W jaki sposób te produkty ściśle przestrzegają zasad?
#zestawy_danych
12 Must-Use Datasets for Data Visualization
Przy ćwiczeniach z danymi (czy to ich przetwarzaniem czy wizualizacją) największym zagadnieniem może być zdobycie danych. To zestawienie może rozwiązać problem braku danych.
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)