Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Dzisiejsze wydanie newslettera skupia się na szeregach czasowych. Szeregiem czasowym jest pewnie jakieś 60% danych, na pewno wszystkie zmieniające się w czasie. Tak więc liczba klientów w sklepie (albo stronie internetowej), wynik pomiarów z jakiegoś czujnika (temperatura) itd itp – wszystko to układa się w szeregi czasowe.
A takie szeregi pozwalają na przewidywanie przyszłości. Czasem jest to łatwe, czasem trudne (giełda to też w zasadzie szereg czasowy, a przewidywanie nie jest takie oczywiste). I trochę o tym dzisiaj.
#analiza_danych_koncepcje
What Can Be Learned From 1,001 A/B Tests?
Ile powinien trwać test typu A/B? Jaka powinna być wielkość próbki? Jakie są progi ufności?
Pair-Wise Hyperparameter Tuning with the Native XGBoost API
O (hiper)parametrach XGBoost i poszukiwaniu najlepszej ich kombinacji
#analiza_danych_projekty
Measuring User Engagement with Cohort Analysis
Firmy muszą być w stanie mierzyć zaangażowanie i retencję użytkowników, aby określić ilościowo różne czynniki wpyływające na zachowania użytkowników, takie jak zmiana w czasie, zdarzenia zewnętrzne i sezonowość zaangażowanie
#ciekawostki
Ultimate Guide to Statistics for Data Science
Data scientist bez znajomości podstawowych zagadnień statystyki ponoć sobie nie poradzi. Zatem uzupełnienie wiedzy przed Wami (o ile go potrzebujecie)
#devops
Your First MLOps System: What Does Good Look Like?
Co to jest system MLOps? Jak wygląda dobry system MLOps? Jak to zrealizować? Jak skalować system MLOps?
#python
Face Detection using Haar-Cascade using Python Uncategorized
Haar-Cascade są używane do wykrywania twarzy na urządzeniach o niskiej wydajności i jest to jeden z najpopularniejszych algorytmów wykrywania obiektów w OpenCV. Na czym polega? Jak go użyć w Pythonie?
#spark
Most Important PySpark Functions with Example
Kilka mniej oczywistych funkcji w PySpark które mogą ułatwić życie
Apache Spark Monitoring
Jak używać interfejsów API do monitorowania Sparka?
#szeregi_czasowe
How to Do an EDA for Time-Series
Analiza szeregów czasowych – w Pythonie i Pandas. Dobre wprowadzenie do samych szeregów
Time-Series Stationarity Simply Explained
Proste i intuicyjne wyjaśnienie dlaczego w modelowaniu szeregów czasowych powinny one być stacjonarne?
Box-Cox Transform for Time Series
Jedna z najbardziej podstawowych transformacji sprowadzająca szereg czasowy do postaci stacjonarnej
How to Create a GIF from Matplotlib Plots in Python
Technika wizualizacji danych dla dwuwymiarowych szeregów czasowych przy użyciu pakietu imageio
Text as Time Series
Ciekawy pakiet dla Pythona, który ułatwia pracę z danymi tekstowymi (głównie ich eksplorację), ale też pozwala na traktowanie tekstu jak szeregu czasowego
Interrupted time series analysis
Wprowadzenie do bajesowskiej analizy szeregów czasowych, czyli kolejny poziom skomplikowania :)
#ux
Tworzenie lepszych komunikatów z błedami
Ciekawa analiza tego, z czego zbudowany jest komunikat z błędem i jak każdą z tych części można ulepszyć. Przyjemnie zaprezentowana wiedza.
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)