Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
„Samo posiadanie danych nie wnosi jednak żadnej wartości dla biznesu. Spotkałam się z sytuacjami w firmach, w których były zbierane dane, ale nikt z nich nie korzystał. Po prostu było ich za dużo i były przetwarzane w niewłaściwy, lub ograniczony sposób” – znacie taką sytuację? Jest bardzo popularna. Mamy dużo danych i nie wiemy co z nimi zrobić. Polecam wywiad z Izą Wisłocką o big data i smart data w handlu.
Ekstremalnie dogłębna analiza sytuacji z Polskim Ładem. Mało techniczne, ale dotyczy nas i naszych pieniędzy, więc może być przydatne. W tekście również link do kalkulatora
#analiza_danych_koncepcje
7 Techniques to Handle Multicollinearity that Every Data Scientist Should Know
Współliniowe (silnie skorelowane ze sobą) zmienne w danych z grubsza nie wnoszą niczego do modelu poza jego obciążeniem (potrzeba więcej pamięci albo więcej czasu na trenowanie). Jak rozpoznać które cechy są zbędne?
#analiza_danych_projekty
Localization of indoor Wi-Fi users by Bayesian statistical modelling
Statystyczne modelowanie bayesowskie pozwala na liczenie „czegoś” razem prawdopodobieństwem (lub błędem) określenia tego czegoś. Tutaj ciekawy przykład.
#ciekawostki
Pandora Papers: How journalists mined terabytes of offshore data to expose the world’s elites
Bardziej felieton niż kod, ale ciekawy – o tym jak działa dziennikarstwo oparte o dane.
Can Blogging About Data Science Really Get You Hired as a Data Scientist?
Czy blogowanie może dać Ci pracę?
#deep_learning
TensorFlow for Computer Vision — Does a More Complex Architecture Guarantee a Better Model?
Jeden z odcinków cyklu o TensorFlow i Computer Vision. Jeśli interesuje Was ta tematyka to warto przewertować całość (głównie na YouTube)
Why You Should Use Callbacks in TensorFlow 2
Czy callbacki mogą się przydać? Pewnie! A do czego?
#devops
How to Create an End-to-end Machine Learning Workflow
Stworzyć model to jedno, ale jak produkcyjnie go utrzymywać? A aktualizować?
#python_junior
How to Construct a Model for Nucleation and Growth
Jak byłem młody i uczyłem się programowania (w AMOSie – takim rozbudowanym Basicu dla Amigi) to bardzo podobała mi się możliwość symulowania różnych zjawisk z użyciem komputera.
An Interactive CO2 Emissions Dashboard with Plotly and Streamlit
Plotly i Streamlit – dobrana para do budowania dashbardów
Visualize your PDF Bank Statement with Python
A tutaj dashboard z użyciem pakietu Panel. Najbardziej ciekawe są pomysły na prezentację danych o saldzie na rachunku!
Beginner’s Guide to Ensemble Learning in Python
Jeden model daje dobre wyniki. Inny (na przykład innej klasy) też daje dobre. A jakby złożyć oba – wyniki będą lepsze czy gorsze?
Exploring Google Analytics Realtime Data with Python
Można korzystać z Google Analytics do przeglądania danych, ale można te dane do czegoś wykorzystać (dublując alerty z GA albo robiąc coś mądrzejeszego). Jak pobrać dane z GA w Pythonie?
#python_mid
Build a Machine Learning Model API Using YOLOv5 With FAST API
Prosta sprawa: ja wrzucam do API obrazek, a API odpowiada co na nim jest.
Use Python to Automate the PowerPoint Update
R i RMarkdown są w moim odczuciu niezastąpione w generowaniu dokumentów zawietających np. zmieniające się dane. Ale w Pythonie też można… chociaż zaprezentowany tu sposób jest dość karkołomny.
#środowisko_pracy
Three Ways to Program in Python With RStudio
Jeśli przychodzisz z R do Pythona to pewnie RStudio jest Tobie doskonale znanym IDE.
Czyję, że RStudio ma ambicje zostać IDE dla badaczy danych.
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)