Przejdź do treści

Newsletter Dane i Analizy, 2021-12-13

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

„Samo posiadanie danych nie wnosi jednak żadnej wartości dla biznesu. Spotkałam się z sytuacjami w firmach, w których były zbierane dane, ale nikt z nich nie korzystał. Po prostu było ich za dużo i były przetwarzane w niewłaściwy, lub ograniczony sposób” – znacie taką sytuację? Jest bardzo popularna. Mamy dużo danych i nie wiemy co z nimi zrobić. Polecam wywiad z Izą Wisłocką o big data i smart data w handlu.

Ekstremalnie dogłębna analiza sytuacji z Polskim Ładem. Mało techniczne, ale dotyczy nas i naszych pieniędzy, więc może być przydatne. W tekście również link do kalkulatora


#analiza_danych_koncepcje

7 Techniques to Handle Multicollinearity that Every Data Scientist Should Know
Współliniowe (silnie skorelowane ze sobą) zmienne w danych z grubsza nie wnoszą niczego do modelu poza jego obciążeniem (potrzeba więcej pamięci albo więcej czasu na trenowanie). Jak rozpoznać które cechy są zbędne?

#analiza_danych_projekty

Localization of indoor Wi-Fi users by Bayesian statistical modelling
Statystyczne modelowanie bayesowskie pozwala na liczenie „czegoś” razem prawdopodobieństwem (lub błędem) określenia tego czegoś. Tutaj ciekawy przykład.

#ciekawostki

Pandora Papers: How journalists mined terabytes of offshore data to expose the world’s elites
Bardziej felieton niż kod, ale ciekawy – o tym jak działa dziennikarstwo oparte o dane.

Can Blogging About Data Science Really Get You Hired as a Data Scientist?
Czy blogowanie może dać Ci pracę?

#deep_learning

TensorFlow for Computer Vision — Does a More Complex Architecture Guarantee a Better Model?
Jeden z odcinków cyklu o TensorFlow i Computer Vision. Jeśli interesuje Was ta tematyka to warto przewertować całość (głównie na YouTube)

Why You Should Use Callbacks in TensorFlow 2
Czy callbacki mogą się przydać? Pewnie! A do czego?

#devops

How to Create an End-to-end Machine Learning Workflow
Stworzyć model to jedno, ale jak produkcyjnie go utrzymywać? A aktualizować?

#python_junior

How to Construct a Model for Nucleation and Growth
Jak byłem młody i uczyłem się programowania (w AMOSie – takim rozbudowanym Basicu dla Amigi) to bardzo podobała mi się możliwość symulowania różnych zjawisk z użyciem komputera.

An Interactive CO2 Emissions Dashboard with Plotly and Streamlit
Plotly i Streamlit – dobrana para do budowania dashbardów

Visualize your PDF Bank Statement with Python
A tutaj dashboard z użyciem pakietu Panel. Najbardziej ciekawe są pomysły na prezentację danych o saldzie na rachunku!

Beginner’s Guide to Ensemble Learning in Python
Jeden model daje dobre wyniki. Inny (na przykład innej klasy) też daje dobre. A jakby złożyć oba – wyniki będą lepsze czy gorsze?

Exploring Google Analytics Realtime Data with Python
Można korzystać z Google Analytics do przeglądania danych, ale można te dane do czegoś wykorzystać (dublując alerty z GA albo robiąc coś mądrzejeszego). Jak pobrać dane z GA w Pythonie?

#python_mid

Build a Machine Learning Model API Using YOLOv5 With FAST API
Prosta sprawa: ja wrzucam do API obrazek, a API odpowiada co na nim jest.

Use Python to Automate the PowerPoint Update
R i RMarkdown są w moim odczuciu niezastąpione w generowaniu dokumentów zawietających np. zmieniające się dane. Ale w Pythonie też można… chociaż zaprezentowany tu sposób jest dość karkołomny.

#środowisko_pracy

Three Ways to Program in Python With RStudio
Jeśli przychodzisz z R do Pythona to pewnie RStudio jest Tobie doskonale znanym IDE.
Czyję, że RStudio ma ambicje zostać IDE dla badaczy danych.


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *