Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Dzisiaj poniedziałek, ale w środę po południu przyjdzie do Ciebie mail z ankietą. To 6 prostych pytań, które pomogą w rozwoju newslettera. Dawno nie było ankiety, widzę statystyki tego co czytacie, ale statystyki to jedno, a odczucie prawdziwego czytelniak to drugie :) Ankieta sprowadza się do klikania, zajmuje 2-3 minuty, zachęcam do wypełnienia.
A dzisiaj jeszcze standardowo – dużo treści na przeróżne tematy :). Dzisiaj na prawdę dużo (drugie tyle czeka w garażu, mam przynieść?).
#AI_ML
Tutorial GPT-3 – podstawy w 20 minut
Jak generować teksty z użyciem sztucznej inteligencji od OpenAI? W tym poradniku znajdziecie absolutne podstawy używania GPT-3
How to Visualize Neural Network Architectures?
Dla praktyków zapewne wystarczy kawałek kodu, ale być może na slajdach w prezentacjach na konferencjach albo w publikacjach naukowych lepiej pokazywać architekturę sieci neuronowych obrazkami? Tutaj znajdziecie przykładowe sposoby przygotowania takich obrazków w Pythonie.
#analiza_danych_koncepcje
How to Support A/B Testing in Python
Znowu video, tym razem o wykorzystaniu „feature flags” w kodzie, w szczególności przy testach A/B. Arjan pokazuje przy okazji narzędzia wspomagające feature flags i testy A/B – GrowthBook oraz MixPanel – i ich wykorzystanie w praktyce
Solving Multi-Armed Bandit Problems
Będąc już przy testach A/B można iść krok dalej – w stronę problemu wielorękiego bandyty. W bardzo dużym skrócie: test A/B da nam wynik po sprawdzeniu określonej liczby kontaktów (odpowiednio rozdzielonych na próbki) z probką A i z próbką B, dopiero na końcu. Wieloręki bandyta przybliża nas do wyniki po każdym z kontaktów, po każdym z użytkowników. Mechanizm ten jest najczęściej wykorzystywany przy serwowaniu najlepszej (czyli najbardziej skutecznej) reklamy
Better churn prediction – using survival analysis
Interesujący pomysł – wykorzystanie metod znanych z analizy przeżycia do predykcji churnu (czyli odejścia klientów). W niedzielę na fanpage’u był tutorial o churnie, więc możecie trakrować to jako uzupełnienie (ale bez kodu)
Modeling Starbucks Waiting Time Using Markov Chains
Ile czay będę czekać na kawę w Starbucksie? Użyjmy łańcuchów Markova żeby się tego dowiedzieć! I Pythona, żeby nie liczyć na kartce ;)
#analiza_danych_projekty
Deploying a Data Science Platform on AWS: Setting Up AWS Batch
Równoległe uczenie modeli na zasobach AWS – o tym jest ta seria (to pierwszy z ciągu artykułów). Ale chyba najwięcej dowiesz się o tym jak z poziomu konsoli operować maszynami i zlecać im konkretne zadania.
#bazy_danych
Redis Explained
Co to jest Redis, jak to zbudowane architektonicznie? A i blog cały fajny, z przyjemnymi obrazkami
Working with JSON in Postgres
Tak, w PostgreSQL można trzymać JSONy. Tak, można ich używać tak jak innych danych. Jak? Tak!
How To Operate MongoDB in Python
Inny sposób na trzymanie danych których strukturę można opisać JSONem to MongoDB. I tutaj szybkie wprowadzenie jak z Mongo korzystać w Pythonie
#big_data
Hydrating a Data Lake using Log-based Change Data Capture
Co to jest CDC, jak ma się do tego Debezium? W dużym uproszczeniu: ten tekst opisuje architekturę, w której każda zmiana na bazie danych przekazywana jest na Kafkę. Co z tym dalej zrobić to już właściwie dowolność…
Kafka & KSQL & TensorFlow for Data Scientists via Python & Jupyter Notebook
A jak już sobie coś leci tą Kafką to może użyć tych danych do predykcji z użyciem modelu opartego o TensorFlow?
#ciekawostki
How LinkedIn Uses Machine Learning To Rank Your Feed
Jak na poziomie dość ogólnym wygląda decydowanie o tym co widzisz na swoim feedzie w LinkedIn? To właściwie bardzo dobre wprowadzenie do artykuły powyżej!
Prometheus & Microsoft Teams Integration
Czy monitoring jakiejś aplikacji może komunikować się z Tobą przez Teams? Może. Tutaj przykład jak spiąć z Teamsami Prometeusza
#management
Moving from Data Lakes to Data Mesh
Dlaczego firmy decydują się na decentralizację danych? Jak ten proces się odbywa?
#python
The Art of Speeding Up Python Loop
Python dla początkujących i średnio zaawansowanych – jak przyspieszać działanie pętli?
Make your Streamlit Web App Look Better
Tutaj zaś Streamlit dla średnio zaawansowanych: jak sprawić, żeby aplikacje tworzone w tym frameworku były nieco wygodniejsze w użyciu albo układ elementów był taki jak chcemy?
Using Eurostat statistical data on Europe with Python
Eurostat to wielka baza danych, nic tylko sięgać i na przykład tworzyć mapki „jak to w Europie jest z…”. No ale kto by chciał ściągać dane ręcznie, skoro można automatycznie?
Getting Started with Google APIs in Python
Google do właściwie wszystkich swoich usług daje API. Co więcej – daje API do takich usług, których nie ma wydzielonych do oddzielnych produktów (bo wchodzą w część czegoś innego – Google Places, mówiące o np. restauracjach które widać na Google Maps). I bardzo Google chce żebyśmy z tych danych korzystali. Tak więc poznajmy sposób w jaki można to zrobić w Pythonie
Shiny for Python – simple Twitter analytics dashboard
Jakiś czas temu framework Shiny został przygotowany do użycia w Pythonie (już nie tylko w R). Dla osób przesiadających się z R może to być znakomite ułatwienie. Takim ułatwiniem będzie ten tutorial, pokazujący jak w Python+Shiny zbudować prosty dashboard.
#r
Understanding ShinyApps
A jeśli już jesteśmy przy Shiny – czym są te aplikacje? Jaka filozofia stoi za sposobem działania?
How to Deploy Shiny Apps in Azure and use your Domain Name
Przygotowaliśmy naszą aplikację w Shiny, ubraliśmy ja w Dockera, jak teraz to wdrożyć na Azure? Dodając własną domenę i certyfikat SSL.
How to Work With XML Files in R
Krótko mówiąc: jak czytać XMLe w R? Takie proste XMLe, bo te bardziej zakręcone to już większa komplikacja. Ale jak znamy podstawy to możemy iść dalej
#spark
Reading Kafka data through PySpark
Czy Spark może czytać dane bezpośrednio z Kafki? Może. Jak to zrobić z poziomu Pythona i PySparka? Zobacz tutaj!
#wizualizacja_danych
Dashboard Design Patterns
Dashboardy i ich wygląd – temat rzeka. Trochę inspiracji i cennych wskazówek znajdziecie tutaj
Visualizing S&P 500 Performance by Sector
Insporujący sposób na pokazanie wyników giełdowych spółek z S&P 500 w 2022 roku
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)