Przejdź do treści

Newsletter Dane i Analizy, 2022-01-03

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Dzisiaj kilka tematów „pokrytych” nie tylko jednym tekstem. Mamy więc coś o modelach BERT plus automatycznie tworzenie tekstów przez GPT-3, mamy wizualizacje danych na mapach (w R i Pythonie). Mamy też cykl, który pozwoli na napisanie bota do np. CS:GO.

Na blogu od dawna nie było nowego tekstu (stąd podlinkoway niżej tekst o GPT-3 ;), ale jakieś rzeczy robię i publikuję. Zwykle jest tak, że energia opada po przygotowaniu działającego kodu. Tak jest z serwowaniem obrazków przez API (przy okazji te obrazki się generują) – sami zobaczcie do repozytorium.

Inny projekt z ostatnich dni to szybka apka w Streamlit obrazująca to, czego nie pokazuje oficjalne źródło danych o statystykach zakażeń i zgonów z powodu COVID-19 z uwzględnieniem szczepienia, w podziale na powiaty, płeć i wiek. Proszę bardzo – wykresy dla danych pokazywanych przez Departament Analiz i Strategii Ministerstwa Zdrowia.

Zwykle narzekam na dostęp do danych oficjalnych, ale z COVIDem nie jest tak źle. Dane historyczne o zakażeniach i zgonach na poziomie powiatów znajdziecie na tej stronie, a o szczepieniach tutaj. Nie wiem czy linki są stałe, na pewno prowadzą do paczek zZIPowanych CSVek, da się to automatycznie ogarnąć. Brakuje tylko podziału na wiek i płeć. Może ktoś ma ochotę poćwiczyć na tych danych? Dajcie znać jak coś fajnego przygotujecie!


#analiza_danych_projekty

End to end machine learning pipeline
Jak powinno robić się cały proces analizy danych, trenowania modeli, utrzymywania ich kolejnych wersji i wszystkiego co dostaje użytkownik końcowy? Dobry przykład pokazujący rozsądne kierunki

#ciekawostki

Nauka Machine Learning – 3 różne perspektywy
Vladimir zebrał trzy opinie świeżo upieczonych absolwentów jego kursu „Praktyczne uczenie maszynowe od podstaw”. Zobacz jak różne profile mają te osoby i co każdy znalazł wartościowego dla siebie w tym kursie.

Top 10 Data Science Jargons For Beginners
Jakby Cię pytali na rozmowie rekrutacyjnej o podstawy podstaw analizy danych – to masz ściągawę.

#deep_learning

Manual for the First Time Users: Google BERT for Text Classification
Jak zacząć z modelami BERT?

A Deep Dive into the Code of the BERT Model
Jak zacząć z modelami BERT? Inny tekst, do kompletu :)

How to create an AI blog writing tool
„Chciałbym żeby samo się pisało” – jak sztuczna inteligencja może pisać gotowe teksty na bloga? Mi by się taka przydała…

TensorFlow object detection aim bot with multiprocessing
Ostatnia część (sięgnij po wcześniejsze) tutoriala podczas którego powstaje bot grający w strzelanki FPS. Fajne wykorzystany multiprocessing oraz TensorFlow

#python_junior

How to Track the Progress of Parallel Tasks In Python with TQDM
Ile to jeszcze portwa? Pasek postępu, też dla zadań równoległych. Zobacz też tekst „Check training from your smartphone” w sekcji „python mid”

Visualizing Geospatial Data in Python
Mapki w Pythonie. Opisywałem to też na blogu, może w pełniejszej wersji?

#python_mid

Build a Django Application To Perform CRUD Operations
Operacje CRUD (Create, Read, Update, Delete) w aplikacji Django – jeśli uczysz się tego frameworku to napewno się przyda

The steps to auto-publish posts using the Facebook Graph API
Jak automatycznie publikować posty na Facebooku?

How to Build Simulation Models with Python
Jeśli zajmujesz się symulacjami to pakiet PySym może Ci się przydać, ale czy da się bez?

Check training from your smartphone
Czy zadanie w Pythonie się wykonało? Sprawdzaj sobie na telefonie (w Telegramie). Fajny przykład łączący tqdm i w pewnym sensie bota w Telegramie

#r

Geospatial Visualization with the tmap package in R
Mapki w R. O tym też było na blogu

Using databases with Shiny
Jak używać baz danych w aplikacjach napisanych w Shiny?

#spark

How to write PySpark Unit Tests
Czy da się pisać testy automatyczne dla zadań realizowanych w PySparku?


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *