Newsletter Dane i Analizy, 2022-06-06

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

W tym tygodniu sporo rozwiązań big data’owych i ciekawostek ogólnie związanych z przetwarzaniem danych.

Ale jeśli interesuje Cię coś bardziej „biznesowego”, w szczególności jak projektuje się produkty to gorąco polecam rozmowę z Marcinem Zarembą o projektowaniu autobookingu w Dobrym Mechaniku oraz dodatkowo tekst o tymże u Marcina na blogu. Świetny case study, serio serio.

#AI_ML

Train Mask R-CNN Net for Object Detection in 60 Lines of Code
Rozpoznawanie obiektów na zdjęciach – jak to działa?

#analiza_danych_koncepcje

Top 10 Streaming SQL Patterns
Analityka w prawie czasie rzeczywistym z pomocą SQLa

AWS SageMaker x HuggingFace x AWS QuickSight
Klasyfikacja danych medycznych z SageMakerem w praktyce – od danych, przez modele do gotowego dashboardu

6 Dimensionality Reduction Techniques
Masz za dużo kolumn w swoim zbiorze danych? Może redukcja wymiarów pomoże (i często odkryje coś dodatkowego)?

Feature Selection Using Genetic Algorithms
Algorytmy genetyczne do szukania najlepszego zestawu cech. Już nie jakieś liniowe korelacje a walka pokoleń, dzieci zmutowane genetycznie ;-)
Interesujący koncept, tutaj z przykładami i jakimiś prostymi modelami w TensorFlow

#analiza_danych_projekty

Analysis of the polarity of tweets with the hashtag #bridgerton on Twitter
Obszerny tutorial wykorzystania Python do zadań NLP (no… nie przesadzajmy) na danych z Twittera – to dobry temat do nauki w kilku obszarach jednocześnie (czyszczenie danych, trochę NLP, „gadanie” z Twitterem, rysowanie wykresów)

Process Stability Analysis with Python
Wykresy kontroli jakości – czym są, jakie mają zastosowania i jak je ogarnąć w Pythonie?

#bazy_danych

Soft deletion with PostgreSQL
Kasowanie z PostgreSQL z logiką na bazie

#big_data

PySpark czy Pandas?
A może połączyć oba?

Apache Camel vs. Apache Kafka
Kolejne dzisiaj porównanie

Real-time ingestion to Iceberg with Kafka Connect
Co to w ogóle jest Apache Iceberg i po co to?

Self-service Business Intelligence,
Samoobsługowy BI – jakie to problemy i jakie rozwiązanie (z użyciem dbt)

ETL with Apache Beam – Load Data from API to BigQuery
Jak zbudować skalowalny przepływ danych do BigQuery?

#ciekawostki

Jak powstawał Autobooking w DobryMechanik.pl (case study)?
Ciekawa rozmowa o tym jak projektuje się produkty, na przykładzie bardzo ciekawego projektu. W opisie filmu znajdziecie link do wersji opisowej

State of Engineering
Na czym inżynierowie oprogramowania spędzają swój czas? Wyniki podsumowujące 600 ankiet, źródło inspiracji w którym kierunku idzie świat IT

Creating autocomplete search forms
Pythonowy Tkinter vs VBA w Excelu

#programowanie_ogólnie

How to Write High-Quality Python as a Data Scientist
Przyjęło się mówić, że data scientiści to nie są za dobrzy programiści. Co powinni zrobić żeby to poprawić?

#python_mid

8 surprising ways how to use Jupyter Notebook
Do czego może posłużyć „zwykły” Jupyter Notebook?

#r

Two Packages to Clean and Validate Datasets
Czyszczenie (i ogólnie przygotowywanie) danych do dalszej pracy to żmudna praca, a te pakiety R mogą ją nieco uprościć

Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

2 komentarze do “Newsletter Dane i Analizy, 2022-06-06”

KamilaJ 07-06-2022 o 8:25

Odpowiedz

Czekam zawsze na te Twoje podsumowania. Bardzo treściwe! Dobra robota. Mnie interesują szczególnie tematy z Big Data, aplikacji low code i programowania. Nigdy nie komentowałam wcześniej, ale pomyślałam, że warto powiedzieć co się myśli. Tym bardziej, że korzystam z Twojej wiedzy już od dłuższego czasu :)
Patrycja 21-09-2022 o 22:28

Odpowiedz

Jestem po prostu zachwycona zawartością!