Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
W tym tygodniu sporo rozwiązań big data’owych i ciekawostek ogólnie związanych z przetwarzaniem danych.
Ale jeśli interesuje Cię coś bardziej „biznesowego”, w szczególności jak projektuje się produkty to gorąco polecam rozmowę z Marcinem Zarembą o projektowaniu autobookingu w Dobrym Mechaniku oraz dodatkowo tekst o tymże u Marcina na blogu. Świetny case study, serio serio.
#AI_ML
Train Mask R-CNN Net for Object Detection in 60 Lines of Code
Rozpoznawanie obiektów na zdjęciach – jak to działa?
#analiza_danych_koncepcje
Top 10 Streaming SQL Patterns
Analityka w prawie czasie rzeczywistym z pomocą SQLa
AWS SageMaker x HuggingFace x AWS QuickSight
Klasyfikacja danych medycznych z SageMakerem w praktyce – od danych, przez modele do gotowego dashboardu
6 Dimensionality Reduction Techniques
Masz za dużo kolumn w swoim zbiorze danych? Może redukcja wymiarów pomoże (i często odkryje coś dodatkowego)?
Feature Selection Using Genetic Algorithms
Algorytmy genetyczne do szukania najlepszego zestawu cech. Już nie jakieś liniowe korelacje a walka pokoleń, dzieci zmutowane genetycznie ;-)
Interesujący koncept, tutaj z przykładami i jakimiś prostymi modelami w TensorFlow
#analiza_danych_projekty
Analysis of the polarity of tweets with the hashtag #bridgerton on Twitter
Obszerny tutorial wykorzystania Python do zadań NLP (no… nie przesadzajmy) na danych z Twittera – to dobry temat do nauki w kilku obszarach jednocześnie (czyszczenie danych, trochę NLP, „gadanie” z Twitterem, rysowanie wykresów)
Process Stability Analysis with Python
Wykresy kontroli jakości – czym są, jakie mają zastosowania i jak je ogarnąć w Pythonie?
#bazy_danych
Soft deletion with PostgreSQL
Kasowanie z PostgreSQL z logiką na bazie
#big_data
PySpark czy Pandas?
A może połączyć oba?
Apache Camel vs. Apache Kafka
Kolejne dzisiaj porównanie
Real-time ingestion to Iceberg with Kafka Connect
Co to w ogóle jest Apache Iceberg i po co to?
Self-service Business Intelligence,
Samoobsługowy BI – jakie to problemy i jakie rozwiązanie (z użyciem dbt)
ETL with Apache Beam – Load Data from API to BigQuery
Jak zbudować skalowalny przepływ danych do BigQuery?
#ciekawostki
Jak powstawał Autobooking w DobryMechanik.pl (case study)?
Ciekawa rozmowa o tym jak projektuje się produkty, na przykładzie bardzo ciekawego projektu. W opisie filmu znajdziecie link do wersji opisowej
State of Engineering
Na czym inżynierowie oprogramowania spędzają swój czas? Wyniki podsumowujące 600 ankiet, źródło inspiracji w którym kierunku idzie świat IT
Creating autocomplete search forms
Pythonowy Tkinter vs VBA w Excelu
#programowanie_ogólnie
How to Write High-Quality Python as a Data Scientist
Przyjęło się mówić, że data scientiści to nie są za dobrzy programiści. Co powinni zrobić żeby to poprawić?
#python_mid
8 surprising ways how to use Jupyter Notebook
Do czego może posłużyć „zwykły” Jupyter Notebook?
#r
Two Packages to Clean and Validate Datasets
Czyszczenie (i ogólnie przygotowywanie) danych do dalszej pracy to żmudna praca, a te pakiety R mogą ją nieco uprościć
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)
Czekam zawsze na te Twoje podsumowania. Bardzo treściwe! Dobra robota. Mnie interesują szczególnie tematy z Big Data, aplikacji low code i programowania. Nigdy nie komentowałam wcześniej, ale pomyślałam, że warto powiedzieć co się myśli. Tym bardziej, że korzystam z Twojej wiedzy już od dłuższego czasu :)
Jestem po prostu zachwycona zawartością!