Newsletter Dane i Analizy, 2022-12-27

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Święta, święta i po świętach. Nawet newsletter opóźniony specjalnie o jeden dzień, żebyście mogli w pełni od komputerów odpocząć :)

W ostatnim w 2022 roku numerze trochę mniej tekstów, ale to nie znaczy że są one słabszej jakości. Spora część dzisiejszego tortu to technologie big data, ale jest też coś o Pythonie i kilka ciekawostek ogólnych.

Najbardziej chyba polecam zestawienie w zmianie liczby ludności w i wokół polskich miast – książkowe wręcz przykłady suburbanizacji. Dobre jest też wyjaśnienie algorytmów boostingowych.

Ostatni raz w tym roku mam dla Was rabat 15% na Karty Data Science.

Karty Data Science to zestaw, który pozwoli Ci uporządkować wiedzę z zakresu data science czy też machine learning. Co prawda na prezent świąteczny już za późno, ale może do powtórki przed sesją zimową?

#analiza_danych_koncepcje

What Is Survival Analysis?
Jak długo będzie żył pacjent? Ile czasu wytrzyma bateria w telefonie? To przykładowe pytania związane z „analizą przeżycia”. Czym jest ta analiza i jak można wykorzystać język R?

How to Properly Test Your Data Models
Testowanie to jeden z elementów budowania oprogramowania. Także w przypadku budowy modeli danych

Ultimate Guide To Boosting Algorithms
O co chodzi z tymi algorytmami wzmacnianymi? Jak działa XGBoost, CatBoost, LightGBM i podobne

#analiza_danych_projekty

Power recommendations and search using an IMDb knowledge graph
Ta trzyczęściowa seria demonstruje, jak używać graficznych sieci neuronowych (GNN) i Amazon Neptune do generowania rekomendacji filmowych

#architektura

API release strategies with API Gateway
Jak podmienić w locie (bez przerwy) działający mikroserwis? Czyli coś o canary release oraz blue-green release

Breaking Big Applications into Small Applications
Złożoność nowoczesnego oprogramowania jest coraz większa. Jak sobie radzić ze zrozumieniem tych skomplikowanych układów i dlaczego tak właśnie jest?

#bazy_danych

Transactions in MongoDB
Przyjrzyjmy się, czym są transakcje w MongoDB i czym różnią się od transakcji SQL.

#big_data

Request-Response with REST/HTTP vs. Data Streaming with Apache Kafka
Kafka czy REST API? Który model w oddziaływaniu rozkaz-odpowiedź lepszy?

End-to-End ELT data engineering project with Beam, Spark, Kafka, Airflow, Docker and much more
Jak być może pamiętacie na Mundial zbudowaliśmy dashboard czerpiący na żywo dane z Twittera. Tutaj podobny przykład, ale z użyciem innych technologii

Using Kafka as a Temporary Data Store and Data-loss Prevention Tool in The Data Lake
Apache Kafka to nie tylko zwykła „rura” do przesyłania danych. To taka trochę mądrzejsza rura ;-)

#python

8 Tips for Creating Data Visualizations in Python using Bokeh
Znamy matplotlib, znamy plotly, ale jest też dość popularna biblioteka do robienia wykresów – Bokeh

How I almost failed to search a 37 GB text file in under 1 millisecond
Naprawdę szybkie przeszukiwanie naprawdę wielkich plików tekstowych

Effective Python Async like a PRO
Kilka typowych błędów podczas pisania asynchronicznego kodu w Pythonie. Jak ich unikać i jak zwiększyć wydajność kodu?

#środowisko_pracy

Best VS code extension for Data Engineer
Używasz VSCode? Te rozszerzenia mogą Ci się przydać w ułatwieniu pracy (Intellij takich nie ma ;-)

Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)