Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Święta, święta i po świętach. Nawet newsletter opóźniony specjalnie o jeden dzień, żebyście mogli w pełni od komputerów odpocząć :)
W ostatnim w 2022 roku numerze trochę mniej tekstów, ale to nie znaczy że są one słabszej jakości. Spora część dzisiejszego tortu to technologie big data, ale jest też coś o Pythonie i kilka ciekawostek ogólnych.
Najbardziej chyba polecam zestawienie w zmianie liczby ludności w i wokół polskich miast – książkowe wręcz przykłady suburbanizacji. Dobre jest też wyjaśnienie algorytmów boostingowych.
Ostatni raz w tym roku mam dla Was rabat 15% na Karty Data Science.
Karty Data Science to zestaw, który pozwoli Ci uporządkować wiedzę z zakresu data science czy też machine learning. Co prawda na prezent świąteczny już za późno, ale może do powtórki przed sesją zimową?
#analiza_danych_koncepcje
What Is Survival Analysis?
Jak długo będzie żył pacjent? Ile czasu wytrzyma bateria w telefonie? To przykładowe pytania związane z „analizą przeżycia”. Czym jest ta analiza i jak można wykorzystać język R?
How to Properly Test Your Data Models
Testowanie to jeden z elementów budowania oprogramowania. Także w przypadku budowy modeli danych
Ultimate Guide To Boosting Algorithms
O co chodzi z tymi algorytmami wzmacnianymi? Jak działa XGBoost, CatBoost, LightGBM i podobne
#analiza_danych_projekty
Power recommendations and search using an IMDb knowledge graph
Ta trzyczęściowa seria demonstruje, jak używać graficznych sieci neuronowych (GNN) i Amazon Neptune do generowania rekomendacji filmowych
#architektura
API release strategies with API Gateway
Jak podmienić w locie (bez przerwy) działający mikroserwis? Czyli coś o canary release oraz blue-green release
Breaking Big Applications into Small Applications
Złożoność nowoczesnego oprogramowania jest coraz większa. Jak sobie radzić ze zrozumieniem tych skomplikowanych układów i dlaczego tak właśnie jest?
#bazy_danych
Transactions in MongoDB
Przyjrzyjmy się, czym są transakcje w MongoDB i czym różnią się od transakcji SQL.
#big_data
Request-Response with REST/HTTP vs. Data Streaming with Apache Kafka
Kafka czy REST API? Który model w oddziaływaniu rozkaz-odpowiedź lepszy?
End-to-End ELT data engineering project with Beam, Spark, Kafka, Airflow, Docker and much more
Jak być może pamiętacie na Mundial zbudowaliśmy dashboard czerpiący na żywo dane z Twittera. Tutaj podobny przykład, ale z użyciem innych technologii
Using Kafka as a Temporary Data Store and Data-loss Prevention Tool in The Data Lake
Apache Kafka to nie tylko zwykła „rura” do przesyłania danych. To taka trochę mądrzejsza rura ;-)
#python
8 Tips for Creating Data Visualizations in Python using Bokeh
Znamy matplotlib, znamy plotly, ale jest też dość popularna biblioteka do robienia wykresów – Bokeh
How I almost failed to search a 37 GB text file in under 1 millisecond
Naprawdę szybkie przeszukiwanie naprawdę wielkich plików tekstowych
Effective Python Async like a PRO
Kilka typowych błędów podczas pisania asynchronicznego kodu w Pythonie. Jak ich unikać i jak zwiększyć wydajność kodu?
#środowisko_pracy
Best VS code extension for Data Engineer
Używasz VSCode? Te rozszerzenia mogą Ci się przydać w ułatwieniu pracy (Intellij takich nie ma ;-)
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)