Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
#analiza_danych_projekty
Mastering Exploratory Data Analysis (EDA)
Usystematyzowane podejście do analizy danych, której celem jest odkrycie istotnych dla przyszłych modeli cech. Za każdym razem robi się to podobnie, więc – warto znać zasady.
Improving Generalization in Survival Models
Analiza przeżycia jako sposób na predykcję odejść pracowników.
#architektura
So You Want to Build An Event Driven System?
Jak zbudować system sterowany zdarzeniami? Jakie są korzyści z przyjęcia tego stylu architektury, jakie są wyzwania i niektóre kompromisy? Nagranie z konferencji [YouTube, 52 minuty, po angielsku]
Event modelling anti-patterns explained
Prezentacja z Kafka Summit 2024 o tym jak nie robić event source’ingu
#devops
Ultimate Docker Server
Zestaw poradników dotyczących konfiguracji małego środowiska testowego, przeznaczonego do własnego użytku, które jest w pełni obsługiwane przez Dockera. Link prowadzi do pierwszego artykułu w serii.
How I improved our CI build time from 24mins to 8mins and reduced costs by 50%
Jeśli czas oczekiwania na zbudowanie obrazu w procesach CI/CD jest dla Ciebie zbyt długi – może tutaj znajdziesz sposób na jego skrócenie?
#java
Masa darmowych materiałów z Java developmentu
Trzy grupy tematów: Kafka, Hibernate i testy. Doświadczony programista pewnie nie skorzysta, ale uczący się Javy już pewnie tak.
Spring Data REST
Wiele razy widzieliście teksty jak szybko napisać REST API w Pythonie. Dzisiaj czas na Javę i Spring.
Apache Kafka GroupId vs ConsumerId vs ClientId
Nieco dokładniej o IDkach grup i konsumentów w klientach Kafki i ich konfiguracji w Javie.
#management
Strategies to optimize remote work
Większość z nas pracuje zapewne z domu. A to zapewne oznacza, że zmagamy się z różnorodnymi problemami związanymi z motywacją do pracy, skupieniem się na zadaniach, licznymi rozpraszaczami. Autor dzieli się swoimi sposobami na optymalizację pracy zdalnej.
Does Your Company Have a Data Strategy?
Macierz 4×4 pokazująca jak budować strategię dla danych w organizacji. Cztery obszary, cztery poziomu rozwoju i 16 propozycji „co dalej?”.
#programowanie_ogólnie
Hello world
Co się dzieje „do spodu” kiedy napiszesz prosty program „Hello world” w C? Dla nerdów :)
#python
Python List Comprehension Is Not Just Syntactic Sugar
Pythonic-style w przypadku pętli for i list comprehension to nie tylko elegancja kodu!
Serving Data using FastAPI with Google BigQuery
Prosty REST odpytujący BigQuery – dwa w jednym
A FastAPI API-key authentication example
Jak napisać API zabezpieczone kluczem w FastAPI?
SQLAlchemy: The BEST SQL Database Library in Python
Arjan opowiada o SQLAlchemy i dwóch podejściach tej biblioteki do komunikacji z relacyjnymi bazami danych. Jak to u Arjana – wszystko jest poparte kodem i synergią różnych elementów Pythona [YouTube, 16 minut, po angielsku]
Mathematically optimize label positions in scatter plots
Opisy dodane na wykresie ułatwiają jego zrozumienie – na przykład „labelki” przy punktach. Ale jeśli punktów jest sporo i labelki zaczynają się na siebie nakładać? Jak sobie w takiej sytuacji poradzić?
#r
A LaTeX and R Markdown Tutorial
Wprowadzenie do tworzenia dokumentów w Markdown (plus matematyczne równania w LaTex). Za „silnik” renderujący podano tutaj RStudio z pakietem RMarkdown (z tego powodu tekst ten widzisz w sekcji R), ale równie dobrze można to zastąpić przez dowolny edytor i renderowanie np. za pomocą Pandoc (tylko trzeba doczytać w innym miejscu)
#spark
Feature Engineering with PySpark
Szybkie wprowadzenie do PySparka z myślą o wykorzystaniu Pythonowego kodu w MS Fabric (tekst jest częścią serii)
#sql
10 podchwytliwych pytań rekrutacyjnych
Rozmowa rekrutacyjna SQL może przebiegać na wiele sposobów, ale zawsze czeka Cię sprawdzenie wiedzy technicznej poprzez pytania o SQL. Na tym filmie znajdziesz 10 przykładów [YouTube, 15 minut, po polsku].
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)