Przejdź do treści

Newsletter Dane i Analizy, 2025-02-17

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Mam nadzieję, że Walentynki były udane? ;-) Może szukasz spóźnionego prezentu dla początkującego programisty (albo dla siebie) – mój nowy e-book o Pythonie (pobieranie danych z API, współpraca z bazą danych, aplikacja we Flasku), który zadebiutował właśnie 14 lutego, może być strzałem w dziesiątkę. Więcej informacji na stronie książki.

W tym tygodniu mam dla Ciebie solidną dawkę wiedzy z różnych obszarów analizy danych i programowania – jak zwykle zresztą. Szczególnie warto zwrócić uwagę na materiały dotyczące uczenia maszynowego – od budowy własnej biblioteki deep learning po praktyczną optymalizację modelu wykrywania oszustw. Dla osób zainteresowanych LLM, a w szczególności Transformerami – jest przystępne wyjaśnienie ich działania.

Programistom Pythona polecam świetny zbiór materiałów o współbieżności i architekturze potoków danych. Nie zabrakło też praktycznych narzędzi – sprawdź szczególnie artykuł o wykorzystaniu UV do instalacji aplikacji CLI w Pythonie oraz porady dotyczące zarządzania połączeniami z bazą danych w FastAPI.

W zeszłym tygodniu najchętniej czytaliście:

Skąd są twoi znajomi?, uwaga – jest dalszy ciąg: Międzyregionalni znajomi, a raczej gdzie kto wyjechał na studia lub za pracą 7 trendów, które powinien znać analityk danych w 2025 roku 100 Common Python Mistakes


#ai_ml

How I Built a Deep Learning Library from Scratch Using Only Python, NumPy & Math
Choć istnieje wiele świetnych bibliotek ML (jak Tensorflow czy PyTorch), czasem warto zbudować coś od podstaw. Ten artykuł pokazuje, jak zrozumieć sieci neuronowe poprzez samodzielną implementację.

Creating Custom Layers and Loss Functions in PyTorch
Przyjrzyjmy się podstawom tworzenia i integrowania niestandardowych warstw i funkcji strat w PyTorch, ilustrowanym fragmentami kodu i praktycznymi spostrzeżeniami.

#analiza_danych_projekty

From 93% to 96% Accuracy: How I Optimized Credit Card Fraud Detection
Praktyczny przypadek wykrywania oszustw kartami kredytowymi. Zobacz, jak autor zwiększył dokładność modelu z 93% do 96% dzięki zaawansowanej inżynierii cech i optymalizacji.

#architektura

7 Common Mistakes in Architecture Diagrams
Tworząc diagram architektury technicznej, celem jest przekazanie zrozumienia odbiorcom. Błędy popełniane podczas tworzenia diagramów mogą jednak podważyć ten cel. Oto siedem typowych błędów, których należy unikać podczas tworzenia diagramów architektury technicznej.

#devops

19 Cron Jobs for DevOps Engineers
Przyjrzyjmy się 19 zadaniom cron, które mają na celu zautomatyzowanie pracy. Nie jest to rocket-science, ale może Cię zainspiruje?

#llm_&_chatgpt

Explaining Transformers as Simple as Possible through a Small Language Model
Przystępne wprowadzenie do architektury Transformer poprzez budowę prostego modelu językowego. Idealne dla osób, które chcą wreszcie zrozumieć, jak działają te popularne modele.

#programowanie_ogólnie

Jak przygotować DOBRY pull request?
Dobry pull request to szybsze review, mniej poprawek i sprawne mergowanie. Sprawdź, jak pisać PR-y, które oszczędzają czas Twój i zespołu!

Automating Code Reviews with GenAI in Bitbucket Pipelines
Idąc za ciosem – automatyzacja code review i kolejnych PR. Ten post omawia Bitbucket ChatGPT Code Review i Qodo Merge (PR-Agent) – dwa narzędzia oparte na sztucznej inteligencji do automatycznych przeglądów kodu w Bitbucket Pipelines.

#python

Using uv to build and install Python CLI apps
Ten praktyczny samouczek pokazuje, jak używać UV do tworzenia i instalowania niestandardowych aplikacji Python CLI w systemie.

Managing Database Connections in FastAPI: Best Practices
Podczas tworzenia interfejsów API za pomocą FastAPI zarządzanie bazą danych jest kluczowym elementem. Efektywne zarządzanie połączeniami z bazą danych zapewnia, że Twoja aplikacja jest solidna, skalowalna i unika typowych pułapek

Python Concurrent Topics
Kompleksowy przewodnik po współbieżności w Pythonie. Znajdziesz tu praktyczne tutoriale dotyczące wątków, przetwarzania wieloprocesorowego i asyncio.

Should Python Data Pipelines be Function based or Object-Oriented (OOP)?
Praktyczne porównanie podejścia funkcyjnego i obiektowego w budowie potoków danych. Dowiedz się, jak łączyć oba paradygmaty, aby tworzyć kod, który jest łatwy w utrzymaniu i debugowaniu.

#r

Analiza aglomeracyjna paczkomatów InPost w Warszawie
Celem projektu jest przeprowadzenie analizy przestrzennej paczkomatów InPost na terenie Warszawy oraz odpowiedzenie na następujące pytanie badawcze: czy rozmieszczenie paczkomatów InPost w Warszawie wykazuje istotne skupiska, czy są one jednak równomiernie rozproszone? A z naszego punktu widzenia – dużo ciekawej wiedzy z zakresu języka R.

Setting up VScode for R and Cline
Wiadomo, że VScode to najlepszy edytor kodu. A czy można go użyć do pisania w języku R? Można. Zobacz jak skonfigurować VSCode dla R!

#wizualizacja_danych

How to Analyze Survey Data?
Dane z ankiet – liczby mówią, co ludzie myślą, albo przynajmniej co są skłonni przyznać. Ale bądźmy szczerzy, analiza danych z ankiet może przypominać wpatrywanie się w czarną dziurę. Tuta dowiesz się o tym, jak wyniki ankiet pokazać atrakcyjnie.


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *