Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Skupiamy się w tym tygodniu na zagadnieniach związanych z budowaniem rozwiązań skonteneryzowanych. Mamy więc coś o Dockerze i pakowaniu do niego naszych aplikacji (napisanych w różnych językach, żeby było „dla każdego coś miłego”), coś (może nieco więcej niż „coś”) o Kubernetesie – bo to kolejny krok, a wydaje się to być nieco zakręcone. Do tego garść tricków i porad związanych z tymi zagadnieniami, chociażby o nieznanych (albo raczej: nie używanych) opcjach Gita. Ale to dla prawdziwych wyjadaczy.
Dla tych mniej zapoznanych z Gitem (o, to o mnie) – coś o sposobie pracowania nad kodem w różnych podejściach. Tak, to zdecydowanie dla mnie… same commity bez PR to nie jest najlepsze rozwiązanie :(
W ramach ciekawostek dwa bliźniacze teksty o robieniu notatek. Bo nie wszystko zmieści się w głowie. A notować tak, żeby był z tego pożytek to sztuka. Być może notujesz tak, że niczego nie tracisz, a może chcesz się tego dopiero nauczyć?
#ai_ml
Measuring size of objects in an image with OpenCV
Jak zmierzyć wielkość obiektu na zdjęciu? Czy ta rysa jest duża czy mała? Spoiler: mając obiekt do porównania nie jest to takie trudne…
#analiza_danych_projekty
Mastering Geospatial Data Analysis with GeoPandas
Pythonowy pakiet GeoPandas podany na tacy. Od podstawowych operacji typu wczytanie i pokazanie danych mapowych po bardziej zaawansowane problemy.
#bazy_danych
DuckDB database connections. Introducing multi-database support
Trino? Po co nam Trino jak mamy DuckDB!
#ciekawostki
Głos głosowi nierówny lub o podziale mandatów do Sejmu [PL]
Wybory powinny być równe, a więc głos każdego obywatela powinien mieć taką samą wagę. Jak to wyglądało dla wyborów parlamentarnych z 2023 roku? (tekst był opublikowany przed wyborami)
The ideal PR is 50 lines long
Jak obszerny powinien być pull request? Przebadano, sprawdzono, tutaj wyniki.
Zettelkasten – jak robić wartościowe notatki? [PL]
I co jest nie tak z tradycyjnymi metodami notowania.
Tworzenie notatek metodą Zettelkasten – jak zacząć? [PL]
Czym jest metoda Zettelkasten i dlaczego warto się z nią zapoznać, jeśli zależy wam na robieniu wartościowych, uporządkowanych i przydatnych notatek?
#data_engineering
Building a Smart City
Zbieramy różne dane „z miasta” i mielimy je w AWSie. Tak z grubsza. W tekście znajdziecie też link do ponad 2-godzinnego filmu autora pokazującego cały proces, razem z pisaniem kodu.
#devops
Czym jest Docker? I jak uruchomić model uczenia maszynowego w kontenerze? [PL]
Dowiedz się, czym jest Docker i jak wykorzystać go do uruchomienia modelu uczenia maszynowego (machine learning) w kontenerze.
Deploying a Java Web Application on Kubernetes Cluster
Proces zbudowania skonteneryzowanej aplikacji – środek serii, akurat poświęcony Kubernetesowi
10 Tips and Tricks to Optimize Your Dockerfile
W tym artykule omówiono zestaw porad i wskazówek, które pomogą Ci opanować sztukę optymalizacji plików Dockerfile.
Mastering Kubernetes for Machine Learning (ML / AI)
O wdrażaniu rozwiązań serwujących modele ML/AI (także te wymagające GPU) na środowiska Kubernetesowe
Popular git config options
Zapewne większość z nas w konfiguracji Gita ma tylko dwie opcje (user.name i user.email). A można mieć więcej i nawet może dać to korzyści
#llm_&_chatgpt
10 unexpected ways to use GitHub Copilot
GitHub Copilot to znane narzędzie wspomagające pisanie kodu, ale potrafi „trochę” więcej.
#management
From engineer to manager: what I love, what I hate
Dwa tygodnie temu pytaliśmy czy jak się zostaje dyrektorem IT to należy znać się na technologii? Dzisiaj opinia o tym, co jest fajnego w zostawaniu managerem a co nieco mniej
#programowanie_ogólnie
Strategie zarządzania kodem [PL]
Skuteczne zarządzanie kodem przy użyciu Gita. O GitFlow, GitHub Flow, Trunk Based Development. Czym różnią się te strategie i którą wybrać (w określonych warunkach).
#python
How to Write Clean Code in Python
Najważniejsze elementy czystego i przejrzystego kodu w Pythonie: czytelne nazwy zmiennych, komentarze i dokumentacja funkcji oraz klas i ich metod. Przypomnienie i szerokie omówienie.
Python Abstract Classes and Interfaces
Dużo w ostatnich wydaniach newslettera było o obiektowym podejściu do programowania w Pythonie, dzisiaj dokładniej o mniejszym wycinku tegoż – o klasach abstrakcyjnych i interfejsach. Zatem: co to @abstractmethod?
Pydantic is a Game-Changer
Szybkie wprowadzenie do Pydantic – biblioteki rozszerzającej pojęcie data-klas, wzbogacające je między innymi w walidację danych. Pydantic często używany jest w ramach projektów opartych o FastAPI i staje się coraz bardziej popularny. Nieco gratis – pod koniec tekstu znajdziecie link do porównania Pydantic z dataclasses.
Building an Investment Portfolio Management App
Jeśli inwestujesz na giełdzie (chociaż nie tylko – klocki Lego też są spoko) to zapewne śledzisz wartość swojego portfela. Tutaj autor pokazuje jak zorganizował to sobie w Pythonie, dodatkowo prezentując kilka wskaźników, które mogą być przydatne
Python libraries take the Billion Row Challenge
Miliard rekordów, miliard wierszy z danymi. Która z bibliotek poradzi sobie najlepiej?
#r
How to Make Your Shiny Apps Secured
Zabezpiecz swoje aplikacje R Shiny za pomocą najlepszych praktyk w zakresie uwierzytelniania, zapytań SQL, interfejsu użytkownika, obsługi błędów i danych wejściowych użytkownika.
Deploying Shiny Apps using Docker
15 minut na YT o tym jak dockeryzować aplikacje napisane w R Shiny.
#wizualizacja_danych
What to consider when creating small multiple line charts
Kiedy używać małych wykresów wieloliniowych (w porównaniu ze zwykłymi wykresami liniowymi) i jak tworzyć lepsze. O powtarzających się liniach, niezależnych skalach, sortowaniu, kolorach i nie tylko.
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)
:)