Newsletter Dane i Analizy, 2022-05-30

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Znacie metodę „getting things done”? Jest taka książka Davida Allena opowiadająca dokładnie co i jak. Ale kto by czytał całą książkę, jeśli jest wersja skrócona? Polecam. Jeśli wolicie książkę to w Helionie jest promocja na e-booka.

Polecam dzisiaj trochę oglądania – praktyczne wykorzystaniu narzędzi ML w banku w prezentacji XGBoost w praktyce oraz DDD w systemach rozproszonych. Cała reszta materiałów równie znakomita :)

#analiza_danych_koncepcje

5 Ways to Use Histograms
Sposoby na użycie histogramów… z perspektywy machine learningu

Audio analysis with Librosa
Zajmujesz się analizą dźwięku albo szerzej nieco – przetwarzaniem sygnałów? Ta biblioteka może Ci się przydać. Może się też przydać w innych zastosowaniach, chociażby w rozpoznawaniu mowy albo klasyfikacji głosów ptaków przez sieć CNN (dźwięk na obraz ze spektogramem, a potem klasyfikacja obrazu jak na zbiorze mnist)

#analiza_danych_projekty

XGBoost w praktyce – modelowanie procesów windykacyjnych
W trakcie tej prezentacji Wojciech Skwirz pokazuje jak w PKO BP praktycznie wykorzystane są modele klasy XGBoost w optymalizacji działania call-centre w jednostce windykacyjnej.
ML coraz częściej wykorzystywany jest w modelowaniu ryzyka kredytowego. Ze względu na regulacje prawne, modele stosowane w tym obszarze muszą spełniać rygorystyczne wymogi. W porównaniu do procesu akceptacyjnego, proces windykacyjny jest znacznie mniej uregulowany, ale jego optymalizacja może nieść dla banku równie duże oszczędności. Modelowanie wczesnej windykacji jest zatem świetną okazją do rozwoju metod boostingowych wykorzystywanych w banku.

#architektura

Simple Backend Architecture for Social Product
O projektowaniu architektury rozwiązań gotowych na „kolejną generację”

#bazy_danych

SQL vs NoSQL
Wstęp do serii artykułów SQL vs NoSQL. Mity, opis baz klucz-wartość, dokumentowych, grafowych i rodziny kolumn.

#big_data

Top Apache Spark Use Cases
Do czego można użyć Apache Spark? Oraz do czego raczej nie

Spark Tips. Partition Tuning
Coś o partycjonowaniu danych w Sparku. Ale w środku znajdziecie też linki do innych tekstów o optymalizacji działania narzędzi korzystających ze Sparka

#devops

12 Linux Commands Worth Remembering for Log File Operations
Kilka „przydasiów” konsolowych dla każdego

#management

11 Parts of a Great Pull Request
Jak przygotować PR żeby wszystkim pracowało się wygodniej i przyjemniej?

#programowanie_ogólnie

100+ Data Science And Machine Learning Cheat Sheets
Cała masa ściągawek na tematy wszelakie, w różnych językach programowania, do różnych zastosowań. Jak to mówią – dla każdego coś miłego

Design Principles
Wzorce projektowe powodują, że programowanie trzyma się pewnych reguł a kod jest łatwiejszy do re-użycia oraz poszczególne moduły są ze sobą luźniej związane

#python_junior

A Simple Guide to String Formatting in Python Using f-strings
Formatowanie stringów w Python nigdy nie było tak proste jak z użyciem f-stringów. Nie znasz? Oj, to koniecznie poczytaj!

Extract Text from Image using Python
Biblioteki pillow i pytesseract w praktycznym zastosowaniu

#python_mid

Automating Notepad and Excel applications in Python
Jak zautomatyzować korzystanie z aplikacji Windows na przykładzie Notatnika i Excela

Build a URL Shortener With FastAPI and Python
Dobra szkoła Pythona – własny skracacz linków. Jest konfiguracja, jest komunikacja z bazą, jest API

#r

8 Cool dplyr functions to learn
Ostatnio było o funkcjach które „robią robotę” w 80% przypadków użycia pythonowego Pandas – dzisiaj odpowiednich dla dplyr i R

How to Connect Google Earth Engine with R Shiny
Tutorial dla chcących wykorzystać Google Earth w swoich aplikacjach Shiny

Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)