Przejdź do treści

Newsletter Dane i Analizy, 2022-03-21

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Podoba nie rozpieszcza, nie ma czasu na pisanie. Mam nadzieję, że znajdziecie czas na czytanie :)


#analiza_danych_projekty

End-to-End Hotel Booking Cancellation Machine Learning Model
Czy gość przyjedzie do naszego pokoju hotelowego czy nie przyjedzie? Jak buduje się modele, które potrafią odpowiedzieć na takie pytania? Znajomity tutorial

#big_data

A Spark Streaming pipeline with microservices
Spark, Kafka i uczenie maszynowe w tle – takie projekty lubimy!

Querying Kafka Topics Using Presto
A gdyby tak pytać topików kafkowych tak jak bazę danych?

#ciekawostki

Top 13 data engineer interview questions (and tips)
Jeśli by ktoś chciał wiedzieć o co pytają na rozmowach o pracę na stanowiskach związanych z danymi i ich przetwarzaniem to tutaj może być wskazówka

#deep_learning

Uncertainty in Deep Learning
Człowiek potrafi powiedzieć „nie wiem” albo – co bardziej zasadne w kontekście tego artykułu – „nie mam pewności”. A czy sztuczna inteligencja potrafi?

#devops

Model Deployment Strategies
Jak wdrażać modele ML?

#programowanie_ogólnie

Parsing JSON in command-line with jq: basic filters and functions
Co prawda to komenda shella, ale gdzie ją przypiąć? Bardzo użyteczna komenda (i czasem o wiele szybsza niż np. przetwarzanie w pythonie) do obsługi plików JSON

#python_junior

Optimisation good practice
Szybszy, a na pewno ładniejszy kod w Pythonie? Kilka hintów

#python_mid

Hidden powers of pydantic
Pydantic to rozwinięcie @dataclass, chociażby o walidację. Większy i cięższy to kombajn, ale może warto?

Extending Python’s JSON Encoder
A wiecie, że można w Pythonie napisać swój własny enkoder zapisujący JSONy?

Poetry, A Better Version of Python Pipenv
Lepsza wersja środowisk wirtualnych

NEVER grow a DataFrame
Powiększanie data frame w pandas – robisz do źle!
Wciągamy dane, rekord po rekordzie. Na koniec chcemy mieć data frame w pandas.
Jak budować taką „ramkę” efektywnie? df.append (będzie deprecated za chwilę) czy df.concat? A może inaczej?

Best Practices For Kafka in Python
Jak zacząć z Kafką w Pythonie?

How to make most of your python debugger in VSCode?
Jak używać debuggera w VSCode i przestać wpisyuwać print-y w kod? ;-)

#python_senior

How to Manage Exceptions When Waiting On Multiple Asyncio Tasks
Obsługa wyjątków w asyncio

Multithreaded HTTP requests in Python
Pobieranie danych z internetu to nie jest raczej obciążający procesor proces. Można więc pobierać równolegle – jak to ogarnąć w Pythonie?

How we optimized Python API server code 100x
Optymalizacja API napisanego w Pythonie (też asyncio tu sobie działa)

#r

Dual axis charts – how to make them and why they can be useful
Working with dual axis charts in ggplot2, with custom legends using manual scales and ggtext. Pareto charts, in particular, are a valid use of this technique.


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *