Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Świat działa w realtime i tylko to się liczy – dlatego data scientiści też powinni na takie działanie się przygotować, a dobry tekst wprowadzający znajdziecie niżej.
No a jak Ci się znudził Excel plus Access wspomagane VBA (wg mnie to jest zmora korporacji – blokuje kreatywność i spowalnia rozwój) to dowiedz się gdzie kierować się dalej. Dla developerów z backendowym zacięciem też coś się znajdzie.
Dla tych co siedzą głęboko w modelach: połączenie Boruty z wartościami Shapleya do selekcji ważnych cech dla modeli – sprytne, ciekawe.
#AI_ML
Is Your Model the Best One or the Luckiest One?
Twój model ML czy nawet AI, jaki on jest? Najlepszy czy tylko najszczęśliwszy? Tak – próbka testowa czy walidacyjna może być mniej lub bardziej szczęśliwa
#analiza_danych_koncepcje
Is this the Best Feature Selection Algorithm “BorutaShap”?
Boruta to algorytm na wyszukiwanie najbardziej znaczących cech, które „najbardziej się przydają” modelom. Wartości Shapleya służą do tego samego. Zatem dlaczego nie połączyć obu podejść?
#analiza_danych_projekty
Monitoring Weather with Prefect ETL
Kibana jako miejsce obserwowania pogody. No bo dlaczego nie? A jakże to pouczające doświadczenie robić samodzielnie coś co empirycznie można sprawdzić! Serio serio – wiemy z doświadczenia
#big_data
Introduction to streaming for data scientists
Uczenie maszynowe w cyklach (batchowe, w paczkach) przestaje wystarczać. Obecnie żadne 15-minutowe mikro-batche nie są wystarczające. Świat działa w realtime i tylko to się liczy. Co to znaczy dla analityków czy ogólnie data scientistów?
Request-Response with REST/HTTP vs. Data Streaming with Apache Kafka
RESTem czy Kafką? Czy to w ogóle jest wybór jedno czy drugie? A może oba? Architekci rozwiązań i analitycy systemowi – to dla Was!
#ciekawostki
Evolving to Problem Solving?
A jak już jestem tym programistą, inżynierem danych, data scientistą, analitykiem dłubiącym w Excelu i piszącym w VBA – co jak mam się rozwijać? Co robić, żeby nie stanąć w miejscu (w rozwoju ale też w obliczu codziennych zadań)?
Backend Developer Roadmap
Chcesz się rozwijać jako developer w obszarze backendu? Może to roadmapa dla Ciebie?
#management
Communicating Data Science Insights to Non-Technical Teams
Opowiadanie laikom o zagadnieniach ML czy AI nie jest łatwe. Należy unikać zrozumienia na poziomie „sztuczna inteligencja wszystko zrobi za nas”
The universe of “Data Science” roles demystified
Kto jest kim w tym „data science”-owym, „big data”-owym świecie? Albo: jeśli nie wiesz jakie stanowiska co robią to masz słownik
4 Principles to Guide Data Team Leaders
Jak budować wydajne zespoły zajmujące się danymi?
#python
Python-Pandas cheat sheet
30 „przydasiów” pandasowych dla adeptów przerzucania danych w Pythonie
Solar panel power generation analysis
Abstrahując od danych – dobry tutorial jak pokazywać dane i przygotować proste EDA
Choose the Right Python Concurrency API
Przetwarzanie wielu zadań na raz w Pythonie – są na to co najmniej trzy sposoby. Jak wybrać ten właściwy?
#r
5 ways to instantly improve your R data visualizations
Przyciągnij uwagę odbiorców Twoich wykresów słupkowych nieco je modyfikując. W R, w ggplot2, dla średniozaawansowanych
#wizualizacja_danych
3 Must Know Data Visualization Principles
Wyróżniki na wykresach – nie wszystko musi być opisane, nie wszystko musi być dokładne, często mniej elementów przekazuje lepiej to samo
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)