Przejdź do treści

Newsletter Dane i Analizy, 2021-12-06

Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy

Na Mikołajki przegląd internetu pod kątem danych, ich analiz i sposobów programowania oraz wdrażania zaprogramowanych rozwiązań.
Najciekawszym dla początkujących będzie pewnie zbiór ponad 200 tekstów zgromadzonych w jednym miejscu na różne tematy związane z machine learingiem (to prawdę mówiąc trochę jak spis treści jednego bloga), a bardziej doświadczeni dowiedzą się jak połączyć C++ z Pythonem. Są też ciekawe teksty o R (i Shiny), co się ostatnio dość rzadko zdarzało.

Skoro jesteśmy przy R – w piątek (10 grudnia) zaś konferencja WhyR? – rezerwujcie sobie czas, bo materiału sporo (co widać po zaplanowanych streamingach na YouTube). Więcej szczegółów na stronie imprezy 2021.whyr.pl


#analiza_danych_koncepcje

XGBoost vs LightGBM: How Are They Different
Dwa najpopularniejsze algorytmy wykorzystywane (i wygrywające) w konkursach Kaggle. Czym się różnią?

#architektura

Intro to Microservices Communication [With the Use of Apache Kafka]
Idea mikroserwisów – po co i jak je budować w oparciu o Kafkę?

#ciekawostki

Blockchain Explained in 50 Lines of Code
Blockchain, blockchain, ale o co chodzi? Jeśli ktoś woli czytać kod z opisem jak coś działa to powinien być zadowolony tym tekstem. Przynajmniej na ogólnym poziomie.

Uczenie maszynowe na produkcji. Dlaczego to takie trudne?
Porównanie utrzymywania na produkcji uczenia maszynowego z tradycyjnym oprogramowaniem

#deep_learning

Ship detection on Sentinel-2 images with Mask R-CNN model
Konkretny problem, wykorzystanie sieci, ale nie w TensorFlow jak w większości przykładów a użyciem PyTorch.

#devops

Deploying Deep Learning Models with Model Server
Jak wdrażać na produkcję wytwory data scientistów?

#python_junior

Introduction to Clustering in PyCaret
Podział danych na grupy w całkiem zgrabnym tutorialu wykorzystującym pakiet PyCaret, który jest swoistym opakowaniem dla modeli ML.

#python_mid

270+ Machine Learning Projects with Python
Paczka (paka wręcz) linków do różnorodnych projektów ML. Jak to w takich przypadkach jakość może być różna.

Complete Guide to Perform Classification of Tweets with SpaCy
Do projektów NLP osobiście wybieram SpaCy. Zobaczcie jak w praktyce wykorzystać ten pakiet.

#python_senior

Calling C++ code from Python with ctypes module
Python jest wolny? To napisz kawałek kodu na przykład w C/C++. Tylko jak to potem połączyć z Pythonem? Tu znajdziesz przykład.

#r

The 7 R Packages You Should Be Using for Data Visualisation
Poznanie tych siedmiu pakietów (a nawet 3-4 z nich) na dobrym poziomie powinno załatwić sprawę wizualizacji danych w R.

Combining Spotify and R — An Interactive Rshiny App + Spotify Dashboard Tutorial
Dane ze Spotify są wdzięczne i fajnie się na nich ćwiczy. Znamy muzykę której słuchamy więc widzimy czy wychodzi sensownie to co robimy w kodzie.

#spark

6 recommendations for optimizing a Spark job
Jak optymalizować sparkowe obliczenia? Sześć cennych rad.

#sql

Navigating Time Series With SQL
Po co Python czy R jak można od razu „na bazie”?

#wizualizacja_danych

How to Extract and Visualize YouTube Data in Tableau Using Google Sheets and Apps Script
Obszerny materiał, który pokazuje jak wykorzystać gotowe elementy do robienia dość powtarzalnych rzeczy (zwykle różne są tylko pojedyncze elementy: wizualizacje, źródła danych albo przetwarzanie danych w locie)


Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *