Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Po raz drugi Dane i Analizy są patronem medialnym CuValley Hack. To też druga edycja tego hackathonu, który organizowany jest przez #KGHM w ramach programu #DolinaMiedziowa.
Impreza startuje 11 marca.
Hackathon zrzesza otwarte umysły i pomysłowych specjalistów, którzy chcą tworzyć innowacyjne projekty dla polskiej miedzi. Uczestnicy skupią się na analizie danych oraz wykorzystaniu #AI, #MachineLearning czy #BigData w układach automatyki przemysłowej. Co Was czeka?
3 zadania, w których do wygrania wysokie nagrody pieniężne 40 godzin kodowania i networking na kanale Slack tysiące dostępnych danych webinary, Keynote Speakerzy, porządna dawka wiedzy i inspiracji!
CuValley Hack chce stworzyć rozwiązania, które usprawnią funkcjonowanie procesów i maszyn w polskiej Dolinie Miedziowej.
Łączna pula nagród podczas #CuValleyHack wynosi 120 000 PLN!
Zarejestruj się za darmo już dziś! -> https://eventory.cc/event/cu-valley-hack-2022/tickets
Szczegóły na stronie internetowej -> https://cuvalley.com
#AI_ML
Deep Learning vs Machine Learning for Regression
Czy sztuczna inteligencja (czyli sieci neuronowe) nadają się do problemów typu regresja?
2 Beautiful Ways to Visualize PCA
Jak pokazać wynik redukcji wymiarów metodą PCA? A przy okazji jak wykorzystać PCA w przygotowaniu modelu
Visually understand XGBoost, LightGBM and CatBoost Regularization Parameters
Jak dobrać parametry do modeli? Co one oznaczają i na czym polegają?
#analiza_danych_koncepcje
Time Series Forecasting with LightGBM
Tak na prawdę chodzi o odpowiedni dobór cech (albo ich wytwarzanie)
How to Perform Feature Engineering From Text Data
Czyszczenie tekstu i wydobywanie niekoniecznie oczywistych cech
Increasing Accuracy of Sentiment Classification using Negation Handling
Prosty algorytm zwiększający dokładność klasyfikacji „nastrojów” , stworzony z myślą o projektach przemysłowych wymagających szybkiego czasu realizacji
#analiza_danych_projekty
How to download and explore movie data
Dane o filmach są fajne do eksploracji. Korzystając z TMDB API i Pythona spróbujmy przewidzieć wygranych w tegorocznych Oscarach
Advanced exploratory data analysis (EDA) with Python
Jeśli działasz w analizie danych przed każdym zadaniem zapewne robisz EDA żeby poznać swoje dane. Ten tekst pokazuje większość podstawowych kierunków działania
KNN Algorithm for Classification and Regression
Algorytm KNN rozpykany w całości. Po co, jak go używać, jak dobierać wartość k
#bazy_danych
SQL Query Optimization
Sposoby na przyspieszenie zapytan SQL
#ciekawostki
5 Data Science Trends in the Next 5 Years
W jakiś kierunkach podąży nauka o danych i zadania z tym związane?
#deep_learning
O co chodzi z sieciami GAN?
Intuicyjne wytłumaczenie jak działają sieci typu GAN. A zrozumienie zasady działania ułatwia przygotowanie własnych rozwiązań
#programowanie_ogólnie
Domain Events
Większość osób, które zaczynają korzystać z projektowania opartego na domenie (DDD) utka na tym. Świetna seria trzech (linki do kolejnych części w treści) tekstów
Application Events
O co chodzi? Pokrótce o to, aby w jednym miejscu zdefiniować zachodzące w systemie zdarzenia i umożliwić ich obsługę z poziomu różnych, niezwiązanych ze sobą modułów, które nie muszą nawet wiedzieć o swoim istnieniu. Czytaj jako rozwinięcie „Domain Events” wspomnianych wyżej
Apache Airflow for Data Science
Airflow to popularne narzędzie do inżynierii danych. Jak napisać w nim swój pierwszy proces?
How to Write Documentation in Python
Kod jest częściej czytany niż pisany, więc zróbmy tak, aby czytelnikowi było łatwiej
#python_mid
Six Tricks You Should Know About Python Dictionary
Słowniki w Pythonie to potężna rzecz (serio, a dodatkowo wprost przenoszą się na np. pliki JSON), więc warto poznać trochę sztuczek i często wykorzystywanych operacji
7 Useful Examples of itertools
Słowniki są przydatne, a równie przydatny jest pakiet itertools
How to Automate Excel Formatting with Python
Robisz biznesowi excelowe raporty w Pythonie? Biznes lubi jak jest ładnie, więc to może się przydać
#wizualizacja_danych
33 techniki wizualizacji danych
Dane są wszędzie, tabelki są nieczytelne, lepiej działają obrazki (tutaj wykresy)
10 ways to use fewer colors in your data visualizations
Jak zrobić tak, żeby używać mniej kolorów na wykresach i nawet zwiększyć ich czytelność? Świetny tekst ze świetnego bloga
Creating beautiful stand-alone interactive D3 charts
Biblioteka D3 daje ładne wyniki jeśli chodzi o prezentację danych. Jak jej użyć w połączeniu z Pythonem?
Animating viral spread in Python
Czy w Pythonie z użyciem matplotlibda się przygotować prezentację danych na animowanych GIFach? Da się
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)