Cotygodniowa dawka linków, czyli archiwum newslettera Dane i Analizy
Łączyłem kiedyś accesssowe VBA z R – da się, nawet spoko działa. A było to tak, że Access wypluwał dane do CSV – chyba za pośrednictwem Excela, nie pamiętam – potem R to mieliło i robiło wykres, który wstawiany był jako obrazek do raportu opartego na szablonie zrobionym w… VBA piszącym do Excela. Jak to cudo odziedziczyłem to przepisałem na Shiny produkujące PDFa z RMarkdowna i potrzebujący sobie sami te raporty robili, a nie czekali aż ja ręcznie te accessowe cuda odpalę (i zablokuję sobie komputer, bo przecież „raporty się generują”). O tym jak łączyć Excela z R czy Pythonem przeczytacie dzisiaj.
Znajdziesz dzisiaj też kilka tekstów związanych z prezentowaniem danych oraz co nie co o szeregach czasowych.
Już jutro, wygodnie ze swojego domu lub biura, a w dodatku za darmo możesz w pełni bezpłatnie uczestniczyć w największym cyfrowym wydarzeniu poświęconym Python w Polsce
Pytech Summit 2022 (online) to największa polska konferencja poświęcona Pythonowi, a skierowana jest do pasjonatów tego języka z profilu mid i senior.
Co będzie? To co lubicie w ramach czterech ścieżek tematycznych:
web backend machine learning big data
Rejestracja na stronie pytechsummit.pl, a Dane i Analizy to patron medialny.
#analiza_danych_koncepcje
Survival Analysis: A Brief Introduction
Jakie jest prawdopodobieństwo że sprzęt się zepsuje po 5 latach pracy? Albo że ktoś dożyje wieku 80 lat? Do badania takich rzeczy służy analiza przeżycia, a tutaj wprowadzenie (przy użyciu Pythona)
Extract knowledge from text
Jak wyciągnąć wiedzę z tekstu? Praktyczne przykłady na wykorzystanie spaCy do zadań NLP
A new tool for explainable AI
Wyjaśnienia dlaczego model dał takie a nie inne wyniki (Explainable AI, XAI) to isotne zagadnienie. Tutaj nowe narzędzie do tego celu
#analiza_danych_projekty
Call Python and R Scripts From Excel
Do obrabiania danych Python czy R często są lepsze niż Excel. Albo często w Excelu nie ma gotowych narzędzi do jakichś tam obliczeń. Może więc z Excela wywołać skrypty R/Python?
A simple route optimization using BigQuery
Problem komiwojażera w nowoczesnym wydaniu – w jakiej kolejności odwiedzać klientów? BigQuery przychodzi z pomocą
Optimizing Facebook-Prophet fit method to run 20X faster
Facebookowa biblioteka Prophet świetnie radzi sobie z szeregami czasowymi. A gdyby jeszcze było szybciej?
#bazy_danych
How to use MongoDB with Graphical IDEs
MongoDB też ma narzędzia do wygodnego przeglądania danych zawartych w bazach i kolekcjach, a też do zarządzania tymi bazami i kolekcjami
#big_data
Learn Stream Processing With Kafka Streams
Wprowadzenie do Kafka Streams – jak wykonać proste operacje bezpośrednio na strumieniu danych „płynącym” Kafką?
Apache Spark Discretized Streams (DStreams) with PySpark
Tutaj zaś streaming ale w Sparku
How we built our Lakeless Data Warehouse
Budowanie data lake czy też hurtowni danych – co może się przytrafić? (lessons learned)
#ciekawostki
Don’t do these DATA SCIENCE Mistakes
Planujesz albo zaczynasz pracę jako data scientist? Przeczytaj koniecznie!
#management
How to Measure the ROI of Your Data Team?
Płacimy tym zespołom analityków czy inżynierów danych, ale jaki to daje zwrot? Czy to się opłaca?
A Framework for Embedding Decision Intelligence into your Organization
Droga do data driven, droga do data mesh – na obu mamy coś o podobne zagadnienia, a ten tekst też takowe porusza
#python_junior
12 useful Pandas scripts for financial time series
Kilka „przydasiów” do analizy szeregów czasowych w Pandas, szczególnie jeśli to są finansowe szeregi (np. kursy walut lub akcji)
#python_mid
PyScript – Run Python With HTML
Hit ostatniego tygodnia – Python uruchamiany jak JavaScript w kodzie strony HTML
Reloadium
Ciekawy plugin dla piszących w Pythonie – właściwie debugger w trakcie pisania kodu
Testing feature logic, transformations, and feature pipelines with pytest
Testowanie nie tylko funkcji czy klas, ale też cech w zestawach danych (ficzersów w datasetach – nazwijmy to po imieniu)
#r
Analyze your Twitter timeline with {rtweet} and {lubridate}
Analiza timeline’u twitterowego w R. A tak naprawdę to o parsowaniu dat przy pomocy pakietu lubridate
Input Validation for Shiny Apps
Walidacja wprowadzanych w różnych inputach danych w aplikacjach Shiny – przydatny pakiet
#wizualizacja_danych
Goodbye Scatterplot, Welcome Binned Scatterplot
Jeśli nie scatterplot (wykres punktowy, X-Y) to co?
Simple Yet Stunning and Meaningful Geospatial Visualization Using Happiness and Conflict data
Jak pokazać dane na mapie w Pythonie? W praktyce użyte zostają pakiety Geopandas, Plotly oraz Folium
Python Libraries for Mesh, Point Cloud, and Data Visualization
Wizualizacje 3D, wykresy, animacje… Szaleństwo. Jest też druga część tego szaleństwa
Zestawienie linków przygotowuje automat, wybacz więc wszelkie dziwactwa ;-)