Pipeline w SciKit Learn
Co to są pipelines w sci-kit learn i jak je wykorzystać? Czyli bardziej efektywne szukanie najlepszego modelu.
Co to są pipelines w sci-kit learn i jak je wykorzystać? Czyli bardziej efektywne szukanie najlepszego modelu.
Wiele razy czytałem opinie, że Python jest szybszy a R nie nadaje się na produkcję. Ale to opinie nie potwierdzone badaniami. Tutaj pierwsze badania na ten temat!
Dowiedz się więcej »Które API szybsze – w Pythonie czy w R?Dzisiaj zajmiemy się wykorzystaniem Sparka i Hadoopa do przetwarzania większej ilości danych. Oraz do budowania prostego modelu (regresji liniowej). Może jeszcze nie jest to big data, ale mechanizmy są identyczne jak w przypadku większej liczby danych. Wystarczy tylko tych danych więcej zgromadzić, zbudować większe środowisko (dużo serwerów) i… też będzie działało.
A w dodatku poznamy pakiet faker który pozwoli nam na wygenerowanie sztucznych danych.
Dowiedz się więcej »(py)Spark, Hadoop i HDFS – podstawyKażdego dnia pojawia się nowa muzyka, w wielu różnych gatunkach. Jak wybrać to, czemu warto poświęcić czas?
Dodatkowo dowiemy się jakie znaczenie ma uczciwe przygotowanie danych.
Dowiedz się więcej »Muzyka i data scienceJakiś czas temu pokazywałem jak w prosty sposób narysować mapę w R. Dzisiaj powtórzymy zadanie dla Pythona.
Dowiedz się więcej »Mapy w PythonieCzy da się automatycznie rozdzielić film na poszczególne ujęcia?
Dowiedz się więcej »Montaż filmowy w Pythonie?Jak nauczyć się analizy danych? Robiąc małe i duże projekty.
Dowiedz się więcej »Analiza własnych finansów