W listach pytacie o źródła wiedzy dotyczącej R. Dzisiaj kilka linków.
Na początek agregaty, które mogą okazać się wystarczające:
- R Bloggers – platforma zbierająca treści z wielu blogów
- Revolution Analytics
- Data Science Central – platforma blogowa dla dłubiących w BigData
Warto śledzić też blogi poszczególnych osób:
- Julia Silge to współautorka pakietu tidytext (i jednocześnie data scientist w Stack Overflow)
- Variance Explained – blog drugiego współautora tidytext
- blog Maëlle Salmon, który kiedyś dodałem do RSSów (trafiłem pewnie w poszukiwaniach czegoś konkretnego albo z r-bloggers)
Jednym z lepszych miejsc jest cała domena związana z RStudio i poszczególne jej subdomeny, przede wszystkim blog RStudio oraz RViews. W ramach RStudio znajdziecie też dużo informacji o poszczególnych pakietach – strona zbiorcza jest tutaj.
Z polskich blogów szczególnie polecam dwa:
- Szychta w danych Piotra Sobczyka z Wrocławia, blog ma też swojego fanpage’a na facebooku
- Smarter Poland Przemka Biecka. Przemek wydał kilka książek m.in. o R i jest popularyzatorem nauki oraz metod analizy i czytania danych. Oprócz tego bierze też udział przy pracach związanych z gromadzeniem danych o Polsce (na przykład pakiet sejmRP, którego używałem do przygotowania wpisu o naszym Sejmie). Do nauki R przyda się zerknąć na stronę Przemka
Dodatkowo polecam serwis BIQData ze stajni Agory oraz kilka grup na Reddit:
- r/BigData
- r/BigQuery
- r/DataIsBeautiful
- r/DataMining
- r/DataScience
- r/MachineLearning
- r/OpenData
- r/RProgramming
- r/RStats
- r/RStudio
- r/Statistics
- r/Visualization
Cały Reddit i BIQData to głównie źródła inspiracji dla kolejnych wpisów. Inspirujące mogą być też dane z GUSu.
Czytam też grupy na Facebooku:
Do nauki polecam kurs “Machine Learning A-Z™: Hands-On Python & R In Data Science” na Udemy.com który porządkuje (tak było w moim przypadku) wiedzę o różnych metodach machine learning z przykładami w R i Pythonie.
A do nauki samego R: zbiory przygotowane przez Hadleya Wickhama (twórca całej serii pakietów wchodzących w tidyverse): R for Data Science oraz Advanced R
Jak nauczyć się R?
- Przeczytać najpierw jedną książkę,
- później drugą
- i zrobić kurs.
Na wszystkie te czynności poświęcić 30% czasu. Resztę poświęcić na ćwiczenia.
Ha! Mała rzecz a cieszy, Helion zapowiedział tę drugą książkę na październik.
Ja od siebie dorzucę jeden kurs (płatny) który kiedyś przerabiałem: http://shop.oreilly.com/product/0636920034834.do
W przeciwieństwie do całej masy kursów gdzie przerabiane są kolejne funkcje, metody i techniki, tutaj jest sporo o czytaniu danych, wykresów i interpretacji wyników modeli. Szczerze polecam :)
Bardzo przydatny artykuł. Ja zacząłem naukę od videokursu R na Udemy, zrobionego przez Rafała Kraika (na Udemy występuje on jako Rafał Mobilo). Obecnie przerabiam dwie książki, polecane tu. Pierwsza z nich to „R for Data Science”. Chociaż tytuł jest mylący, bo książka nie powinna się nazywać „R for…” lecz „Tidyverse for Data Science”, bo z czystym R to ma raczej niewiele wspólnego. Druga to „Advanced R”, a po wstępnym przeglądnięciu jej stwierdzam, że tylko rozdział „Foundations” jest do przebrnięcia, bo reszta jest koszmarnie trudna.