当前位置:百问十四>生活百科>该如何学习 R 语言?

该如何学习 R 语言?

2024-07-09 03:10:34 编辑:join 浏览量:560

该如何学习 R 语言?

今年年初开始接触R语言,自学兼修课,学了一个学期,暑期在某上市互联网公司找了一份纯粹用R语言工作的的数据分析实习,现在应该可以说熟练掌握R语言了。我的学习路径如下:

一.公开课推荐 。

公开课首推 http:// coursera.Org 上约翰.霍普金大学的数据科学系列课程。该系列完全使用R作为分析工具,轻松引领你从R的初学者转变为R的开发者。

二.技术博客和书籍推荐

三.社区帮助

l R自带的帮助文档;

l R Journal: Welcome. The R Journal ,对研究某个包非常有帮助;

l 一个神奇的网站: http:// Stackoverflow.com ,牛人聚集,99.9%的R问题都可以在上面找到你想要的答案;

l Stat.stackexchange.com;

l R Mailing List: https:// stat.ethz.ch/mailman/li stinfo/r-help;

l Talk Stats: Statistics Help @ Talk Stats Forum ;

l Google,善用英文搜索;

四.小伙伴

找到一个志同道合的同学一块学习,一块在coursera上刷Assignments,互相帮助检查代码,互相督促看书敲实例代码进度,比较容易坚持下去,在此,感谢 hetal链 。

五.实践实践实践

我在学校选修了两门R数据分析相关的课程,并且给老师做研究助理,用R完成老师布置的编程任务,学以致用,非常高效率。暑期的时候找了一份数据分析实习,实践两个月,对代码的规范化和可重用性的重要性有了更深刻的理解。

即使对一个经验丰富的程序员,R语言也有很多坑,比如应该尽快熟悉apply系列函数,避免使用循环;在数据操作上有很多函数可以简洁快速地帮你完成任务,可是你不知道他们的存在。多看高人的代码,与同学交流是一个很好的办法,循序渐进、循序渐进、循序渐进。

推荐几门网络公开课程:

R的基础编程,R Programming, Johns Hopkins University

R与统计基础,Data Analysis and Statistical Inference, Duke University

R与数据分析,The Data Scientist’s Toolbox, Johns Hopkins University

多看课程的论坛,多学习好的编程风格。可以加入R for Data Analysis Q群62343169

首先R是一种专业性很强的统计语言,如果想学得快一些的话,基本的统计学知识要懂,不然很多东西会掌握的比较慢。

掌握基本语法和操作,推荐国内的已经翻译的比如《R语言实战》《R语言编程艺术》,这个过程中最好结合一些小例子来做一些分析的东西。如果需要可视化的话,强烈不推荐学习R本身的作图系统,实在是太不友好了.....还是用ggplot2吧。

掌握了上面的,就可以深入一些了,如果是做数据分析和可视化,推荐《ggplot2:数据分析与图形艺术》,这个才是作图的神器啊.....如果是空间分析相关的,推荐《Applied Spatial Data Analysis with R》,这个如果可以的话看英文版,而且要有地学的一些知识背景,中文版翻译的太次了,尽量不要看。数据挖掘机器学习之类的,可以看看比如《数据挖掘与R语言》、《机器学习——实用案例解析》,不过我觉得这几本书没上面的那几本好,但是可以大概看看是咋回事,最好还是看看专门的相关书籍,熟悉各种算法和流程,到时候搜索R的package,照着文档和例子搞定,不是特别难。

最后,强烈推荐R-bloggers,统计之都以及谢益辉、肖凯、刘思喆等人的博客(自行Google以及到上面的网站找链接),订阅一下,会很有帮助,RStudio是个很棒的IDE,用起来很爽,功能很强大。

前几天去新疆培训,制作了R语言的基础教程,在翻阅资料时,看到了 芝士回答张敬信 关于R学习的观点,很是赞同。

张敬信老师写了一本书 《R语言编程--基于tidyverse》 ,网址: https:// github.com/zhjx19/intro R

下面几段是书中的话:

看来下面两个包需要填坑了:

tidyverse包提供了全套的解决方案,结合其它常用的包,用起来得心应手。

电子书还是推荐html的格式,方便copy代码重演结果,如果是英文版的还方便翻译(网页翻译)查看。这里推荐几本书,学习R语言,就应该看最好的教程,学最先进的思想,而不是看陈腐的资料,学过时的方法!!!

第一本: 《数据科学中的R语言》 https:// bookdown.org/wangminjie /R4DS/

「书的特点:」

这本书本来就是研究生的教材,作者王敏杰老师,是四川师范大学的老师,书中内容十分丰富,分享了许多技巧。我也在不断的操作--实践--理解中。

第二本: 《R语言编程--基于tidyverse》 : https:// github.com/zhjx19/intro R/blob/master/pdfs/R%E8%AF%AD%E8%A8%80%E7%BC%96%E7%A8%8B%EF%BC%9A%E5%9F%BA%E4%BA%8Etidyverse_%E8%87%B3%E7%AC%AC3%E7%AB%A0.pdf

「书的特点:」

作者张敬信老师,是哈尔滨商业大学的老师,书中将编程和数学思想进行对比,很有启发性。本书还没有完成,现在释放了一部分章节,但是很值得阅读。

第三本: 《R语言进阶笔记》 : https:// dengfei2013.gitee.io/r- language-advanced/

「书的特点:」

这本书是我的学习笔记,我在学习tidyverse相关函数时,基于自己的理解,用农业中常用的数据结构进行了操作学习,内容比较浅,后面我也会不断更新,欢迎大家阅读。

第四本:北京大学李东风老师的 《R语言教程》 ,内容很丰富。 https://www. math.pku.edu.cn/teacher s/lidf/docs/Rbook/html/_Rbook/index.html

第五本: 《R for Data Science》 : https:// r4ds.had.co.nz/

这本书也是Tidyverse,ggplot2,dplyr作者 Hadley Wickham 所写的书。建议大家看英文版,里面的语法都是最新的,更新也是最快的。可以用网页翻译作为辅助阅读,阅读体验很好。

很多知识都是毕业后出现的,所以工作中学习新知识是一个常态,能把项目和学习结合起来是学习效率最高的。

当然,把新知识迅速利用到工作中,是很有成就感的。

活到老,学到老。

長話短說的話,還是一如既往的 Learning by doing。

我個人的幾點心得:

1. 帶著實際問題邊寫邊學比就著一本入門書、把書上的例子自己實現一遍要有幫助的多。不過後者是初學者必然要歷經的關鍵步。

2. 善用包。而且,更好的習慣不是學會找到有你需要功能的包,而是花時間認真讀這個包的說明文檔,看看它的每一個函數都是幹嘛的,用到些什麼係數,都有什麼統計意義,到底是不是適用於你手上待解決的情況。尤其不能搜到一個包就急著把數據代入運行而不知道自己是在做什麼。

3. 善用 http:// rseek.org 和 http:// stackoverflow.com 。

标签:语言,学习

版权声明:文章由 百问十四 整理收集,来源于互联网或者用户投稿,如有侵权,请联系我们,我们会立即处理。如转载请保留本文链接:https://www.baiwen14.com/life/185118.html
热门文章