分类: 生物信息

SWIRL——在R里面学习R和统计学

Introdction

之前因为课题需要学了门统计的课,本来以为是门应用型的课程(课程名本来是叫Statistics for bioscience)结果老师各种在黑板上推大式子,各种建模,让我这种练Basic Statistics都没系统学过的人听着一头雾水。最近下狠心要把这块短板补起来,于是各种看帖子找教材,总算找到了套比较适合没什么统计基础但是又需要面对一些简单统计学分析的学习方法。有一点很重要,就像在统计之都读到一篇胡江堂写到的文章,初学者很容易陷入工具选择的误区。R?SAS?SPSS? 其实对于初学者来说,这些工具没有什么区别,把基础打牢才是正经事儿。

因为本人之前在Coursera上学过一门JOHNS HOPKINS大学的入门课程Computing for Data Analysis,所以决定通过R来学习统计。

Coursera的统计学系列课程

JOHNS HOPKINS大学在Cousera上开了一系列的统计课程,并且循环开课,所以英语还算过关的人可以考虑跟着学一下。

Johns Hopkins University Data Science

 

SWIRL

重点要介绍下SWIRL,这是一个开源项目,其目的在于在R里面学习R和统计学,如果会使用R和RStudio的话很快就能上手,具体信息来自官网SWIRL

Step1 Get R

Step2 Get RStudio

Step3 Install swirl

Step4 Start swirl

Step5 Install an interactive course

Step6 Have fun!

目前里面的课程还很有限,只有这么几门:

Beginner

  • R Programming
  • Data Analysis
  • Mathematical Biostatistics Boot Camp
  • Open Intro

Intermediate

  • Regression Model

Advanced

  • Coming Soon!

我刚刚把Beginner的课程全部学完,期待更多课程上线。

Learning Statistics with R

然后再推荐一本教材,《Learning Statistics with R》,打开连接可以免费下载PDF版本,这本书是The University of ADELAIDE心理系的教授Danial Navarro写的,目的就是为了方便非统计学背景的学生通过R语言学习统计。

在这本书里几乎没有晦涩难懂的公式,作者通过在R里通过实例让读者了解大式子背后的思考方式。