炼数成金 门户 商业智能 查看内容

如何从Github上轻松安装R包

2016-6-16 16:31| 发布者: 炼数成金_小数| 查看: 27470| 评论: 0|来自: 雪晴网

摘要: 越来越多的R包正在由世界上不同的人所创建,其中一部分原因是devtools包使得开发R包1变得更加简单。devtools包不仅让开发R包变得简单,而且用于分发R包。当开发者发布一个R包的时候,CRAN2一般是最常用的。使用insta ...
1、综述
越来越多的R包正在由世界上不同的人所创建,其中一部分原因是devtools包使得开发R包1变得更加简单。devtools包不仅让开发R包变得简单,而且用于分发R包。

当开发者发布一个R包的时候,CRAN2一般是最常用的。使用install.packages()函数可以安装发布在CRAN上的R包。例如,如下方法可以安装dplyr包:
install.packages('dplyr')
devtools包的install_github()函数用于从Github上安装R包。
library(devtools)
install_github('hadlley/dplyr')
因此,开发者可以分发正在Github上开发的R包。此外,有些开发者并没有将自己开发的R包提至CRAN的意向。例如,Twitter,Inc在Github上提供的AnomalyDetection包。这时我们可以通过devtools包轻松的安装该R包:

library(devtools)
install_github("twitter/AnomalyDetection")
install.packages()和install_github()函数所需的参数是不同的。install.packages()只需包名即可,而install_github()需要提供Github的仓库名。这意味着当你想从Github上安装一个R包的时候你必须准确的记得它的仓库名称。

麻烦的是,我们往往很难记住Github的用户名。开发者在给R包命名的时候一般会考虑包的名称,以便用户方便记忆。然而,他们在给自己取一个Github用户名的时候可能就没那么小心了。例如,ggfortify是Github上的一个非常好的包。但它是由谁开发的呢?用户名是什么呢?答案是sinhrks4。我们似乎很难记住它。

githubinstall包提供了一种类似于install.packages()的方式,只需包名即可安装R包。
#install.packages('githubinstall') #已发布至CRAN
library(githubinstall)
githubinstall('AnomalyDetection')
Suggetion:
 - twitter/AnomalyDetection
Do you install the package? 

1: Yes (Install)
2: No (Cancel)
githubinstall()会从Github的仓库中搜索相应的R包,并询问你是否安装。
此外,如果你只是模糊的记得包名也可以安装成功,githubinstall包通过模糊的字符串会自动纠正包名。
githubinstall("AnomaryDetection")
githubinstall("AnomalyDetect")
githubinstall("anomaly-detection")

2、安装
从CRAN上安装githubinstall包
install.packages('githubinstall')
githubinstall包的源代码在Github上可见https://github.com/hoxo-m/githubinstall

3、详细资料
githubinstall包提供了若干有用的函数:
githubinstall 或者 gb_install_packages()
gh_suggest()
gh-suggest_username()
gh-list_packages()
gh_search_packages()
gh_show_source()
gh_update_package_list()
这些函数都有相同的前缀gh。githubinstall()是gh_install_packages()的别名。
在演示这些函数的用法之前,我们先加载下githubinstall包
library(githubinstall)

3.1 从Github上安装R包
给出包名即可,如果只是模糊的记得包名也没关系。
githubinstall("AnomalyDetection")
Suggestion:
 - twitter/AnomalyDetection
Do you install the package? 

1: Yes (Install)
2: No (Cancel)

Selection: 
输入"1",按回车即可开始安装R包。建议安装的R包是通过Github上的R包列表给出的。该列表由Gepuro Task Views提供。
如果有多个候选项,输入相应的数字即可。
githubinstall("cats")
Select one repository or, hit 0 to cancel. 

1: amurali2/cats      cats
2: danielwilhelm/cats No description or website provided.
3: hilaryparker/cats  An R package for cat-related functions #rcatladies
4: lolibear/cats      No description or website provided.
5: rafalszota/cats    No description or website provided.
6: tahir275/cats      ff

Selection: 

3.2 给出建议的仓库
githubinstall()会提示你安装建议的R包,但我们可能只想知道都有哪些建议。
gh_suggest()以向量的形式返回建议的仓库名。
gh_suggest("AnomalyDetection")
## [1] "twitter/AnomalyDetection"
gh_suggest("cats")
## [1] "amurali2/cats"       "danielwilhelm/cats"  "davidluizrusso/cats"
## [4] "hilaryparker/cats"   "lolibear/cats"       "rafalszota/cats"    
## [7] "tahir275/cats"
此外,如果你只是模糊的记得Github用户名的时候,gh-suggest_username()函数非常有用。
gh_suggest_username('hadly')
## [1] "hadley"
gh_suggest_username("yuhui")
## [1] "yihui"

3.3 列出R包
gh_list_packages()函数以数据框的形式返回Github上R包的仓库名列表。例如,你想知道谢大大(谢益辉,统计之都创始人)都开发了哪些R包,运行如下:
yihuiverse <- gh_list_packages(username = "yihui")
head(yihuiverse)

##  username package_name                                                                    title
## 1    yihui          MSG                            Modern Statistical Graphics (my Chinese book)
## 2    yihui   Rd2roxygen                                      Convert Rd to roxygen documentation
## 3    yihui    animation A gallery of animations in statistics and utilities to create animations
## 4    yihui     crandalf            Check all reverse dependencies of your R package on Travis CI
## 5    yihui      formatR                                              Format R Code Automatically
## 6    yihui          fun                                                            Use R for Fun
通过返回的结果,我们可以安装谢大大开发的所有R包。
repos <- with(yihuiyverse, paste(username, package_name, sep="/"))
githubinstall(repos) 

3.4 通过关键词搜索R包
gh_search_packages()函数返回Github上所有标题包含给定关键词的R包。例如,搜索所有包含lasso关键词的R包,运行如下:
gh_search_packages('lasso')

##           username     package_name                                  title
## 1  ChingChuan-Chen             milr  multiple-instance logistic regressi..
## 2       YaohuiZeng         biglasso  Big Lasso: Extending Lasso Model Fi..
## 3      huayingfang          CCLasso  CCLasso: Correlation Inference for ..
## 4         mlampros FeatureSelection  Feature Selection in R using glmnet..
## 5             pnnl        glmnetLRC  Lasso and Elastic-Net Logistic Regr..
## 6       statsmaths         genlasso  Path algorithm for generalized lass..
## 7       vincent-dk         logitsgl  Fit Logistic Regression with Multi-..
## 8       vincent-dk             lsgl  Linear Multiple Output Using Sparse..
## 9       vincent-dk             msgl  High Dimensional Multiclass Classif..
## 10      vstanislas             GGEE  R Package for the Group Lasso Gene-..
## 11          zdk123       BatchStARS  R package for Stability Approach to..
## 12          zdk123           pulsar  R package for Stability Approach to..

3.5 显示Github上给定R函数的源代码
gh_show_source()会在Github上查找指定R函数的源代码,并在默认浏览器中显示。
gh_show_source("mutate", "dplyr")
如果加载了该函数所属的R包,直接输入函数名即可。
library(dplyr)
gh_show_source(mutate)
该函数在Safari浏览器上可能有问题。

3.6 更新R包列表
githubinstall包通过Gepuro Task Views获取Github上的R包列表。Gepuro Task Views每天都会爬取Github并更新信息。不过,你可能一直以来都是通过R界面来更新R包。gh_update_list()更新R包的方法如下:
gh_update_package_list()

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754
3

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (3 人)

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2017-1-17 08:41 , Processed in 0.658147 second(s), 28 queries .