绘图导航
  • 基础绘图
  • 高级绘图
  • 微生物
  • 转录组

R笔记|R包下载命令及自带数据集

 二维码 10

R笔记



R包

R数据集


R包

【安装包】

#指令下载R安装包

install.packages("packge-name")

#通过以下步骤安装

点击右下方页面窗口中的“packages”--“install”进行安装,输入所要安装的R包名,默认从官网上下载

#对于版本不合适的使用bioconductor安装

if (!requireNamespace("BiocManager", quietly = TRUE))    install.packages("BiocManager")BiocManager::install("")

#本地安装,将下载好的包放入library目录下,并将其名称改为R可识别的名称,如ggcor_master

#安装devtoolsinstall.packages("devtools")#安装ggcordevtools::install_local("D:/R/R-4.0.5/library/ggcor_master.zip")

【卸载包】

detach('package:包名', unload = TRUE)

【R自带的默认加载包】

查看默认加载的包 getOption("defaultPackages")

base

基本语言函数:包括算术运算,I/O,编程支持等

datasets

提供数据集

stats

用于统计计算和随机生成的函数,包括常用的统计检验、概率分布和建模分析

graphics

绘图函数

grDevices

支持basegrid绘图的绘图设备

methods

S4中引入的标准方法和类的实现

utils

一些列使用功能,包管理、文件读写和编辑


查看已加载的所有R包的清单(.packages(all.available = T))


【R其他自带的包(不限于此,在此列举几个)】

boot

自动重复抽样

class

分类算法

cluster

聚类算法

compiler

R编辑器

codetools

分析R代码的工具

foreign

读取StataSASSPSS等数据格式的文件

grid

绘图工具

KemSmooth

Kemel平滑函数

lattice

栅格图

MASS

一些统计函数方法

mgcv

广义可加模型和广义可加混合模型

tools

开发R包的工具


【加载包】

library()

R自带的数据集

【概念】

数据集通常是由数据构成一个矩形数组,行表示观测,列表是变量。

R储存数据的结构:标量、向量、数据、数据框和列表。

R数据类型:数值型、字符型、逻辑型、复数型、原生型(字节)。


【datasets包自带数据集】

向量

euro    #欧元汇率,长度为11,每个元素都有命名

landmasses    #48个陆地的面积,每个都有命名

precip    #长度为70的命名向量

rivers    #北美141条河流长度

state.abb    #美国50个州的双字母缩写

state.area    #美国50个州的面积

state.name    #美国50个州的全称


因子

state.division    #美国50个州的分类,9个类别

state.region    #美国50个州的地理分类


矩阵、数组

euro.cross    #11种货币的汇率矩阵

freeny.x    #每个季度影响收入四个因素的记录

state.x77    #美国50个州的八个指标

USPersonalExpenditure    #5个年份在5个消费方向的数据

VADeaths    #1940年弗吉尼亚州死亡率(每千人)

volcano    #某火山区的地理信息(10米×10米的网格)

WorldPhones    #8个区域在7个年份的电话总数

iris3    #3种鸢尾花形态数据

Titanic    #泰坦尼克乘员统计

UCBAdmissions    #伯克利分校1973年院系、录取和性别的频数

crimtab    #3000个男性罪犯左手中指长度和身高关系

HairEyeColor    #592人头发颜色、眼睛颜色和性别的频数

occupationalStatus    #英国男性父子职业联系


类矩阵

eurodist    #欧洲12个城市的距离矩阵,只有下三角部分

Harman23.cor    #305个女孩八个形态指标的相关系数矩阵

Harman74.cor    #145个儿童24个心理指标的相关系数矩阵


数据框

airquality    #纽约19735-9月每日空气质量

anscombe    #四组x-y数据,虽有相似的统计量,但实际数据差别较大

attenu    #多个观测站对加利福尼亚23次地震的观测数据

attitude    #30个部门在七个方面的调查结果,调查结果是同一部门35个职员赞成的百分比

beaver1    #一只海狸每10分钟的体温数据,共114条数据

beaver2    #另一只海狸每10分钟的体温数据,共100条数据

BOD    #随水质的提高,生化反应对氧的需求(mg/l)随时间(天)的变化cars    #1920年代汽车速度对刹车距离的影响

chickwts    #不同饮食种类对小鸡生长速度的影响

esoph    #法国的一个食管癌病例对照研究

faithful    #一个间歇泉的爆发时间和持续时间

Formaldehyde    #两种方法测定甲醛浓度时分光光度计的读数

Freeny     #每季度收入和其他四因素的记录

dating from     #配对的病例对照数据,用于条件logistic回归

InsectSprays     #使用不同杀虫剂时昆虫数目

iris    #3种鸢尾花形态数据

LifeCycleSavings    #50个国家的存款率

longley    #强共线性的宏观经济数据

morley    #光速测量试验数据

mtcars    #32辆汽车在11个指标上的数据

OrchardSprays     #使用拉丁方设计研究不同喷雾剂对蜜蜂的影响

PlantGrowth     #三种处理方式对植物产量的影响

pressure     #温度和气压

Puromycin     #两种细胞中辅因子浓度对酶促反应的影响

quakes     #1000次地震观测数据(震级>4

randu     #VMS1.5中使用FORTRAN中的RANDU三个一组生成随机数字,共400组。     #该随机数字有问题。在VMS2.0以上版本已修复。

rock     #48块石头的形态数据

sleep     #两药物的催眠效果

stackloss     #化工厂将氨转为硝酸的数据

swiss     #瑞士生育率和社会经济指标

ToothGrowth     #VC剂量和摄入方式对豚鼠牙齿的影响

trees    #树木形态指标

USArrests    #美国50个州的四个犯罪率指标

USJudgeRatings    #43名律师的12个评价指标

warpbreaks    #织布机异常数据

women    #15名女性的身高和体重


列表

state.center    #美国50个州中心的经度和纬度


类数据框

ChickWeight    #饮食对鸡生长的影响

CO2    #耐寒植物CO2摄取的差异

DNase    #若干次试验中,DNase浓度和光密度的关系

Indometh    #某药物的药物动力学数据

Loblolly    #火炬松的高度、年龄和种源

Orange    #桔子树生长数据

Theoph    #茶碱药动学数据


时间序列数据

airmiles    #美国1937-1960年客运里程营收(实际售出机位乘以飞行哩数)AirPassengers    #Box & Jenkins航空公司1949-1960年每月国际航线乘客数

austres    #澳大利亚1971-1994每季度人口数(以千为单位)

BJsales    #有关销售的一个时间序列

BJsales.lead    #前一指标的先行指标(leading indicator

co2    #1959-1997年每月大气co2浓度(ppm

discoveries    #1860-1959年每年巨大发现或发明的个数

ldeaths    #1974-1979年英国每月支气管炎、肺气肿和哮喘的死亡率

fdeaths    #前述死亡率的女性部分

mdeaths    #前述死亡率的男性部分

freeny.y    #每季度收入

JohnsonJohnson    #1960-1980年每季度

Johnson & Johnson股票的红利

LakeHuron    #1875-1972年某一湖泊水位的记录

lh     #黄体生成素水平,10分钟测量一次

lynx    #1821-1934年加拿大猞猁数据

nhtemp     #1912-1971年每年平均温度

Nile     #1871-1970尼罗河流量

nottem     #1920-1939每月大气温度

presidents     #1945-1974年每季度美国总统支持率

UKDriverDeaths     #1969-1984年每月英国司机死亡或严重伤害的数目sunspot.month     #1749-1997每月太阳黑子数

sunspot.year     #1700-1988每年太阳黑子数

sunspots    #1749-1983每月太阳黑子数

treering    #归一化的树木年轮数据

UKgas    #1960-1986每月英国天然气消耗

USAccDeaths    #1973-1978美国每月意外死亡人数

uspop    #17901970美国每十年一次的人口总数(百万为单位)

WWWusage    #每分钟网络连接数

Seatbelts     #多变量时间序列。和UKDriverDeaths时间段相同,反映更多因素。

EuStockMarkets    #多变量时间序列。欧洲股市四个主要指标的每个工作日记录,共1860条记录。


(原文链接:http://blog.sina.com.cn/s/blog_959d22480101krqo.html



查看某个特定的数据集

print(data(package='package名'))#先查看这个package有哪些数据集?数据集                           #继而查看某个特定的数据集


END



分享到:
推荐使用谷歌浏览器点击下载