绘图导航
  • 基础绘图
  • 高级绘图
  • 微生物
  • 转录组
操作说明
PCA
分享到:
PCA
操作说明

a)登录TUTU云平台(https://www.cloudtutu.com/#/login)点此登录;

b)默认账号密码已填好,输入验证码登录即可;

c)找到“PCA”进入作图界面;

1.说明

主成分分析算法(PCA)是最常用的线性降维方法,它的目标是通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大(方差最大),以此使用较少的数据维度,同时保留住较多的原数据点的特性。

PCA降维的目的,就是为了在尽量保证“信息量不丢失”的情况下,对原始特征进行降维,也就是尽可能将原始特征往具有最大投影信息量的维度上进行投影。将原特征投影到这些维度上,使降维后信息量损失最小。

2.上传文件

a)准备一个数据矩阵(如微生物物种丰度表、基因表达量矩阵、代谢物含量表,也可以是测量数据,例如身高、体重、表型等);

b)表格需要带表头和列名,每一列为样本名,每一行为各种指标数据名,例如OTU,基因ID、身高、代谢物名称等。

c)重要:请提交txt(制表符分隔)文本文件。操作方法为:全选excel中的所有内容(ctrl+A),复制到记事本中,将记事本文件另存后上传该文件。

3 参数设置

3.1方法选择:

(1)hellinger,hellinger转化,就是总和标准化数据的平方根(default MARGIN=1),hellinger转化后的数据使用欧氏距离函数计算将得到hellinger距离矩阵。

(2)normalize,模标准化,将数据除以每行或者每列的平方和的平方根(default MARGIN=1),模标准化后每行、列的平方和为1(向量的模为1),也即在笛卡尔坐标系中到原点的欧氏距离为1,样品分布在一个圆弧上,彼此之间的距离为弦长,因此也称为弦转化。在基于欧氏距离的PCA、RDA中分析群落数据可以将每个样方弦转化可以弥补欧氏距离的缺陷。弦转化后的数据使用欧氏距离函数计算将得到弦距离矩阵。

(3)standardize,z-score标准化,最常用的标准化方法之一,将数据减去均值比上标准差(default MARGIN=2),z-score标准化后数据均值为0,方差为1,服从正态总体的数据标准化后服从标准正态分布。z-score标准化可以去除不同环境因子量纲的影响。

(4)total,总和标准化,将数据除以该行或者列的总和,也即求相对丰度(default MARGIN=1),总和标准化后数据全部位于0到1之间。

(5)max,最大值标准化,将数据除以该行或者列的最大值(defaultMARGIN=2)。若数据非负,最大值标准化后数据全部位于0到1之间。

(6)freq,数据矩阵除以行或列的最大值,并乘以非零值的个数

(7)range,Min-max标准化,将数据减去该行或者列的最小值,并比上最大值与最小值之差(defaultMARGIN=2),Min-max标准化后的数据全部位于0到1之间。

(8)pa, 将数据转换为有-无(1-0)类型,若分析不加权的情况群结构下可以使用。

(9)chi.square",卡方转化,在默认(defaultMARGIN=1)的情况下是数据除以行的和再除以列的和的平方根,卡方转化后的数据使用欧氏距离函数计算将得到卡方距离矩阵。

(10)log, 将数据(样本观察值)取自然对数(或者其他数为底的对数),可以使用log()函数来实现(log1p()可以将数据加1后取自然对数)。若是数据中有0或负值,可以全部数据加上一个数转换为正数。一般来说自然对数转换可以使0~1范围内的数据范围变大,可以使>1范围内数据范围变紧凑。

3.2横/纵坐标字体大小:根据需求酌情选择。

3.3元素大小:图中代表样品的图表的大小。

3.4是否添加椭圆:

椭圆一:按照正常计算方式得到分组椭圆(有些结果可能加不上分组椭圆)

            椭圆二:强行添加分组椭圆。

否:不添加分组椭圆



3.5椭圆的粗细:调节椭圆边界线条的宽度

3.6 是否显示标签:是否在元素旁边显示样品名称。

3.7 分组信息:整个页面的右下角(图片的下方)

需要对所有样品进行分组,本网站支持在线修改分组名称和样品名称的功能。

3.8 筛选显示种类:根据自己的需要,可以选择需要用的样品进行作图。



4.下载文件

根据个人需求进行参数调整后点击运行,平台提供PDF和PNG格式的文件下载。同时,还可以下载相关性系数矩阵表。相关性系数矩阵可用于后续其他分析。


5. 作图后处理

TUTU云平台提供的是PDF格式的矢量图,可通过矢量图处理软件进行编辑和调整(如:文字字体,文字大小,图片分辨率等)。图形处理软件和使用方法可扫描文后的二维码添加小编获取。


6. 写作建议

Spearman/Pearson correlation by xxx abundance. Only significant values (p < 0.05/0.01 after FDR adjustment) are shown. Orange and blue colors (替换颜色) represent significant negative correlations and positive correlations. Darker color represents stronger correlations

小编微信.png                                          QQ群.png

扫码添加小编,请备注工作单位和姓名                              欢迎加入生物信息QQ交流群,进群请备注工作单位和姓名




推荐使用谷歌浏览器点击下载