当前位置:文档之家› R核度估计和多元统计

R核度估计和多元统计

R的核密度估计和多元统计R核密度估计KDE 密度估计函数density默认情况下在512个点上估计密度值这些估计点可能有些会分布在原始数据的左侧所以要查看原始数据后的密度图形我们需要从这些估值点选取比原始数据大的数据点。

libraryEcdat dataEarningspackageEcdat ind Earningsageg1 x Earningsyind/1000 f densityxn1000 froot densitysqrtxn1000 ind2 frootx sqrtminx 选取比原始数据大的数据点plotfxfytypelylimc0.035xlimc0100 ylabDensityyxlabyincome in 1000lwd2 ablineh0 f2 .5frooty / frootx linesfrootxind22f2ind2typel ylimc0.035xlimc0100ylabDensityyxlabyincome in 1000 mainTKDElty2lwd2 ablineh0legend60.03cKDETKDEltyc12lwd2 残差的获得R 如果模型拟合可以直接返回残差省事了直接用否则我们可以使用residuals模型拟合结果databmwpackageevir bmwas.vectorbmw nlengthbmw fitAR1 arimabmw order c10 0 acf fitAR1residualslag.max20 main acf residualsfitAR1lag.max20 main 两者结果一致R语言多元统计包简介:各种假设检验统计方法聚类分析数据处理/统计分析生物信息sas matlab R语言Multivariate Statistics 多元统计网址/web/views/Multivariate.html 转/Rbbs/posts/list/223.page 基本的R包已经实现了传统多元统计的很多功能然而CRNA的许多其它包提供了更深入的多元统计方法下面做个简要的综述。

多元统计的特殊应用在CRNA的其它任务列表task view里也会提及如排序ordination会在Environmetrics/web/views/Environmetri cs.html里说到有监督的分类方法能在MachineLearning/web/views/MachineLe arning.html里找到无监督的分类在Cluster/web/views/Cluster.html里。

这里要综述的包主要分为以下几个部分 1 多元数据可视化Visualising multivariate data 绘图方法基本画图函数如pairs、coplot和lattice包里的画图函数xyplot、splom可以画成对列表的二维散点图3维密度图。

car包里的scatterplot.matrix函数提供更强大的二维散点图的画法。

cwhmisc包集合里的cwhplot包的pltSplomT函数类似pair 画散点图矩阵而且可以在对角位置画柱状图或密度估计图。

除此之外scatterplot3d包可画3维的散点图aplpack包里bagplot可画二变量的boxplotspin3R可画可旋转的三维点图。

misc3d包有可视化密度的函数。

YaleToolkit包提供许多多元数据可视化技术agsemisc也是这样。

更特殊的多元图包括aplpack包里的faces可画Chernoff’s faceMASS包里的parcoord可画平行坐标图矩阵的每一行画一条线横轴表示矩阵的每列graphics包里的stars可画多元数据的星状图矩阵的每一行用一个星状图表示。

ade4包里的mstree和vegan包里的spantree可画最小生成树。

calibrate包支持双变量图和散点图chplot包可画convex hull图。

geometry包提供了和qhull 库的接口由convexhulln可给出相应点的索引。

ellipse包可画椭圆也可以用plotcorr可视化相关矩阵。

denpro包为多元可视化提供水平集树形结构level set trees。

graphics包里的mosaicplot和vcd包里的mosaic函数画马赛克图mosaic plot。

gclus包提供了针对聚类的散点图和平行坐标图。

rggobi包和DescribeDisplay包是GGobi的接口DescribeDisplay的图可达到出版质量的要求xgobi包是XGobi和XGvis的接口可实现动态交互的图。

最后iplots包提供强大的动态交互图尤其是平行坐标图和马赛克图。

seriation包提供seriation方法能重新排列矩阵和系统树。

数据预处理AIS 包提供多元数据的初步描述函数。

Hmisc包里的summarize和summary.formula 辅助描述数据varclus函数可做聚类而dataRep和find.matches 找给定数据集的典型数据和匹配数据。

KnnFinder包里的nn 函数用kd-tree找相似变量的个数。

dprep包为分类提供数据预处理和可视化函数如检查变量冗余性、标准化。

base包里的dist和cluster包里的daisy函数提供距离计算函数proxy 包提供更多的距离测度包括矩阵间的距离。

simba包处理已有数据和缺失数据包括相似性矩阵和重整形。

2 假设检验Hypothesis testing ICSNP包提供霍特林HotellingsT2检验和许多非参检验方法包括基于marginal ranks的位置检验location test计算空间中值和符号形状估计。

cramer包做两样本的非参检验SpatialNP可做空间符号和秩检验。

3 多元分布Multivariate distributions 描述统计Descriptive measures stats 包里的cov和and cor分别估计协方差和相关系数。

ICSNP包提供几种数据描述方法如spatial.median估计空间中值其它的函数估计scatter。

MASS包里的cov.rob提供更健壮的方差/协方差矩阵估计。

covRobust包用最近邻方差估计法估计协方差。

robustbase包的covMCD估计协方差和covOGK做Orthogonalized Gnanadesikan-Kettenring。

rrcov包提供可扩展和稳健的估计函数covMcd、covMest。

corpcor包可计算大规模的协方差和偏相关矩阵。

密度估计和模拟Densities estimation and simulation MASS 包的mvrnorm产生多元正态分布的随机数。

Mvtnorm包有多元t分布和多元正态分布的概率和分位数函数还可计算多元正态分布的密度函数。

mvtnormpcs包提供基于Dunnett的函数。

mnormt包提供元t分布和多元正态分布的密度和分布函数并可产生随机数。

sn包提供多元偏t 分布和偏正态分布的密度、分布、随机数函数。

delt包提供了许多估计多元密度的函数方法如CART和贪婪方法。

CRAN的Cluster任务列表/web/views/Cluster.html有更全面的信息ks包里的rmvnorm.mixt和dmvnorm.mixt函数产生随机数和估计密度bayesm包里有多种拟合方法。

很多地方都提供了模拟Wishart分布的函数如bayesm包里的rwishartMCMCpack包里的rwish而且MCMCpack包还有密度函数dwish。

KernSmooth 包里的bkde2D和MASS包的kde2d做分箱binned或不分箱二维核密度估计。

ks包也像ash 和GenKern包样可做核平滑kernel smoothing。

prim包用法找高维多元数据的高密度区域feature包可计算多元数据的显著特征。

正态检验Assessing normality mvnormtest 包提供Shapiro-Wilks检验的多元数据延伸方法mvoutlier包检测多元离群点outlierICS包可检验多元正态分布。

energy 包里的mvnorm.etest基于E统计量做正态检验k.sample检验多个数据是否来自同一分布。

dprep 包里的mardia用Mardia检验正态性。

stats包里的mauchly.test可检验Wishart分布的协方差矩阵。

连接函数Copulas copula 包提供常规的copula函数的程序包括normal t Clayton Frank Gumbel。

fgac包提供generalised archimedian copulamlCopulaSelection包可做二变量的copula。

4 线形模型Linear models stats 包里的lm可做多元线形模型anova.mlm比较多个多元线形模型manova 做多元方差分析MANOVA。

sn包的msn.mle和and mst.mle 可拟合多元偏正态和偏t分布模型。

pls包提供偏最小二乘回归PLSR和主成分回归ppls包可做惩罚偏最小二乘回归dr 包提供降维回归方法如.片逆回归法Sliced InverseRegression、片平均方差估计sliced average variance estimation。

plsgenomics包做基于偏最小二乘回归的基因组分析。

relaimpo包可评估回归参数的相对重要性。

5 投影方法Projection methods 主成分Principal components stats 包的prcomp基于svd和princomp基于eigen能计算主成分。

sca 包做单分量分析。

nFactors可评价碎石图Scree plotparan包可评估主成分分析得到的主成分和因子分析得到的因子。

pcurve包做主曲线Principal Curve分析和可视化。

gmodels包提供适合大矩阵的fast.prcomp和fast.svd。

kernlab包里的kpca用核方法做非线性的主成分分析。

pcaPP包用投影寻踪projection pursuit法计算稳健/鲁棒robust主成分。

amap包的acpgen和acprob函数分别针对广义generalized和稳健robust 主成分分析。

主成分在很多方面也有相应的应用如涉及生态的ade4包感官的SensoMinR包。

psy包里有用于心理学的各种程序与主成分相关的有sphpca用球形直观表示相关矩阵类似于3D的PCAfpca图形展示主成分分析的结果而且允许某些变量间有相关性scree.plot图形展示相关或协方差矩阵的特征值。

相关主题