ability.cov数据集是R 软件自带的数据集,以下对该数据集进行因子分析.(1)查看ability.cov数据集中的信息ability.cov数据集提供了Ability and Intelligence Tests(能力和智力测试)中,112个人参加的六个测试指标general(普通),picture(画图),blocks(积木),maze(迷津),reading(阅读),vocab(词汇)......
2023-11-18
以下对smoke数据集进行对应分析.
(1)首先查看smoke数据集的信息
>library(ca)
>data("smoke")
>smoke
结果如下:
这个数据集来自Greenacre(1984),被应用于多个统计软件作为对应分析的说明案例数据.它的内容是一个5行(阶层:SM,JM,SE,JE和SC)4列(吸烟习惯:none,light,medium 和heavy)的列联表,给出了一个虚构的公司内各阶层吸烟习惯的频数.
(2)对数据集smoke进行对应分析
>ca(smoke)
结果如下:
(3)行的标准坐标
>ca(smoke)$rowcoord
结果如下:
(4)提取有关计算结果
>summary(ca(smoke))(www.chuimin.cn)
结果如下:
(5)绘制对应分析的散点图
>plot(ca(smoke))
结果如图11-6所示.
图11-6 行点和列点的散点图
从图11-6(在纵向零点线)的左右两边可以看出,左边是SE,SC 和SM 三个阶层与吸烟习惯none对应;右边是JE和JM 两个阶层与吸烟习惯light,medium和heavy对应.
从图11-6还可以看出,SE阶层的吸烟习惯更接近于none,JE阶层的吸烟习惯更接近于medium,JM 阶层的吸烟习惯是更接近于heavy.
(6)行作为主坐标,列作为标准坐标的情形
>plot(ca(smoke),mass=TRUE,contrib="absolute",map="rowgreen",arrows=c(FALSE,TRUE))
结果如图11-7所示.
图11-7 行点和列点的散点图(行作为主坐标,列作为标准坐标)
当我们从中心向任意两个点(相同类别)做向量的时候,它们的夹角越小越相似.从图11-7可以看出,JE 和JM 两个阶层的吸烟习惯相似(或接近),SE 和SC两个阶层的吸烟习惯相似(或接近),SM 和JM 两个阶层的吸烟习惯相似(或接近).
从图11-6和图11-7(或前面的计算)看到,第一维度(Dimension1)解释了列联表的87.8%,第二维度(Dimension2)解释了列联表的11.8%解,说明在两个维度上已经能够说明数据的99.6%,效果是比较理想的.
有关应用多元统计分析:基于R的实验的文章
ability.cov数据集是R 软件自带的数据集,以下对该数据集进行因子分析.(1)查看ability.cov数据集中的信息ability.cov数据集提供了Ability and Intelligence Tests(能力和智力测试)中,112个人参加的六个测试指标general(普通),picture(画图),blocks(积木),maze(迷津),reading(阅读),vocab(词汇)......
2023-11-18
在R 软件中,有个MASS包,其中有一个caith数据集,是关于眼睛颜色和头发颜色的数据.(1)查看caith数据集的信息>library(MASS)>caith结果如下:从以上结果可以看出,caith数据集中眼睛颜色:blue,light,medium 和dark;头发颜色:fair,red,medium,dark和black.(2)进行χ2 检验——考察行变量和列变量是否独立>chisq.te......
2023-11-18
在实验2.3.2中对iris数据集进行了描述和展示,以下对iris数据集进行可视化.花萼长度、花萼宽度、花瓣长度、花瓣宽度的小提琴图小提琴图是箱线图的变种,因为形状酷似小提琴而得名.小提琴图是将箱线图与核密度图结合在一起,它在箱线图上以镜像方式叠加上核密度图.绘制小提琴图,可以使用vioplot包中的“vioplot( )”函数,但在第一次使用之前请先安装vioplot包.“vioplot( )”函数的调用格式为:vioplot(x1,x2,…......
2023-11-18
在实验2.3.2中曾对iris数据集进行描述和展示,在实验2.3.4中曾对iris数据集进行可视化.以下将对iris数据集进行进行聚类分析.根据实验2.3.4,我们只知道数据集内有三个品种鸢尾花而不知道每朵花的真正分类,只能凭借花萼及花瓣的长度和宽度分类.以下对鸢尾花iris数据集进行聚类分析,代码如下:>data(iris);attach(iris)>iris.hc1<-hclust(dist(......
2023-11-18
Wisconsin Breast Cancer数据集有699条记录,每条记录都是记录一位胸部有肿瘤的病人的特征数据。可以从中随机选择444条良性记录和39条恶性记录组成一数据集。文献[107]描述的是基于聚类的且基于密度局部特异数据挖掘方法—FindCBLOF,在Wisconsin Breast Cancer Data上的实验结果显示了其挖掘特异数据的能力在同类算法中是优越的。结果再次表明Cpecu Find挖掘特异数据的能力略优于pecu Find。表3.4Wisconsin Breast Cancer数据集上的实验结果比较......
2023-06-16
在实验2.3.1中,我们对mtcars数据集进行了展示和描述.在实验2.3.3中,我们对mtcars数据集进行了可视化.现在我们对该数据集中的变量进行回归分析.(1)不考虑变量交互项对该数据集,如果把mpg(汽车每加仑公里数)作为因变量,自变量为hp(马力)和wt(汽车重量)进行回归.>fit<-lm(mpg~hp+wt,data=mtcars)>summary(fit)结果如下:得到的回归方程为......
2023-11-18
Harman74.cor数据集是R 软件自带的数据集,以下对该数据集进行因子分析.(1)查看Harman74数据集中(前面)部分信息Harman74.cor数据集,包含了对芝加哥郊区145名七年级和八年级儿童进行的24 项心理测试指标的相关系数矩阵.其中的24 项心理测试指标包括:VisualPerception,Cubes,PaperFormBoard,Flags,GeneralInformat......
2023-11-18
USJudgeRatings数据集(R 自带),该数据集来自psych包,需加载以及调用psych包.(1)首先查看USJudgeRatings数据集的信息该数据集包含了律师对美国高等法院法官的评分,数据包含43个观测值,12个变量.12个变量如下:CONT:律师与法官的接触次数;INTG:法官正直程度;DMNR:风度;DILG:勤勉度;CFMG:案例流程管理水平;DECI:决策效率;PREP:审......
2023-11-18
相关推荐