在实验2.3.2中对iris数据集进行了描述和展示,以下对iris数据集进行可视化.花萼长度、花萼宽度、花瓣长度、花瓣宽度的小提琴图小提琴图是箱线图的变种,因为形状酷似小提琴而得名.小提琴图是将箱线图与核密度图结合在一起,它在箱线图上以镜像方式叠加上核密度图.绘制小提琴图,可以使用vioplot包中的“vioplot( )”函数,但在第一次使用之前请先安装vioplot包.“vioplot( )”函数的调用格式为:vioplot(x1,x2,…......
2023-11-18
Wisconsin Breast Cancer数据集有699条记录,每条记录都是记录一位胸部有肿瘤的病人的特征数据。其中458条是良性的,241条是恶性的。记录属性有11个,其中第1个是关键字ID,最后一个是良性、恶性标识,中间的9个是要计算的特征属性。可以从中随机选择444条良性记录和39条恶性记录组成一数据集。这个数据集与文献[107]的实验数据集相吻合。文献[107]描述的是基于聚类的且基于密度局部特异数据挖掘方法—FindCBLOF,在Wisconsin Breast Cancer Data上的实验结果显示了其挖掘特异数据的能力在同类算法中是优越的。
取λ=10%,k=2,使用Cpecu Find程序进行计算,如表3.4显示了其结果与pecu Find算法挖掘结果,以及与文献[107]的实验结果对比情况。应该说明的是,因为无法获得文献[107]的原数据集,表3.4的结果并不具有严格的可比性。结果再次表明Cpecu Find挖掘特异数据的能力略优于pecu Find。同时,粗略地说明基于密度的局部方法和基于距离的全局方法在挖掘特异数据的能力上是相当的。
表3.4 Wisconsin Breast Cancer数据集上的实验结果比较
有关数据挖掘算法及在视频分析中的应用的文章
在实验2.3.2中对iris数据集进行了描述和展示,以下对iris数据集进行可视化.花萼长度、花萼宽度、花瓣长度、花瓣宽度的小提琴图小提琴图是箱线图的变种,因为形状酷似小提琴而得名.小提琴图是将箱线图与核密度图结合在一起,它在箱线图上以镜像方式叠加上核密度图.绘制小提琴图,可以使用vioplot包中的“vioplot( )”函数,但在第一次使用之前请先安装vioplot包.“vioplot( )”函数的调用格式为:vioplot(x1,x2,…......
2023-11-18
以下对smoke数据集进行对应分析.(1)首先查看smoke数据集的信息>library(ca)>data("smoke")>smoke结果如下:这个数据集来自Greenacre(1984),被应用于多个统计软件作为对应分析的说明案例数据.它的内容是一个5行(阶层:SM,JM,SE,JE和SC)4列(吸烟习惯:none,light,medium 和heavy)的列联表,给出了一个虚构的公司内各阶层......
2023-11-18
ability.cov数据集是R 软件自带的数据集,以下对该数据集进行因子分析.(1)查看ability.cov数据集中的信息ability.cov数据集提供了Ability and Intelligence Tests(能力和智力测试)中,112个人参加的六个测试指标general(普通),picture(画图),blocks(积木),maze(迷津),reading(阅读),vocab(词汇)......
2023-11-18
引入粗糙集理论,设计一种交通事故黑点影响因素挖掘分析模型,挖掘出导致交通事故频发的主要影响因素及各因素对事故的影响程度及其之间的规律,服务于道路安全整治。粗糙集理论能够在保持原有的分类能力不变的前提下,去除数据中的冗余信息。并且由于粗糙集理论只可以用来处理离散型属性,所以对连续属性进行属性离散化处理。......
2023-06-15
在R 软件中,有个MASS包,其中有一个caith数据集,是关于眼睛颜色和头发颜色的数据.(1)查看caith数据集的信息>library(MASS)>caith结果如下:从以上结果可以看出,caith数据集中眼睛颜色:blue,light,medium 和dark;头发颜色:fair,red,medium,dark和black.(2)进行χ2 检验——考察行变量和列变量是否独立>chisq.te......
2023-11-18
DAQmx编程节点位于“函数选板”→“测量I/O”→“DAQmx-数据采集”选板上,如图3-29所示。下面对一些常用的DAQmx编程节点进行介绍。图3-30 选择DAQmx任务图3-31 DAQmx虚拟通道创建函数“NI-DAQmx虚拟通道创建”函数的输入根据不同函数例程而有所不同,然而,某些输入对大部分函数的例程都是通用的。如图3-32所示是6种不同的DAQmx创建虚拟通道VI实例。在使用NI-DAQmx触发函数时,所有有效的触发信号均可作为源输入到函数中。NI-DAQmx可自动完成这些路由。......
2023-07-02
在实验2.3.2中曾对iris数据集进行描述和展示,在实验2.3.4中曾对iris数据集进行可视化.以下将对iris数据集进行进行聚类分析.根据实验2.3.4,我们只知道数据集内有三个品种鸢尾花而不知道每朵花的真正分类,只能凭借花萼及花瓣的长度和宽度分类.以下对鸢尾花iris数据集进行聚类分析,代码如下:>data(iris);attach(iris)>iris.hc1<-hclust(dist(......
2023-11-18
KDDCUP99数据集是网络访问数据记录集[117],它包含了若干个数据集,本书选用的是corrected.gz。每个记录有42个属性,前41个是访问特征属性,最后一个属性是记录的类别标识。从corrected中按比例分别选择两类记录来构造若干子集,其中攻击记录所占比例均小于10%,以使其为特异记录。分别在30+300、50+500、100+1000、200+2000、300+3000共5个子集上分别运行PecuFind算法程序和CpecuFind算法程序。很明显,Cpecu Find发现攻击记录的能力强于Pecu Find。表3.330+300和50+500上的实验结果比较......
2023-06-16
相关推荐