多分类器融合就是融合多个分类器提供的信息,得到更加精确的分类结果。多数据投票法和BKS方法均是决策层的多分类器融合方法。利用训练集数据学习获得一个分类器,然后使用测试数据集对该分类器分类精度进行评估。......
2025-09-29
1.算法时间效率分析
以属性层次为讨论依据,Zhong Ning的算法时间复杂度明显是O(N2),其中N是属性集合中的数据数目。对于本书提出的算法,设经聚类后,聚类的个数为k;经计算聚类的CPF后,需以数据单独参加PF值计算的数据个数与以类整体参加PF值计算的类的个数之和为n。在聚类阶段,采用的聚类算法时间复杂度是线性的,为O(N);聚类后计算每个聚类的CPF值阶段时间复杂度是O(k);最后计算PF阶段的时间复杂度是O(n2)。其中,最后阶段的时间复杂度是平方级的,希望n与N的比值很小,最好与N的增长保持线性以下的增长速度。在第3.3.2小节的数据集30+300、50+500、100+1000、200+2000、300+3000上运行Cpecu Find算法程序,λ取10%,采集在运行过程中n与N的关系,得到图3.4。其中,A17、A18、A19 3条曲线显示的是在数据集中第17、第18、第19个属性集在实验中n随N变化的情况,作为对比,直线10%显示的是n与N比值为10%的直线。
由图3.4可知,n与N的比值会在给定λ周围变化。因不同属性的数据集特征不同,聚类结果不同,n的变化没有统一的规律。由于特异挖掘中λ值很小,提出的算法具有较好的可扩展性。
仍采用在第3.3.2小节的渐增数据集30+300、50+500、100+1000、200+2000、300+3000,在其上分别运行PecuFind算法和CpecuFind算法。在Cpecu Find算法程序中,λ取10%。如图3.5所示显示出了两个算法程序的运行时间。其中Pecu Find在运行“100+1000”子集时,运行时间已超过1800s(0.5h),运行被中止,图3.5中用“”表示。此图验证了前一自然段中的时间效率分析,表明CpecuFind时间效率的优势显著。

图3.4 不同数据集规模下n与N的关系图

图3.5 PecuFind程序和CpecuFind程序运行时间比较
2.两算法ROC曲线对比
KDDCUP99数据集是网络访问数据记录集,其中的记录有两大类:正常访问记录和网络攻击记录,而网络攻击记录在数据集中占的比例很小,如果将攻击记录设为正类,正常访问记录设为负类,本章讨论的特异数据挖掘问题在此数据集上就是不平衡数据集的二分类问题。这类问题的结果评估,除前述的挖掘特异数据能力,还可以以ROC曲线特征来评估。对于第3.3.2节的30+300和50+500数据集,分别利用Cpecu Find和Pecu Find算法计算出的记录特异因子RPF值绘制ROC曲线,得到4个ROC曲线图,如图3.6和图3.7所示,曲线x轴表示假正率(Sensitivity),y轴表示真正率(1-Specificity)。4个ROC曲线下方面积的对比结果如表3.5所示。(https://www.chuimin.cn)
表3.5 4个ROC曲线下方面积对比结果


图3.6 两算法在30+330数据集上计算的ROC曲线
(a)PecuFind;(b)CpecuFind

图3.7 两算法在550数据集上计算的ROC曲线
(a)Pecu Find;(b)Cpecu Find
由此,4个ROC曲线的对比说明,CpecuFind算法性能优于Pecufind算法性能。
相关文章
多分类器融合就是融合多个分类器提供的信息,得到更加精确的分类结果。多数据投票法和BKS方法均是决策层的多分类器融合方法。利用训练集数据学习获得一个分类器,然后使用测试数据集对该分类器分类精度进行评估。......
2025-09-29
S7-1200 PLC是西门子公司最新推出的面向离散自动化系统和独立自动化系统的紧凑型自动化产品,定位在原有的SIMATIC S7-200 PLC和S7-300 PLC产品之间。表1-1给出了目前S7-1200系列PLC不同型号CPU的性能指标。表1-1 S7-1200PLC系列CPU的性能指标注:随着电子技术的发展和新产品的推出,部分指标可能有所变化。S7-200 PLC是西门子专门应用于小型自动化设备的控制装置,主要包括CPU 22X系列,表1-2给出了S7-200系列PLC不同型号CPU的性能指标。......
2025-09-29
由上述分析可知:某硅钢片厂跑偏控制EPC系统可以简化成一个三阶系统。上面从理论上分析了现有EPC系统及改造后EPC系统的动态特性,并实测了CP机组和CW机组的频宽,现将结果综合列在表12-3中。表12-3 EPC系统的性能参数由表12-3可以看出:1)增大活塞有效面积和卷重后,系统的开环放大系数k将降低,快速性和卷取精度都受影响。......
2025-09-29
额定压力 液压马达在正常工作条件下,按标准规定连续运转的最高输入压力称为液压马达的额定压力。排量可调节的液压马达称为变量马达,排量为常数的液压马达则称为定量马达。液压马达的排量只取决于密封容积的几何尺寸。容积损失是指液压马达流量上的损失。液压马达的实际输入流量总是大于其理论流量,其主要原因是由于液压马达内部高压腔的泄漏。设转矩损失为ΔT,则液压马达的机械效率为液压马达的功率1)输出功率Po。......
2025-09-29
利用CP机组动特性分析中得到的数学模型和公式,代入CW机组的结构参数就可以得到CW机组的动特性指标。由于分析过程相同,下面只将CW机组的参数和特性指标列出。将算得的ωh、ξh、k代入式,可据此画出现有CW机组EPC系统开环伯德图,如图12-20中的曲线A和曲线B所示。改造后的动特性指标预测ωh=73.48s-1=11.7Hzξh=0.21图12-20 改造前后CW机组EPC系统的开环伯德图开环放大系数,k=14.78s-1=2.35Hz。......
2025-09-29
由于钛及钛合金的热容量大,使热影响区金属在高温停留的时间较长,焊缝晶粒因此变得粗大,容易引起焊接接头产生过热倾向,使焊接接头塑性明显降低。尤其是β型钛合金,焊接接头塑性下降最为明显。由于合金元素含量较高,焊接性较差,是一种高强度、高淬透性合金,厚度为12mm的TC10合金焊接时,会出现热影响区裂纹,而在焊前预热250℃时,可预防裂纹并能提高接头塑性。4)正常氢含量的钛及钛合金焊接时,不会出现氢化钛。......
2025-09-29
由以上仿真结果和实验结果对比可以看出,用MHD仿真MCCB的模型中,动触头的运动过程对电弧电压以及电弧能量的准确性影响非常重要,同时,通过实验验证了在仿真中采用ANSYS Emag软件计算电磁场,用FLUENT计算流场的耦合方法的有效性和准确性,因此在低压断路器的仿真中,为了得到更为准确的计算结果,动触头的运动过程必须在仿真模型中予以考虑。......
2025-09-29
目前在许多国家的大型高炉上均使用液压泥炮,比较有代表性的液压泥炮有MHG型、IHI型和PW型。为了解决我国高炉炉前设备的更新问题,国内研制成功了BG型液压矮泥炮。1600kN液压泥炮主要技术性能指标见表7-2。......
2025-09-29
相关推荐