基于选择性集成的并行多分类器融合方法
分享到:

[摘  要]:

为解决多分类器融合过程中时间开销大和准确率不高的问题,采用改进的Bagging方法并结合MapReduce技术,提出了一种基于选择性集成的并行多分类器融合方法 PMCF-SE。该方法基于MapReduce并行计算架构。在Map阶段,选择分类效果较好的基分类器;在Reduce阶段,从所选的基分类器中选择差异性较大的基分类器,然后采用D-S证据理论融合被选的基分类器。实验结果表明,在执行效率方面,与单机环境相比,集群环境下该方法的执行效率有所提高;在分类准确率方面,与Bagging算法相比,PMCF-SE在不同的基分类器数目下的分类准确率都高于Bagging算法。

[主 词]:多分类器融合; 选择性集成; D; S证据理论; MAPREDUCE; 并行化
[作  者]:陶晓玲; 亢蕊楠; 刘丽燕
[作者所在单位]:桂林电子科技大学广西云计算与大数据协同创新中心 桂林电子科技大学广西密码学与信息安全重点实验室 桂林电子科技大学信息与通信学院
[期  刊]:计算机工程与科学
[I S S N]:1007-130X
[年,卷(期)]:2018,40(5)
[页  码]:787-792

同期文章

计算机工程与科学

Piazza问答平台与Open edX平台的集成
[作  者]:张燕妮; 陆慧梅; 向勇
[]:MOOC|OPEN|edX|Piazza问答平台|数据分析
Piazza问答平台与Open edX学习平台两者相互独立,影响用户使用,并且Piazza问答数据无法被高效利用。针对上述问题,对Piazza问答数据进行持久保存,利用多标签过滤方法提高了Piazza问答数据的查找能力;基于Piazza-Xblock插件,实现了在Open edX平台查找和展现Piazza问答数据,以及通过URL参数直接访问Piazza特定页面的功能,达到Piazza问答平台与Open edX平台有机结合的效果。

计算机工程与科学

基于D-S证据理论的人体跌倒检测方法
[作  者]:孙子文; 李松; 孙晓雯
[]:跌倒检测|动态时间规整|D|S证据理论|证据权|加速度传感器|陀螺仪
针对人体跌倒检测算法存在错误否定率高的问题,研究了一种基于D-S证据理论的人体跌倒检测算法。采用智能手机内置的加速度传感器和陀螺仪传感器获得人体手臂运动的三维方向的运动数据,采用三阶滑动平均滤波器对获得的两个传感器的三维原始数据进行预处理;从三维预处理后的数据中提取运动幅度、倾斜程度以及旋转程度三种特征;采用动态时间规整方法分别依据三种特征进行局部检测,局部检测结果作为证据被D-S证据理论组合规则所采用以得到最终融合的全局检测结果,其中各证据被证据权修正以避免证据冲突问题。实验结果显示,本文算法准确度高于对比方法,能有效提高检测性能。

计算机工程与科学

图像矩阵上的广义最大噪声分离算法
[作  者]:张大明; 张学勇; 李璐; 刘华勇
[]:主成分分析|广义主成分分析|信噪比|最大化噪声分离
主成分分析(PCA)是模式识别中一种重要的变换工具,在图像处理的特征提取和降维方面有广泛的应用。然而,由于二维图像数据需要进行向量化处理,导致高维向量的产生和像素空间位置丢失。广义主成分分析(GPCA)则是基于图像矩阵的主成分分析推广算法,它不改变像素间的空间位置关系,而且计算量也显著降低。但主成分分析和广义主成分分析都没有考虑到实际图像中存在的噪声干扰。最大噪声分离(MNF)则是一种面向噪声干扰的变换方法,与主成分分析基于方差的最大化不同,最大噪声分离是基于信噪比的最大化。与GPCA的推广类似,在图像二维矩阵上推广最大噪声分离方法,提出一种广义最大噪声分离(GMNF)算法。该变换方法在保证重构时信噪比最大的同时,也具有不改变像素空间位置、计算量小的优点。在人脸和红外图像上的仿真实验结果验证了所提算法的有效性。

计算机工程与科学

基于分类融合和关联规则挖掘的图像语义标注
[作  者]:秦铭; 蔡明
[]:图像标注|K|MEANS聚类|支持向量机|关联规则挖掘
图像语义自动标注问题是现阶段一个具有挑战性的难题。在跨媒体相关模型基础上,提出了融合图像类别信息的图像语义标注新方法,并利用关联规则挖掘算法改善标注结果。首先对图像进行低层特征提取,用"视觉词袋"描述图像;然后对图像特征分别进行K-means聚类和基于支持向量机的多类别分类,得到图像相似性关系和类别信息;计算语义标签和图像之间的概率关系,并将图像类别信息作为权重融合到标签的统计概率中,得到候选标注词集;最后以候选标注词概率为依据,利用改善的关联规则挖掘算法挖掘文本关联度,并对候选标注词集进行等频离散化处理,从而得到最终标注结果。在图像集Corel上进行的标注实验取得了较为理想的标注结果。

计算机工程与科学

采用磁传感器的餐厅服务机器人导引控制方法
[作  者]:朱琳; 郭健; 吴益飞; 李胜; 章伟
[]:餐厅服务机器人|送餐|磁传感器|导引控制
针对餐厅环境复杂、定位精度低等问题,提出了一种以磁传感器为核心的餐厅服务机器人导引控制方法。该方法通过安装在机器人底盘的磁传感器感知铺设在地面下的磁条,使得机器人能够平滑、准确地沿着磁条运动,在运动的过程中,结合地标模块感知到的地标信息,获取精准的位置信息和工作状态。最后将该方法应用于一种实际餐厅服务机器人,实现了机器人在餐厅内的精准定位与导航。实验结果表明,本文所提方法性能可靠、成本较低、实用性较强,具有较广阔的应用前景。

计算机工程与科学

基于无锁原子操作的多线程并行Delaunay三角化算法
[作  者]:王俊吉; 朱朝艳; 陈建军; 郑澎; 徐权
[]:DELAUNAY三角化|网格生成|多线程并行算法|并行计算|OPENMP|原子操作
基于OpenMP实现了一种基于空腔交叠互斥准则与无锁原子操作的Delaunay三角化增量插点细粒度并行算法。在串行算法的基础上,对点集引入Hilbert排序,使相邻点在几何上亦相邻。引入互斥机制——仅当各空腔无公共单元及公共相邻边时,才可同时插入,根据Delaunay局部性准则可保证整个网格都具备Delaunay属性。每个单元用一个原子变量标记该单元是否已被占有,在计算Delaunay空腔时,各线程将试图写入该原子变量,但本竞争机制保证有且仅有一个线程能成功获得该单元的所有权,以保证算法的互斥性。经数值实验表明,对于10~7的点集,该算法在16核下加速比可达7.06倍。

计算机工程与科学

一种融合社会化标注系统中主题域相似的个性化排序方法
[作  者]:黄进; 周栋
[]:信息检索|社会化标注|个性化排序|主题域偏好
随着网络技术的发展,互联网中越来越多的资源被应用于信息检索中,大量的研究表明,社会化标注可以用于改善信息检索。现有个性化排序的方法中,用户之间的相似度大多通过其共同使用过的标签集来计算。然而,现实中用户标注数据存在稀疏性和标签同义词等问题,导致相似度计算并不准确。在前人研究的基础上,提出了一种融合主题域相似的个性化排序方法。该方法首先通过主题域的划分,将不同主题含义的网页及标签分开,通过构建的标签相似网络找出标签同义词。然后结合用户标签和主题偏好找出兴趣相近的用户,并对用户的标注信息进行扩展,从而能够有效地改善个性化信息检索的效果。在真实数据上的实验结果表明,该方法能有效缓解标注稀疏性和标签同义词问题,有助于改善用户检索体验。

计算机工程与科学

基于随机森林的老年人居住偏好预测研究
[作  者]:吴帅; 赵方
[]:数据挖掘|居住偏好|随机森林|非平衡数据集|特征选择
随着我国老龄化和高龄化趋势的加速,以及家庭养老功能弱化、社会养老服务体系不健全等问题,养老事业面临诸多挑战。为了更好地为老年人提供居住安排建议,同时为养老事业管理部门提供精准的决策支持,对CHARLS问卷中将近2万名老年人的数据进行了分析,力图发现影响老年人居住偏好的主要因素。同时,也尝试利用大数据和数据挖掘方法,从个人层面对老年人居住偏好进行预测,并针对类不平衡的情况下随机森林特征选择算法进行了改进。研究结果表明:基于老年人的特征数据可以很好地预测其居住偏好,为养老事业的精准化决策提供一种依据。

计算机工程与科学

基于RSS阈值模型的Amorphous算法定位误差抑制
[作  者]:宋海声; 朱长驹; 吴佳欣; 杨鸿武
[]:无线传感器网络|通信模型|Amorphous算法|阈值模型|梯度值
针对无线传感器网络定位算法在不同的通信模型下误差较大的问题,在Amorphous算法离线计算网络平均连通度的基础上,建立了四种RSS阈值模型来抑制Amorphous算法在不同通信模型下的定位误差。由不同阈值模型得到的阈值在不同程度上修正了算法的梯度值,使定位误差得到抑制。仿真结果表明,Amorphous算法在Regular模型下的最优阈值模型从Regular阈值模型和Log-normal阈值模型中选择;算法在Log-normal模型下的最优阈值模型从Regular阈值模型、Log-normal阈值模型、DOI阈值模型和RIM阈值中选择;算法在DOI模型和RIM模型下的最优阈值模型从Log-normal阈值模型、DOI阈值模型和RIM阈值模型中选择,最后得到Amorphous算法在不同的通信模型、通信半径和不规则度下对应的最优阈值模型。

计算机工程与科学

一种基于FPGA的素域椭圆曲线标量乘结构
[作  者]:邬贵明; 王淼; 谢向辉
[]:素域|椭圆曲线|FPGA|标量乘
基于一种简化求商的高基Montgomery模乘流水化阵列结构,提出并实现了素域上椭圆曲线标量乘硬件结构。该结构采用修正的Jacobian坐标的点加和倍点算法以及Kaliski提出的Montgomery模逆的算法。实验结果表明,该结构与相关工作相比具有更好的性能。