1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    大数据&数据科学 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 带关注度模糊序决策数据集的分布约简
    徐伟华, 张俊杰, 陈修伟
    计算机科学    2022, 49 (11A): 210700191-5.   DOI: 10.11896/jsjkx.210700191
    摘要57)      PDF(pc) (1759KB)(48)    收藏
    随着大数据时代的到来,数据的结构变得越来越复杂,数据集的维度变得越来越高,这极大地影响了数据挖掘的效率。因此,很有必要进行数据压缩或对信息系统进行属性约简,即去掉不必要的冗余属性,降低数据维度,提高数据挖掘效率。在现实生活中,人们对数据集中每个条件属性的关注度往往是不一样的。首先,在经典模糊决策数据集的基础上,对不同的条件属性进行加权,定义加权得分函数,进一步建立带关注度的模糊序决策信息系统。然后在该系统中引入分布函数,并通过分布可辨识矩阵建立求分布约简的方法。最后,通过案例分析验证了该方法的可行性。
    参考文献 | 相关文章 | 多维度评价
    2. 复杂网络社团发现综述
    潘雨, 王帅辉, 张磊, 胡谷雨, 邹军华, 王田丰, 潘志松
    计算机科学    2022, 49 (11A): 210800144-11.   DOI: 10.11896/jsjkx.210800144
    摘要62)      PDF(pc) (3022KB)(76)    收藏
    在复杂网络中,社团结构是广泛存在的重要潜在结构。挖掘复杂网络中的社团结构,对探索网络潜在特性、理解网络组织结构、发现网络隐藏规律和交互模式等具有重要的理论和现实意义,是网络分析任务的关键研究内容。介绍了社团发现的背景和意义,并从静态网络社团发现和动态网络社团发现两个方面对社团发现的方法进行了总结和梳理。其中,静态网络的社团发现包括基于划分的社团发现方法、基于层次聚类的社团发现方法、基于模块度的社团发现方法、基于非负矩阵分解的社团发现方法和基于深度学习的社团发现方法。动态网络社团发现包括增量聚类的社团发现方法和演化聚类的社团发现方法。另外介绍了常用的社团发现评价指标,并在最后讨论了社团发现所面临的一些挑战及未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    3. 一种基于图注意力聚合的POI推荐新方法
    蔡国永, 陈心怡, 王顺杰
    计算机科学    2022, 49 (11A): 210800149-5.   DOI: 10.11896/jsjkx.210800149
    摘要49)      PDF(pc) (2162KB)(60)    收藏
    在基于位置社交网络(Location-based Social Network,LBSNs)的服务中,有效的兴趣点(Point-of-Interest,POI)推荐具有极大的经济和社会效用,但如何深入理解LBSN中的位置、结构和行为等相关信息,并进行推理以及实现POI推荐仍然是一项挑战性任务。针对LBSNs中的多种异构数据,提出了一种能够挖掘用户社交和POI多种特征信息的用于POI推荐的图神经网络模型——POIR-GAT。首先POIR-GAT利用社交关系构建用户-用户图,并结合用户-POI交互图共同抽取用户特征向量;其次,基于POI的不同地理特征构造不同的特征矩阵,并通过矩阵分解获得不同的潜在因子,将这些潜在因子融入POI的特征向量,以学习它们对用户行为的共同影响,并用于实现融合社交因素和POI特征的推荐模型。通过在2个公开数据集上进行的实验,验证了所提POIR-GAT模型可以有效融合用户社交信息和POI特征信息,提高POI推荐质量。
    参考文献 | 相关文章 | 多维度评价
    4. 基于k-shell熵的影响力节点的排序与识别
    原慧琳, 冯宠
    计算机科学    2022, 49 (11A): 210800177-5.   DOI: 10.11896/jsjkx.210800177
    摘要51)      PDF(pc) (3741KB)(59)    收藏
    节点的影响力排序一直是复杂网络领域中最具有吸引力的一个问题,其对于衡量节点的传播能力有着重要的作用。由于网络中的节点的规模很大,研究者们希望能够更准确地估计节点的传播能力。文中基于信息论的基本概念和k-shell方法提出了一种新的影响力节点的排序方法,根据节点所在网络中的位置的拓扑信息来测量节点的传播能力。实验结果表明,该方法可以有效地识别网络中有影响力的节点,并且可以有效避免 k-shell法的“富人俱乐部现象”。
    参考文献 | 相关文章 | 多维度评价
    5. 基于加权马氏距离的模糊多核支持向量机
    戴小路, 汪廷华, 周慧颖
    计算机科学    2022, 49 (11A): 210800216-5.   DOI: 10.11896/jsjkx.210800216
    摘要86)      PDF(pc) (1789KB)(53)    收藏
    模糊支持向量机通过引入模糊隶属度有效区分不同样本的重要程度,降低了传统支持向量机对噪声数据的敏感性。针对基于欧氏距离设计的隶属度函数忽略了样本的总体分布,且未考虑样本特征重要性的区分,提出了一种基于加权马氏距离的模糊支持向量机方法。首先应用Relief-F算法计算样本特征权重,然后基于该权重计算样本距其类中心的加权马氏距离,最后根据该距离值度量样本隶属度。在此基础上,考虑到核函数及其核参数难以确定,将模糊支持向量机与多核学习方法相结合,提出基于加权马氏距离的模糊多核支持向量机,采用加权求和形式构建多核,并遵循中心核对齐原则确定每个核的权重。该方法不仅降低了弱相关特征对分类效果的影响,而且使数据表达更加全面准确。实验结果表明,基于加权马氏距离的模糊支持向量机的分类精度高于基于欧氏距离和基于马氏距离的模糊支持向量机,且基于加权马氏距离的模糊多核支持向量机的分类性能较单核模型更优。
    参考文献 | 相关文章 | 多维度评价
    6. 网络信息体系信息流程有效低频路径挖掘方法
    林文祥, 刘德生
    计算机科学    2022, 49 (11A): 211000001-6.   DOI: 10.11896/jsjkx.211000001
    摘要50)      PDF(pc) (3411KB)(51)    收藏
    随着信息技术和网络技术的迅猛发展及其在军事领域的广泛应用,网络信息体系应运而生。网络信息体系以信息为主导,主要的表现为其内含的信息活动流程。信息活动流程的合理性、高效性,直接影响信息在作战体系中的作战效能。采用流程挖掘技术从信息活动事件日志中发现信息活动流程模型,可为信息活动流程的建模、检验和增强提供有效支持。简单通过事件频率分析过滤日志中的噪声,容易导致有效低频路径丢失,降低挖掘的信息活动流程的准确性。结合军事信息活动的特殊性和信息传递的有效性特征,提出了一种基于结构聚合度的有效低频路径挖掘算法。仿真分析表明,该方法可成功分离日志噪声和有效低频路径,对挖掘真实有效的信息流程具有重要意义。
    参考文献 | 相关文章 | 多维度评价
    7. 基于Apriori算法填充数据及改进相似度的推荐算法
    董云薪, 林耿, 张清伟, 陈颖婷
    计算机科学    2022, 49 (11A): 211000005-5.   DOI: 10.11896/jsjkx.211000005
    摘要58)      PDF(pc) (2228KB)(68)    收藏
    针对协同过滤算法中存在的数据稀疏和算法精确度不高的问题,提出了一种融合关联规则的协同过滤算法。首先,利用关联规则Apriori算法挖掘出用户间潜在的联系,该潜在联系采用用户间的关联规则的置信度来表示,紧接着进一步构建用户置信度矩阵,用于填充用户评分矩阵。其次,利用置信度矩阵来改进传统的相似度计算公式,构建一个用户间的综合相似度计算公式。最后,利用填充过后的用户评分矩阵和用户间的综合相似度为用户进行推荐。所提算法相比传统算法具有更高的算法精度。此外,与其他算法相比,所提算法还能有效缓解推荐系统的长尾问题,从而进一步提高推荐系统的推荐质量。
    参考文献 | 相关文章 | 多维度评价
    8. 空间co-location模式的主导特征挖掘
    熊开放, 陈红梅, 王丽珍, 肖清
    计算机科学    2022, 49 (11A): 211000126-7.   DOI: 10.11896/jsjkx.211000126
    摘要51)      PDF(pc) (3167KB)(57)    收藏
    空间co-location模式是空间特征的子集,它们的实例在邻域内频繁并置出现。传统co-location模式不区分模式中特征的重要性,忽略了特征间的主导关系。主导特征co-location模式考虑模式中特征的不平等性,分析特征间的主导关系,具有重要的应用意义。然而,现有主导特征模式挖掘没有从特征实例分布的角度综合考虑一个特征主导其他特征的可能倾向和影响强度,使得挖掘的主导特征及模式没有较好地反映特征间的主导关系。首先分析co-location模式中特征实例的空间分布,提出模式主导度,用以度量模式中某个特征主导其他特征的可能倾向;提出主导影响度,用以度量模式中某个特征主导其他特征的影响强度;基于这两个新度量,提出co-location模式的主导特征挖掘。然后通过优化新度量的计算,提出有效的主导特征co-location模式挖掘算法。在真实数据集和合成数据集上开展大量实验,验证了所提方法能够有效地识别co-location模式中的主导特征,所提算法能够高效地挖掘主导特征及模式。
    参考文献 | 相关文章 | 多维度评价
    9. 基于记忆增强 GAN 的异常检测
    周士金, 邢红杰
    计算机科学    2022, 49 (11A): 211000202-9.   DOI: 10.11896/jsjkx.211000202
    摘要98)      PDF(pc) (3189KB)(85)    收藏
    基于生成式对抗网络(Generative Adversarial Networks,GAN)的异常检测方法在训练阶段训练集仅由正常数据构成,当训练数据较为充分时,它在该训练集上能够取得较小的重构误差。然而在测试阶段,正常数据的重构误差和部分异常数据的重构误差之间的差别很小,使得基于GAN的异常检测方法的判别性能较差。为了解决该问题,提出了基于记忆增强GAN的异常检测方法。在基于GAN的异常检测方法中加入记忆增强模块,使模型能够记忆正常数据的特征,从而使得异常数据的重构误差变大,该方法的判别性能得到增强。在MNIST,Fashion-MNIST和CIFAR-10上的实验结果表明,与相关方法相比,所提方法具有更优的检测性能。
    参考文献 | 相关文章 | 多维度评价
    10. 基于核心节点影响力的社区发现方法
    原慧琳, 韩真, 冯宠, 黄碧, 刘军涛
    计算机科学    2022, 49 (11A): 211100002-7.   DOI: 10.11896/jsjkx.211100002
    摘要58)      PDF(pc) (3274KB)(60)    收藏
    社区发现是复杂网络研究领域的一个热点问题,目前已经有许多局部社区发现算法被提出用于快速发现高质量的社区,不过它们往往存在种子节点依赖或是稳定性问题。因此,部分算法试图根据核心节点被邻居高度包围且相互之间距离较远的拓扑特性来精确地锁定种子节点以避免上述问题,但距离的计算使得其时间复杂度较高。文中提出了一种基于核心节点影响力的社区发现方法CDIC,该方法首先根据核心节点的拓扑特性和网络邻接信息寻找所有可能是核心的节点,之后利用真正核心节点影响力较高的性质和标签传播的思想来扩张社区,并淘汰被误选为核心的节点以避免种子依赖问题,同时不涉及最短距离的计算也保证了较低的时间复杂度,最后依据相似度理论提出了一种社区对节点的吸引力来合并特异节点,以保证算法结果的稳定性。将CDIC与6种经典算法以及2种近年来提出的算法在64个人工网络和4个真实网络上进行仿真实验,并对其社区划分结果对应的标准化互信息值和纯度进行了比较,结果表明了CDIC的有效性。
    参考文献 | 相关文章 | 多维度评价
    11. 基于属性图注意力网络的电影推荐模型
    孙开伟, 刘松, 杜雨露
    计算机科学    2022, 49 (11A): 211100106-8.   DOI: 10.11896/jsjkx.211100106
    摘要57)      PDF(pc) (3128KB)(64)    收藏
    近年来,图网络被广泛应用于推荐领域并取得了较大进展,但是现有方法往往侧重于用户项目的交互建模,从而性能容易受到数据稀疏问题的限制。因此文中利用额外的属性信息,提出了一种基于属性图注意力网络的电影推荐模型。首先提出了一种基于注意力的GNN,采用显式反馈来计算实体和属性间的注意力得分,相比较使用拉普拉斯矩阵的聚合方式,能够更有效地区分不同属性对实体的影响,在属性和实体间信息聚合上更加有效。此外,由于不同实体受属性影响和行为影响的程度不同,文中设计了一种细粒度偏好融合策略,将属性群体偏好和个人行为偏好这两个方面的偏好更好地结合在一起,使实体的嵌入表示更加全面准确和个性化。在真实的数据集上进行实验,结果表明所提推荐方法充分利用属性图中蕴含的属性信息能够有效缓解数据稀疏问题,并且在电影推荐的两个评价指标召回率和nDCG上都明显优于其他基准算法。
    参考文献 | 相关文章 | 多维度评价
    12. 基于模糊邻域系统的模糊粗糙集模型
    冉虹, 候婷, 贺龙雨, 秦克云
    计算机科学    2022, 49 (11A): 211100224-5.   DOI: 10.11896/jsjkx.211100224
    摘要56)      PDF(pc) (1773KB)(61)    收藏
    针对模糊邻域系统,提出了基于一般模糊逻辑算子的模糊粗糙上、下近似算子并探讨了算子的基本性质。然后将邻域系统串行、自反、对称、一元、欧几里得的概念推广到模糊邻域系统。最后研究了当模糊邻域系统是串行、自反、对称、一元、欧几里得时模糊粗糙近似算子的相关代数结构。
    参考文献 | 相关文章 | 多维度评价
    13. 基于多源健康感知数据动静态关系融合的疾病诊断
    霍甜媛, 顾晶晶
    计算机科学    2022, 49 (11A): 211100241-9.   DOI: 10.11896/jsjkx.211100241
    摘要51)      PDF(pc) (3300KB)(59)    收藏
    疾病诊断是电子健康记录数据挖掘的热门研究领域,也是实现医疗诊断智能化的一个重要环节。但是,电子健康记录中健康感知数据的来源多样、数据结构复杂,且不同类型的数据之间有着潜在的相关性,在进行特征提取和挖掘分析过程中存在着异构数据应该如何融合的问题。只有对医学感测数据、个人体质记录数据、疾病间关系数据进行综合考虑,挖掘其中的相关隐藏特征,才能对多种类别疾病进行更准确的诊断。因此,基于多源健康感知数据动静态关系融合的疾病诊断模型(DSRF)首先通过动静态关系融合算法解决动态医学感测数据和静态体质记录数据的异构性问题并挖掘其相关关系,然后计算多类别疾病的关联矩阵来提取疾病间依赖关系,最后在门控循环单元网络架构的基础上将多种健康感知数据进行融合,完成了多源异构数据的综合分析。在美国MIMIC-III临床数据集上的实验结果证明,相比同类型主流模型,该模型可以更准确地对多种类别疾病进行联合诊断。
    参考文献 | 相关文章 | 多维度评价
    14. 基于公理化模糊集合的模糊随机事件及其概率
    谢健祥, 潘小东, 张波
    计算机科学    2022, 49 (11A): 211100242-7.   DOI: 10.11896/jsjkx.211100242
    摘要41)      PDF(pc) (1828KB)(53)    收藏
    基于公理化模糊集合研究模糊随机事件的概率,定义了模糊随机事件以及相应的概率,讨论了模糊随机事件概率的一些基本性质,给出了模糊随机事件概率的乘法公式,证明了模糊随机事件的全概率公式和贝叶斯公式。
    参考文献 | 相关文章 | 多维度评价
    15. 基于分数线预测的多特征融合高考志愿推荐算法
    王泽卿, 季圣鹏, 李鑫, 赵子轩, 王鹏旭, 韩霄松
    计算机科学    2022, 49 (11A): 211100266-7.   DOI: 10.11896/jsjkx.211100266
    摘要110)      PDF(pc) (2646KB)(90)    收藏
    近年来,随着我国高考人数逐年增多,考生对高考志愿填报服务的需求日益增加。面对海量的院校填报信息,考生往往很难在短期内做出比较符合自身意愿的合理选择,进而导致报考事故的发生。因此,针对高考志愿报名问题,在爬取历年高考录取数据的基础上,提出一种基于分数线预测的多特征融合推荐算法(Reco-PMF)。该算法首先利用历年高校最低投档位次,通过BP神经网络预测报考年份各高校最低投档位次以及最低投档分数线,然后根据考生分数进行院校初筛,进而构建3种与录取分数相关的特征,结合院校软科排名,通过遗传算法进行权值寻优,得到不同院校的录取概率,并在此基础上定义推荐度实现为考生进行不同录取风险层次的高校推荐,形成完整的推荐结果。实验结果表明,基于BP神经网络的高校录取分数预测算法在不同误差限下的表现均优于其他算法;相比百度和夸克的已有服务,所提算法在多层次测试分数下,平均录取率分别提升14.8%和24.1%,同时成功录取院校的平均位次分别提升了99名和87名。
    参考文献 | 相关文章 | 多维度评价
    16. DCPFS:分布式轨迹流伴随模式挖掘框架
    张康威, 张敬伟, 杨青, 胡晓丽, 单美静
    计算机科学    2022, 49 (11A): 211100268-10.   DOI: 10.11896/jsjkx.211100268
    摘要74)      PDF(pc) (3802KB)(54)    收藏
    随着定位技术的广泛使用,产生了以轨迹流形式收集的海量时空数据,如何从中挖掘有用的信息得到越来越多学者的关注。从轨迹流中挖掘伴随模式指在同一时间内发现具有高度相似行为的群体,对于交通管理、推荐系统的实时应用至关重要。然而,现有的研究只达到秒级响应,面对大规模轨迹数据难以在毫秒级的时间内快速响应。因此,提出了分布式轨迹流挖掘框架DCPFS。框架的主要模块包括:1)为了减少基于密度的聚类算法DBSCAN由于大规模数据带来的大量时间消耗,研究基于分布式部署方案,设计了数据分区策略和聚类合并算法,确保聚类的并行性及准确性;2)由于现实中轨迹移动具有方向性,在聚类阶段增加方向维度以减少冗余聚类;3)鉴于模式挖掘阶段涉及对聚类结果的交叉,设计了并行交叉算法来提高挖掘效率;4)基于Flink分布式大数据流处理平台实现了DCPFS。以成都市出租车GPS数据集和谷歌生活数据集为例进行实验,验证了所提框架比基准方法具有更快的响应速度。
    参考文献 | 相关文章 | 多维度评价
    17. 融合知识表示的关系型数据库操作框架
    姜宗林, 李志军, 顾海军
    计算机科学    2022, 49 (11A): 211200030-9.   DOI: 10.11896/jsjkx.211200030
    摘要46)      PDF(pc) (4556KB)(72)    收藏
    关系型数据库指采用关系模型来组织数据的数据库,需要使用结构化查询语言(SQL)来操作其中的数据,面向应用时只能按照开发者设定好的程序规则进行数据库操作,程序规则的修改和新增过程繁琐且需要一定专业度,对普通用户不友好。为提高关系型数据库应用的扩展性和普适性,利用知识表示理论对数据库操作相关知识进行概念建模,使用框架结合规则的知识表示法建立数据库操作的一般化范式,基于关系型数据库的操作特点,结合关系模型及结构化查询语句的语法语义研究设计推理算法,将面向用户的数据库操作指令抽象成逻辑符号,并将事物之间的内在联系抽象为逻辑符号间的规则约束,使用求解系统根据逻辑符号表示的规则约束进行问题求解。基于上述理论及算法,设计并实现一种融合知识表示的关系型数据库操作框架,将用户输入转化成数据库操作语句,实现数据库系统操作。由应用实例可知,所提操作框架能在与关系型数据库友好兼容的基础上嵌入应用系统,程序规则易扩展,应用系统的使用和更新维护难度低,自适应性强,可以为用户提供更加灵活智能的数据库操作管控服务。
    参考文献 | 相关文章 | 多维度评价
    18. 基于一种新的q-rung orthopair模糊交叉熵的属性约简算法
    王志强, 郑婷婷, 孙鑫, 李清
    计算机科学    2022, 49 (11A): 211200142-6.   DOI: 10.11896/jsjkx.211200142
    摘要44)      PDF(pc) (2078KB)(55)    收藏
    熵是刻画模糊集不确定性程度的一种重要手段。为了反映 q-rung orthopair 模糊集中隶属度与非隶属度力量对比所产生的模糊性,首先提出相关的得分函数。针对目前大多数 q-rung orthopair 模糊集的相似性度量的不足,提出了更符合人们直觉的 q-rung orthopair 模糊集交叉熵。目前对 q-rung orthopair 模糊信息系统的属性约简研究相对较少,通过性质讨论和理论证明,发现这种交叉熵可以较好地应用于 q-rung orthopair 模糊信息系统的属性约简,设计了相关的属性约简算法,并通过实例说明了这种算法的合理性。其次,给出了将普通信息系统转换为 q-rung orthopair 模糊信息系统的方法,最后通过计算UCI中多个数据库,验证了所提属性约简算法的合理性和有效性,为q-rung orthopair 模糊信息系统数据预处理提供了新的思路。
    参考文献 | 相关文章 | 多维度评价
    19. 基于规则链的网络协同制造数据融合方法研究
    胡楚阳, 柳先辉, 赵卫东
    计算机科学    2022, 49 (11A): 220300175-7.   DOI: 10.11896/jsjkx.220300175
    摘要54)      PDF(pc) (5118KB)(60)    收藏
    对制造资源数据进行高效组织利用,施以有效的数据融合手段进而提取更多的有利信息,是当今智能制造领域的研究热点。同时,基于事件流的规则链技术开始崭露头角,其高自由度为与数据融合相结合提供了可能。针对当下制造资源组织模型较少、数据融合模型应用范围辖制在同架构系统内、与规则链结合的研究较少的问题,对复杂制造资源的组织方法进行建模,改进了基于MROM-VMC的调度流程,总结了制造资源数据存储链结构,并针对数据链中的数据处理环节提出了一种基于规则链的数据融合方法,以处理大量同构与异构的传感器数据,最终在网络协同制造资源平台中的数据处理环节得到验证,提升了制造资源数据利用的效率以及数据融合方法的可操作性,为用户提供辅助决策支持。
    参考文献 | 相关文章 | 多维度评价
    20. 基于DBSCAN聚类的集群联邦学习方法
    鲁晨阳, 邓苏, 马武彬, 吴亚辉, 周浩浩
    计算机科学    2022, 49 (6A): 232-237.   DOI: 10.11896/jsjkx.211100059
    摘要374)      PDF(pc) (2918KB)(474)    收藏
    联邦学习(Federated Learning)是为了解决机器学习中以隐私保护为前提的数据碎片化和隔离问题。各客户端节点在本地训练数据,将训练的模型参数信息上传到中央服务器,由参数服务器聚合参数信息以达到共同训练的目的。由于现实环境中,各节点数据之间的分布往往不一致,通过分析非独立同分布数据对联邦学习准确率的影响,来证明传统联邦学习方法得到的模型精度较低。因此,采用多样化抽样策略模拟数据倾斜度分布,提出了基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类的集群联邦学习算法(DBSCAN Based Cluster Federated Learning,DCFL),解决了联邦学习中不同节点的数据非独立同分布降低了学习准确率的问题。在Mnist和Cifar-10标准数据集上进行了实验,相比传统的联邦学习算法,基于DBSCAN聚类的集群联邦学习算法对模型的准确率有较大的提升。
    参考文献 | 相关文章 | 多维度评价
    21. 一种改进的融合相似度和信任度的协同过滤算法
    蔡晓娟, 谭文安
    计算机科学    2022, 49 (6A): 238-241.   DOI: 10.11896/jsjkx.210400088
    摘要140)      PDF(pc) (1993KB)(211)    收藏
    电子商务的迅猛发展在给用户提供更多商务选择的同时也导致了信息的泛滥。推荐系统作为信息过滤技术中必不可少的一种方法获得了社会的普遍关注。协同过滤算法是推荐系统中应用最广泛的技术,但其面临数据稀疏性、冷启动、数据扩展性等问题。文中提出了一种改进的融合相似度和信任度的协同过滤算法,该算法包括3个步骤:首先,计算用户之间的信任度;其次,计算用户之间的相似度;最后,融合信任度和相似度以计算用户之间的信任值,从而得到最终的评分预测方程。实验结果表明,针对不同的邻域集,所提算法的性能均优于传统协同过滤算法。
    参考文献 | 相关文章 | 多维度评价
    22. 自适应的集成定序算法
    王文强, 贾星星, 李朋
    计算机科学    2022, 49 (6A): 242-246.   DOI: 10.11896/jsjkx.210200108
    摘要85)      PDF(pc) (3354KB)(163)    收藏
    定序变量常常用来表达人们对事物的态度和偏好,例如在推荐系统中,消费者对商品的打分评价是定序变量,在自然语言处理中,情感分析的情感也是定序变量。目前学术界采用定序Logit模型来处理定序变量,但是定序Logit回归模型要求定序变量大体服从均匀分布,当自变量没能很好符合均匀分布时,定序Logit回归模型预测定序变量的结果并不理想。基于此,文中提出一种自适应的集成定序算法。首先,借助Boosting思想提出了类Boosting算法,根据定序Logit回归模型的思想构造了定序多层感知机模型和定序随机森林模型,这两个模型同Softmax多分类模型和定序Logit模型构成类Boosting算法。在处理数据中,当4个模型产生的预测值不完全相同时,该样本进入类Boosting模型继续进行训练,直到训练轮数超过某个阈值时,停止训练。然后,利用随机森林模型构建训练集的全部预测值到真实值的映射函数。所提算法在定序变量是任意分布时,仍然有较高的预测精度,极大地提升了定序Logit回归模型的适用范围。将所提算法用于白酒质量数据集、红酒质量数据集上对酒的质量进行预测时,其准确率优于定序Logit模型、多分类算法Softmax、多层感知机和KNN。
    参考文献 | 相关文章 | 多维度评价
    23. 基于隐马尔可夫模型的铁路出行团体关系预测研究
    王欣, 向明月, 李思颖, 赵若成
    计算机科学    2022, 49 (6A): 247-255.   DOI: 10.11896/jsjkx.210500001
    摘要120)      PDF(pc) (2440KB)(174)    收藏
    近年来,随着铁路交通网络和高铁技术的不断发展,铁路出行的快捷性和舒适性得到了大幅度提高,铁路出行被更多人选择,团队出行也变得更加普遍。旅客的出行行为通常会受同行旅客的影响,不同的出行团体有不同的出行偏好,如家庭团体出行时会考虑团体中的老人和小孩,更在意舒适度;年轻人组成的团体出行时会着重考虑体验感和新鲜感。因此,出行团体类型是研究该团体出行偏好的基础。基于此,文中提出了一种利用客票数据对铁路出行团体同行关系进行预测的方法。首先,基于铁路客票数据特点,提出了铁路出行团体同行次数的量化方法;然后,对隐马尔可夫模型在客票数据分析中的适用性进行了剖析,对基于隐马尔可夫模型的铁路出行团体关系预测问题进行了形式化定义。基于真实铁路购票数据,对构建的出行团体关系模型的预测准确性以及预测结果的一致性进行了验证,实验结果显示构建的模型的预测准确率高达96.38%,对于同一出行团体在不同时刻的预测结果的一致性达95%,由此认为所提方法能够高效且准确地预测铁路出行团体中的同行关系。
    参考文献 | 相关文章 | 多维度评价
    24. SDFA:基于多特征融合的船舶轨迹聚类方法研究
    郁舒昊, 周辉, 叶春杨, 王太正
    计算机科学    2022, 49 (6A): 256-260.   DOI: 10.11896/jsjkx.211100253
    摘要181)      PDF(pc) (2569KB)(231)    收藏
    随着航运业的快速发展,船舶轨迹挖掘与分析技术变得愈发重要,轨迹聚类在船舶领域有很多实际应用,如异常检测、位置预测、船舶避碰等。传统的轨迹相似度计算方法在精确度和效率上都较为低下,而现有的基于深度学习的方法大多数只提取静态特征,忽视了静态与动态的多特征的综合提取。为了解决这一问题,提出了一种基于卷积自编码器的静态-动态特征融合模型,用于提取更完善的船舶轨迹特征,弥补了多特征融合技术在船舶轨迹聚类应用方面的不足。在真实数据集上的实验结果表明,相比LCSS,DTW等传统方法以及基于深度学习的多特征提取模型,所提模型在精确率、准确率等指标上均至少有5%~10%的提升。
    参考文献 | 相关文章 | 多维度评价
    25. 基于DE-LSTM模型的教育统计数据预测研究
    刘宝宝, 杨菁菁, 陶露, 王贺应
    计算机科学    2022, 49 (6A): 261-266.   DOI: 10.11896/jsjkx.220300120
    摘要116)      PDF(pc) (2735KB)(186)    收藏
    当前,教育大数据呈现数据量大和数据类型多样的特点,准确有效地对教育统计数据进行分析和预测,对教育部门相关政策的制定和社会的发展具有重要的参考价值。文中以某市每年的招生人数为数据基础,提出了DE-LSTM模型,该模型通过差分进化算法(DE)对长短期记忆神经网络(LSTM)中的隐含层节点和学习率进行优化,使所提模型具有较好的预测性能,并与现有的BP神经网络预测模型、LSTM神经网络预测模型进行了对比。实验结果表明,提出的DE-LSTM预测模型具有较高的预测精度。
    参考文献 | 相关文章 | 多维度评价
    26. 基于用户场景的Android 应用服务推荐方法
    王毅, 李政浩, 陈星
    计算机科学    2022, 49 (6A): 267-271.   DOI: 10.11896/jsjkx.210700123
    摘要120)      PDF(pc) (3370KB)(156)    收藏
    随着移动设备硬件技术和5G等通信技术的发展,智能应用软件不断涌现,其提供的功能已涉及人们生活和工作的方方面面。大量的Android应用在满足人们日常生活需求的同时,也使得人们需要花更多的时间来找到他们想要启动的应用程序。为了让用户快速找到他们想要启动的应用程序并执行目标功能,文中提出了一种基于用户场景的Android应用服务推荐方法。具体来说,首先对用户场景进行分析,通过可访问性服务提取用户场景中的文本信息,然后采用基于知识库的方法,计算文本信息对应的标签,最后通过相似度计算,搜索服务库中与用户场景相关的服务,并将最相关的相似服务和互补服务推荐给用户。针对“豌豆荚”Android应用商店中的10个流行应用的300个Android应用服务进行方法评估,验证了所提方法的可行性和有效性。
    参考文献 | 相关文章 | 多维度评价
    27. 基于点割集图分割的矩阵变换与分解的推荐算法
    何亦琛, 毛宜军, 谢贤芬, 古万荣
    计算机科学    2022, 49 (6A): 272-279.   DOI: 10.11896/jsjkx.210600159
    摘要115)      PDF(pc) (3239KB)(145)    收藏
    基于模型的协同过滤算法通过矩阵分解来将用户偏好以及物品属性用隐变量来表示,但现有的矩阵分解算法很难应对个性化推荐系统中严重的数据稀疏性以及数据变化性所带来的问题。针对上述问题,提出了基于双边块对角矩阵的矩阵分解算法。首先通过基于社区发现的点割集图分割算法将原始的稀疏矩阵转换成双边块对角矩阵,将具有相同偏好的用户以及相似特征的物品归并到同一个对角块中,然后将结构中的对角块和双边拼接成数个密度较高的子矩阵。实验结果表明,对这几个密度有提高的子矩阵进行并行分解,基于其分解结果进行原始矩阵的预测,能够有效缓解矩阵分解中数据稀疏性所带来的问题,既能提升预测的精度,又能提高推荐结果的可解释性。同时,每个子对角块都能并行独立分解,能达到提高算法效率的目的。
    参考文献 | 相关文章 | 多维度评价
    28. 基于网络媒体的非线性动力学信息传播模型
    杜鸿毅, 杨华, 刘艳红, 杨鸿鹏
    计算机科学    2022, 49 (6A): 280-284.   DOI: 10.11896/jsjkx.210500043
    摘要92)      PDF(pc) (2359KB)(204)    收藏
    针对目前已有网络信息传播模型都假设信息网络中所有已感染节点都会感染易感染节点,不能客观地反映信息传播具有时效性的问题,文中基于平均场理论,从信息传播的宏观角度出发,提出了一个新的网络媒体信息传播动力学模型。根据网络信息传播的实际情况,所提模型假设只有新感染的节点才会感染信息网络中易感染节点,而且易感染节点有两种途径变为已感染节点,一种是社交网络中已感染节点的传播,另一种是用户随机浏览。进一步地,基于图论理论将模型中节点的状态及其转换关系抽象为加权有向图,并且基于贝叶斯定理,将节点间的状态转换表示为概率事件,给出了事件发生的概率表达式,进而确定了状态转化关系矩阵。最后,运用高斯-赛德尔迭代法对模型进行数值求解,数值仿真结果表明,在线媒体信息传播具有时效性,热点事件会在一天之内达到传播高峰,之后传播范围迅速下降。紧接着,运用百度指数热点事件的统计数据对模型进行有效性验证,结果表明,所提模型比传统模型能更准确地反映网络信息的扩散趋势。
    参考文献 | 相关文章 | 多维度评价
    29. 基于密度敏感距离和模糊划分的改进FCM算法
    毛森林, 夏镇, 耿新宇, 陈剑辉, 蒋宏霞
    计算机科学    2022, 49 (6A): 285-290.   DOI: 10.11896/jsjkx.210700042
    摘要115)      PDF(pc) (3386KB)(165)    收藏
    传统的模糊C均值(Fuzzy C-means,FCM)算法对噪声数据敏感,并且在迭代过程中因仅考虑了距离因素,故使用欧氏距离进行距离度量,这会导致只考虑样本点之间的局部一致性特征,而忽略全局一致性特征的问题,为此,提出了一种基于密度敏感距离和模糊划分的改进FCM算法。首先在建立相似度矩阵时使用密度敏感距离替代欧氏距离来进行计算,然后在聚类过程中引入模糊熵作为约束条件,推导出新的聚类中心和具有高斯分布特性的隶属度计算公式。此外,针对传统FCM算法随机选取初始聚类中心可能导致聚类结果不稳定的问题,根据聚类中心点周围样本点比较密集以及聚类中心点之间距离较远两个原则,结合密度敏感距离来选取初始聚类中心点。最后通过实验对比表明,与传统FCM聚类算法及其派生算法相比,改进算法不仅具有更高的聚类性能和抗噪性,且收敛速度也显著提高。
    参考文献 | 相关文章 | 多维度评价
    30. 基于隐半马尔可夫模型的微博流行信息检测方法
    谢柏林, 黎琦, 邝建
    计算机科学    2022, 49 (6A): 291-296.   DOI: 10.11896/jsjkx.210800011
    摘要108)      PDF(pc) (2256KB)(175)    收藏
    目前微博已成为人们发布信息和获取信息的一个重要平台。为了及早发现微博上的流行信息,以便及时发现微博上的热点事件,同时及时发现、抑制谣言信息的传播,使微博在网民的信息获取和信息发布中发挥更积极的作用,文中提出了一种基于隐半马尔可夫模型的微博流行信息检测方法。该方法以信息转发者的影响力等级和相邻两个转发者的时间间隔构建观测值,使用随机森林分类算法来自动得到转发者的影响力等级,利用隐半马尔可夫模型来刻画流行信息的传播过程,基于此来及早发现潜在的流行信息。该方法分为模型训练和流行信息检测两个阶段,在流行信息检测阶段,计算每条信息在传播过程中产生的观测序列相对于模型的平均对数似然概率,实时更新每条信息的流行度。使用采集的新浪微博数据集和Twitter数据集对所提方法进行了测试,实验结果表明了该方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共4页 共91条记录