1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    大数据&数据科学 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于主动重心的青年高血压患者心肺运动时序数据增强
    黄昉菀, 卢举鸿, 於志勇
    计算机科学    2023, 50 (6A): 211200233-11.   DOI: 10.11896/jsjkx.211200233
    摘要197)      PDF(pc) (2816KB)(196)    收藏
    精准医疗的逐步兴起,如挖掘青年高血压患者的心肺运动时序数据,可以了解不同个体对有氧运动训练的响应性,有助于提高患者高血压管理计划的制定效率,更有效地实现有氧运动干预的治疗。开展该研究的瓶颈之一在于难以获取充足的样本数据。为了解决获取数据难度大、成本高等问题,利用加权动态时间规整重心平均算法来进行时间序列数据增强,重点针对重心选择和权重分配进行了研究。针对重心选择问题,首次引入了主动重心的概念,提出了代表性重心与多样性重心选择策略,改善了数据增强的效果。此外,针对现有权重分配策略的不足,提出了随机权重距离递减分配策略,避免了合成重复样本,进一步提升了模型的泛化能力。实验结果表明,在该研究背景下同时考虑重心选择与权重分配进行数据增强,可以进一步提升青年高血压患者有氧运动干预疗效预测的准确性。
    参考文献 | 相关文章 | 多维度评价
    2. 一种时序情感记忆可约束可解释的序列推荐方法
    郑麟, 林艺璇, 周东霖, 朱福喜
    计算机科学    2023, 50 (6A): 220100066-8.   DOI: 10.11896/jsjkx.220100066
    摘要325)      PDF(pc) (3165KB)(292)    收藏
    序列推荐研究近年来在推荐领域中发展迅速,已有的序列推荐方法善于捕捉用户的时序行为来实现偏好预测。其中,一些先进的方法融入用户的情感信息来引导行为挖掘。然而,先进的基于情感的序列推荐模型未考虑对多类别的用户情感序列进行关联挖掘;并且,这类方法无法直观地解释时序情感对用户偏好的贡献。为了弥补上述方法的局限,本工作首次尝试以记忆体的形式存储时序情感并对其施加约束。具体地,文中提出了情感自我约束和情感相互约束两种机制,来挖掘多类别情感之间的关联并辅助用户行为完成序列推荐。进一步地,提出的记忆框架能记录用户的时序情感注意力,从而在准确预测用户时序偏好的基础上提供一定程度的直观解释。实验结果表明,所提方法的性能优于先进的序列推荐方法,并且比基于情感的序列推荐模型具有更好的可解释效果。
    参考文献 | 相关文章 | 多维度评价
    3. 基于改进CNN-BP的多波束声纳高程数据预测研究
    熊豪杰, 魏怡
    计算机科学    2023, 50 (6A): 220100161-4.   DOI: 10.11896/jsjkx.220100161
    摘要221)      PDF(pc) (2363KB)(201)    收藏
    为了建立精准的多波束声纳高程数据预测模型,解决人工鱼礁空方量预测准确性的问题,提出了一种基于改进卷积神经网络(Convolutional Neural Network,CNN)和BP神经网络组合模型的多波束声纳高程数据预测方法。首先,利用改进CNN对高程数据进行全卷积操作提取地形趋势特征,再输入到BP中进一步挖掘内部地形趋势变化规律,从而实现多波束声纳高程数据的预测。然后以某海底牧场的多波束声纳高程数据进行实验,并利用人工鱼礁的空方量进行交叉验证。最后,与传统克里金、BP、GA-BP、PSO-BP模型进行比较。结果表明:改进CNN-BP模型在多波束声纳高程数据和人工鱼礁空方量上的预测结果表现最优,验证了该方法的可行性、可靠性和精度高。
    参考文献 | 相关文章 | 多维度评价
    4. 基于图OLAP的学术网络分析
    杨恒, 朱焱
    计算机科学    2023, 50 (6A): 220100237-5.   DOI: 10.11896/jsjkx.220100237
    摘要217)      PDF(pc) (2894KB)(205)    收藏
    近年来学术领域逐渐积累了海量的数据,网络结构作为一种表示和分析大数据的有效方法,具有较丰富的维度且能够对现实生活中大量数据进行建模。Graph OLAP(图联机处理)技术继承了传统OLAP技术的相关思想,允许用户从不同角度与粒度对多维网络数据进行分析。然而现有的图OLAP技术大多围绕数据立方体的构建展开,相关操作大多都是传统OLAP技术在图数据上的简单扩展,并且构建的模型对网络自身的拓扑结构的挖掘能力较弱。为此,首先设计了学术网络星座模式和相关的图OLAP分析算法,更加明显地突出了学术网络的拓扑结构信息,提高了图OLAP的分析能力,其次提出了对应的物化策略,有效地提升了图OLAP分析的效率。
    参考文献 | 相关文章 | 多维度评价
    5. 基于多目标粒子群优化的属性网络局部社区检测算法
    周志强, 朱焱
    计算机科学    2023, 50 (6A): 220200015-6.   DOI: 10.11896/jsjkx.220200015
    摘要141)      PDF(pc) (2651KB)(197)    收藏
    社区结构是复杂网络中的重要特征,局部社区检测的目标是查询出包含一组种子节点的社区子图。传统的局部社区检测算法通常利用网络的拓扑结构进行社区查询,而忽略了网络中丰富的节点属性信息。针对现实中广泛存在的属性网络,提出了一种基于多目标粒子群优化的属性网络局部社区检测算法。首先根据节点与其多阶邻居之间的属性相似度构造属性关系边,并根据模体结构获取网络中的高阶信息得到拓扑关系边,然后基于种子节点使用随机游走算法对两种关系边采样得到备选节点集。在此基础上,通过多目标粒子群优化算法对备选节点集进行迭代筛选,得到拓扑结构紧密和节点属性同质的社区结构。在真实数据集上的实验结果表明,所提方法有效提升了局部社区检测的质量。
    参考文献 | 相关文章 | 多维度评价
    6. 面向交通流量预测的时空Graph-CoordAttention网络
    刘建松, 康雁, 李浩, 王韬, 王海宁
    计算机科学    2023, 50 (6A): 220200042-7.   DOI: 10.11896/jsjkx.220200042
    摘要234)      PDF(pc) (2713KB)(254)    收藏
    交通预测是城市智能交通系统的一个重要研究组成部分,使人们的出行更加效率和安全。由于复杂的时间和空间依赖性,准确预测交通流量仍然是一个巨大的挑战。近年来,图卷积网络(GCN)在交通预测方面表现出巨大的潜力,但基于GCN的模型往往侧重于单独捕捉时间和空间的依赖性,忽视了时间和空间依赖性之间的动态关联性,不能很好地融合它们。此外,以前的方法使用现实世界的静态交通网络来构建空间邻接矩阵,这可能忽略了动态的空间依赖性。为了克服这些局限性,并提高模型的性能,提出了一种新颖的时空Graph-CoordAttention网络(STGCA)。具体来说,提出了时空同步模块,用来建模不同时刻的时空依赖交融关系。然后,提出了一种动态图学习的方案,基于车流量之间数据关联,挖掘出潜在的图信息。在4个公开的数据集上和现有基线模型进行对比实验,STGCA表现了优异的性能。
    参考文献 | 相关文章 | 多维度评价
    7. 基于决策树改进深度交叉网络的推荐模型
    柯海萍, 毛宜军, 古万荣
    计算机科学    2023, 50 (6A): 220300084-7.   DOI: 10.11896/jsjkx.220300084
    摘要121)      PDF(pc) (2920KB)(231)    收藏
    特征挖掘是推荐算法模型中学习用户与物品之间交互行为的关键步骤,对提升推荐模型的准确度具有重要意义。现有的特征挖掘模型中,线性逻辑回归模型虽然简便,能够达到很好的拟合效果,但其泛化能力较弱,且模型对特征参数量的需求较大。深度交叉网络能够有效实现对特征的交叉提取,但其对数据特征的表征能力仍然不足。因此,文中引入多重残差结构与交叉编码思想,提出了一种基于决策树的方法来改进深度交叉网络的推荐模型。首先基于GBDT算法设计构建强化特征的树结构,加强模型对潜在特征的深度挖掘;其次对模型嵌入层的输入参数维度进行扩增优化;最后对改进的深度交叉网络推荐模型进行推荐预测。该设计不仅可以克服现有模型在泛化能力上的局限性,还能在保持特征参数量精简的同时令其表征能力有所加强,进而有效挖掘用户的隐藏关联,提高推荐的准确度。基于公测数据集的实验结果表明,所提出的模型预测效果比现有的特征交互方法更优。
    参考文献 | 相关文章 | 多维度评价
    8. 基于DBSCAN的动态邻域密度聚类算法
    张朋, 李小林, 王李妍
    计算机科学    2023, 50 (6A): 220400127-7.   DOI: 10.11896/jsjkx.220400127
    摘要103)      PDF(pc) (3072KB)(230)    收藏
    传统的密度聚类算法在聚类划分时不会考虑数据点间的属性差异,它将所有数据点都看成同质化的点。对此,在DBSCAN算法的基础上,提出了一种动态邻域密度聚类算法DN-DBSCAN(Dynamic Neighborhood-Density Based Spatial Clustering of Applications with Noise)。该算法在聚类时由样本点的属性决定其自身的邻域半径,因此各点的邻域半径是动态变化的,由此可将具有不同属性的点对集群产生的不一样的影响力体现在聚类结果之中,使密度聚类算法更具有现实意义。在算例分析的基础上,针对长三角城市群划分问题应用所提DN-DBSCAN算法进行分析求解,并对比分析DBSCAN算法、OPTICS算法和DPC算法的求解效果。结果显示,DN-DBSCAN算法能根据各城市属性的不同合理地划分出长三角城市群,准确率为95%,准确率分别高于上述3种对比算法85%,85%,88%,说明其具有更好的解决实际问题的能力。
    参考文献 | 相关文章 | 多维度评价
    9. 基于嵌套集合模型的时态层次数据管理方法
    杨振凯, 曹一冰, 赵鑫科, 郑景飚
    计算机科学    2023, 50 (6A): 220500290-5.   DOI: 10.11896/jsjkx.220500290
    摘要113)      PDF(pc) (2361KB)(177)    收藏
    时态层次数据是层次数据在时间维度的扩展,用于描述随时间变化的层次结构。相较于非时态层次数据,现有的时态层次数据管理方法仍存在存储方案复杂以及查询和更新效率低下等问题。针对上述问题,提出了一种基于嵌套集合模型的时态层次数据管理方法。首先从节点变化角度分析了层次数据变化的4种类型,在此基础上通过扩展时间标签字段实现了多版本节点在关系数据库中的存储和查询功能,最后提出了一种基于存量空间的嵌套集合模型(Abundantly Gapped Nested Intervals Scheme,AGNIS),用于解决主流嵌套集合模型插入数据记录效率较低的问题。基于我国2021-2022年行政区划及其调整数据的实验结果表明:提出的数据管理方法能够实现历史层次数据的存储和任意时刻层次结构快照的查询,且兼顾了时态层次数据查询和更新操作的高效性。
    参考文献 | 相关文章 | 多维度评价
    10. 改进的森林优化特征选择算法在信用评估中的应用
    黄宇航, 宋友, 王宝会
    计算机科学    2023, 50 (6A): 220600241-6.   DOI: 10.11896/jsjkx.220600241
    摘要251)      PDF(pc) (1795KB)(175)    收藏
    信用评估是金融领域的一个关键问题,它可以预测出一个用户是否存在拖欠风险,从而减少坏账损失。信用评估的关键挑战之一就是数据集存在着大量无效或冗余特征。为了解决该问题,提出了一种改进的森林优化特征选择算法(Improved Feature Selection using Forest Optimization Algorithm,IFSFOA)。该算法针对原始算法FSFOA的不足,在初始化阶段使用基于卡方校验的初始化策略代替随机化初始,提升算法寻优的能力;在局部播种阶段利用多层级变异策略,优化局部搜索能力,解决FSFOA的搜索空间受限和局部性问题;在更新候选森林时,使用贪婪选取策略挑选优质树,淘汰劣质树,收敛搜索发散过程。最后在涵盖了低维、中维和高维的公开信用评估数据集上设置对比实验,结果表明IFSFOA在分类和维度缩减方面的能力的综合表现均优于FSFOA和近年提出的较为高效的特征选择算法,验证了IFSFOA的有效性。
    参考文献 | 相关文章 | 多维度评价
    11. GDLIN:一种利用梯度下降的学习索引
    陈珊珊, 高隽, 马振禹
    计算机科学    2023, 50 (6A): 220600256-6.   DOI: 10.11896/jsjkx.220600256
    摘要97)      PDF(pc) (2402KB)(195)    收藏
    在大数据时代,数据访问速度是衡量大规模存储系统性能的一个重要指标,而索引是用于提升数据库系统中数据存取性能的主要技术之一。近几年,使用机器学习模型代替B+树等传统索引,拟合数据分布规律,将数据的间接查找优化为函数直接计算的学习索引(Learned Index,LI)被提出,LI提高了查询的速度,减少了索引空间开销。但是LI的拟合误差较大,不支持插入等修改性操作。文中提出了一种利用梯度下降算法拟合数据的学习索引模型GDLIN(A Learned Index By Gradient Descent)。GDLIN利用梯度下降算法更好地拟合数据,减少拟合误差,缩短本地查找的时间;同时递归调用数据拟合算法,充分利用键的分布规律,构建上层结构,避免索引结构随着数据量而增大。另外,GDLIN利用链表解决LI不支持数据插入的问题。实验结果表明,GDLIN在无新数据插入的情况下,吞吐量是B+树的2.1倍;在插入操作占比为50%的情况下,是LI的1.08倍。
    参考文献 | 相关文章 | 多维度评价
    12. 基于动态时空神经网络的城市交通流量预测方法
    孟祥福, 许睿航
    计算机科学    2023, 50 (6A): 220600266-7.   DOI: 10.11896/jsjkx.220600266
    摘要251)      PDF(pc) (2489KB)(213)    收藏
    交通流量预测对城市道路规划、交通安全问题和建设智慧城市等具有重要意义。然而,现有大部分交通预测模型无法很好地捕捉交通数据的动态时空相关性。针对该问题,提出了一种基于动态时空神经网络的城市交通流量预测方法。首先,通过对交通数据的最近周期依赖、日周期依赖和周周期依赖进行建模,在每个分量上使用三维卷积神经网络提取城市交通高维特征;然后,使用改进的残差结构捕捉远距离区域对与预测区域的相关度,融合空间注意力和时间注意力机制捕捉不同区域不同时间段上的交通流量之间的动态相关性;最后,使用基于参数矩阵的方法对3个分量的输出进行加权融合,得到预测结果。在TaxiBJ和BikeNYC两个公开数据集上开展实验,结果表明所提模型的预测性能优于主流交通预测模型。
    参考文献 | 相关文章 | 多维度评价
    13. 基于多模态特征融合的时间序列异常检测
    张国华, 燕雪峰, 关东海
    计算机科学    2023, 50 (6A): 220700094-7.   DOI: 10.11896/jsjkx.220700094
    摘要243)      PDF(pc) (2243KB)(299)    收藏
    多元时间序列的有效异常检测对于数据的分析挖掘具有重要意义。然而,已有的检测方法大多基于单模态,不能有效利用时间序列在多模态空间中的分布信息,对于多模态特征缺乏自适应融合方式且难以提取其时空依赖关系。为此,提出了一种多模态特征融合的时间序列异常检测方法,建立了一个多模态特征自适应融合模块,通过一维卷积网络和软选择方式对多元时间序列的多模态特征进行自适应融合。对于融合后的多模态特征,构建由时间注意力和空间注意力组成的时空注意力模块,同时提取其时间和空间依赖关系得到时空注意力向量,由时空注意力向量得到模型预测结果。通过学习正常样本分布,根据预测值与真实值的误差度量实现异常检测。在4个公开数据集上进行测试,结果表明,所提方法优于其他模型,证明了所提方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    14. 文本细粒度情绪识别方法与应用综述
    王希雅, 张宁, 程馨
    计算机科学    2023, 50 (6A): 220900137-7.   DOI: 10.11896/jsjkx.220900137
    摘要257)      PDF(pc) (1927KB)(275)    收藏
    互联网中海量文本包含的情绪信息,表达着公众观点与态度,如何识别与利用情绪资源已成为各领域的研究焦点。通过梳理细粒度情绪识别相关理论与文献,从分类方法与应用场景两方面进行总结归纳,讨论情绪识别技术面临的挑战及实践缺口。通过分析发现,细粒度情绪识别主要有基于情绪词典、统计机器学习与神经网络学习的方法,且多应用于商务分析与舆情管理中。针对未来研究趋势,首先可对网络情绪词实时更新、领域词典构建及语义分析等技术展开研究;其次,如何提升训练数据分类自动化、打造半监督学习模型亟待深入探讨;此外,商务分析与舆情管理的研究,可开展对方面提取与情绪识别融合的探索。文中对情绪识别技术与应用的总结评述,有望为后续研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    15. 区块链架构下医疗数据共享的三方演化博弈研究
    杨健, 王开选
    计算机科学    2023, 50 (6A): 221000080-7.   DOI: 10.11896/jsjkx.221000080
    摘要329)      PDF(pc) (3024KB)(264)    收藏
    为促进健康医疗大数据的发展,积极推动医疗数据安全共享,基于区块链架构,构建了系统管理方、数据提供方和数据需求方的三方演化博弈模型。首先,将前景理论与演化博弈模型相结合,利用前景价值函数对传统演化博弈的变量和参数进行改进;其次,讨论博弈均衡存在的可能性及其演化趋势;最后,通过数值模拟探讨不同因素对区块链架构下医疗数据共享各参与方的决策影响。结果表明,初始策略选择对博弈策略稳定性有显著影响。通过提高系统管理方的监管收益、降低数据提供方的感知损失以及提高数据需求方举报不合规行为的补偿可以加快系统的演化进程,增强参与方之间的信任,进而促进信任关系的形成。
    参考文献 | 相关文章 | 多维度评价
    16. 带关注度模糊序决策数据集的分布约简
    徐伟华, 张俊杰, 陈修伟
    计算机科学    2022, 49 (11A): 210700191-5.   DOI: 10.11896/jsjkx.210700191
    摘要266)      PDF(pc) (1759KB)(261)    收藏
    随着大数据时代的到来,数据的结构变得越来越复杂,数据集的维度变得越来越高,这极大地影响了数据挖掘的效率。因此,很有必要进行数据压缩或对信息系统进行属性约简,即去掉不必要的冗余属性,降低数据维度,提高数据挖掘效率。在现实生活中,人们对数据集中每个条件属性的关注度往往是不一样的。首先,在经典模糊决策数据集的基础上,对不同的条件属性进行加权,定义加权得分函数,进一步建立带关注度的模糊序决策信息系统。然后在该系统中引入分布函数,并通过分布可辨识矩阵建立求分布约简的方法。最后,通过案例分析验证了该方法的可行性。
    参考文献 | 相关文章 | 多维度评价
    17. 复杂网络社团发现综述
    潘雨, 王帅辉, 张磊, 胡谷雨, 邹军华, 王田丰, 潘志松
    计算机科学    2022, 49 (11A): 210800144-11.   DOI: 10.11896/jsjkx.210800144
    摘要186)      PDF(pc) (3022KB)(402)    收藏
    在复杂网络中,社团结构是广泛存在的重要潜在结构。挖掘复杂网络中的社团结构,对探索网络潜在特性、理解网络组织结构、发现网络隐藏规律和交互模式等具有重要的理论和现实意义,是网络分析任务的关键研究内容。介绍了社团发现的背景和意义,并从静态网络社团发现和动态网络社团发现两个方面对社团发现的方法进行了总结和梳理。其中,静态网络的社团发现包括基于划分的社团发现方法、基于层次聚类的社团发现方法、基于模块度的社团发现方法、基于非负矩阵分解的社团发现方法和基于深度学习的社团发现方法。动态网络社团发现包括增量聚类的社团发现方法和演化聚类的社团发现方法。另外介绍了常用的社团发现评价指标,并在最后讨论了社团发现所面临的一些挑战及未来的发展方向。
    参考文献 | 相关文章 | 多维度评价
    18. 一种基于图注意力聚合的POI推荐新方法
    蔡国永, 陈心怡, 王顺杰
    计算机科学    2022, 49 (11A): 210800149-5.   DOI: 10.11896/jsjkx.210800149
    摘要176)      PDF(pc) (2162KB)(330)    收藏
    在基于位置社交网络(Location-based Social Network,LBSNs)的服务中,有效的兴趣点(Point-of-Interest,POI)推荐具有极大的经济和社会效用,但如何深入理解LBSN中的位置、结构和行为等相关信息,并进行推理以及实现POI推荐仍然是一项挑战性任务。针对LBSNs中的多种异构数据,提出了一种能够挖掘用户社交和POI多种特征信息的用于POI推荐的图神经网络模型——POIR-GAT。首先POIR-GAT利用社交关系构建用户-用户图,并结合用户-POI交互图共同抽取用户特征向量;其次,基于POI的不同地理特征构造不同的特征矩阵,并通过矩阵分解获得不同的潜在因子,将这些潜在因子融入POI的特征向量,以学习它们对用户行为的共同影响,并用于实现融合社交因素和POI特征的推荐模型。通过在2个公开数据集上进行的实验,验证了所提POIR-GAT模型可以有效融合用户社交信息和POI特征信息,提高POI推荐质量。
    参考文献 | 相关文章 | 多维度评价
    19. 基于k-shell熵的影响力节点的排序与识别
    原慧琳, 冯宠
    计算机科学    2022, 49 (11A): 210800177-5.   DOI: 10.11896/jsjkx.210800177
    摘要292)      PDF(pc) (3741KB)(318)    收藏
    节点的影响力排序一直是复杂网络领域中最具有吸引力的一个问题,其对于衡量节点的传播能力有着重要的作用。由于网络中的节点的规模很大,研究者们希望能够更准确地估计节点的传播能力。文中基于信息论的基本概念和k-shell方法提出了一种新的影响力节点的排序方法,根据节点所在网络中的位置的拓扑信息来测量节点的传播能力。实验结果表明,该方法可以有效地识别网络中有影响力的节点,并且可以有效避免 k-shell法的“富人俱乐部现象”。
    参考文献 | 相关文章 | 多维度评价
    20. 基于加权马氏距离的模糊多核支持向量机
    戴小路, 汪廷华, 周慧颖
    计算机科学    2022, 49 (11A): 210800216-5.   DOI: 10.11896/jsjkx.210800216
    摘要259)      PDF(pc) (1789KB)(279)    收藏
    模糊支持向量机通过引入模糊隶属度有效区分不同样本的重要程度,降低了传统支持向量机对噪声数据的敏感性。针对基于欧氏距离设计的隶属度函数忽略了样本的总体分布,且未考虑样本特征重要性的区分,提出了一种基于加权马氏距离的模糊支持向量机方法。首先应用Relief-F算法计算样本特征权重,然后基于该权重计算样本距其类中心的加权马氏距离,最后根据该距离值度量样本隶属度。在此基础上,考虑到核函数及其核参数难以确定,将模糊支持向量机与多核学习方法相结合,提出基于加权马氏距离的模糊多核支持向量机,采用加权求和形式构建多核,并遵循中心核对齐原则确定每个核的权重。该方法不仅降低了弱相关特征对分类效果的影响,而且使数据表达更加全面准确。实验结果表明,基于加权马氏距离的模糊支持向量机的分类精度高于基于欧氏距离和基于马氏距离的模糊支持向量机,且基于加权马氏距离的模糊多核支持向量机的分类性能较单核模型更优。
    参考文献 | 相关文章 | 多维度评价
    21. 网络信息体系信息流程有效低频路径挖掘方法
    林文祥, 刘德生
    计算机科学    2022, 49 (11A): 211000001-6.   DOI: 10.11896/jsjkx.211000001
    摘要156)      PDF(pc) (3411KB)(255)    收藏
    随着信息技术和网络技术的迅猛发展及其在军事领域的广泛应用,网络信息体系应运而生。网络信息体系以信息为主导,主要的表现为其内含的信息活动流程。信息活动流程的合理性、高效性,直接影响信息在作战体系中的作战效能。采用流程挖掘技术从信息活动事件日志中发现信息活动流程模型,可为信息活动流程的建模、检验和增强提供有效支持。简单通过事件频率分析过滤日志中的噪声,容易导致有效低频路径丢失,降低挖掘的信息活动流程的准确性。结合军事信息活动的特殊性和信息传递的有效性特征,提出了一种基于结构聚合度的有效低频路径挖掘算法。仿真分析表明,该方法可成功分离日志噪声和有效低频路径,对挖掘真实有效的信息流程具有重要意义。
    参考文献 | 相关文章 | 多维度评价
    22. 基于Apriori算法填充数据及改进相似度的推荐算法
    董云薪, 林耿, 张清伟, 陈颖婷
    计算机科学    2022, 49 (11A): 211000005-5.   DOI: 10.11896/jsjkx.211000005
    摘要308)      PDF(pc) (2228KB)(308)    收藏
    针对协同过滤算法中存在的数据稀疏和算法精确度不高的问题,提出了一种融合关联规则的协同过滤算法。首先,利用关联规则Apriori算法挖掘出用户间潜在的联系,该潜在联系采用用户间的关联规则的置信度来表示,紧接着进一步构建用户置信度矩阵,用于填充用户评分矩阵。其次,利用置信度矩阵来改进传统的相似度计算公式,构建一个用户间的综合相似度计算公式。最后,利用填充过后的用户评分矩阵和用户间的综合相似度为用户进行推荐。所提算法相比传统算法具有更高的算法精度。此外,与其他算法相比,所提算法还能有效缓解推荐系统的长尾问题,从而进一步提高推荐系统的推荐质量。
    参考文献 | 相关文章 | 多维度评价
    23. 空间co-location模式的主导特征挖掘
    熊开放, 陈红梅, 王丽珍, 肖清
    计算机科学    2022, 49 (11A): 211000126-7.   DOI: 10.11896/jsjkx.211000126
    摘要154)      PDF(pc) (3167KB)(306)    收藏
    空间co-location模式是空间特征的子集,它们的实例在邻域内频繁并置出现。传统co-location模式不区分模式中特征的重要性,忽略了特征间的主导关系。主导特征co-location模式考虑模式中特征的不平等性,分析特征间的主导关系,具有重要的应用意义。然而,现有主导特征模式挖掘没有从特征实例分布的角度综合考虑一个特征主导其他特征的可能倾向和影响强度,使得挖掘的主导特征及模式没有较好地反映特征间的主导关系。首先分析co-location模式中特征实例的空间分布,提出模式主导度,用以度量模式中某个特征主导其他特征的可能倾向;提出主导影响度,用以度量模式中某个特征主导其他特征的影响强度;基于这两个新度量,提出co-location模式的主导特征挖掘。然后通过优化新度量的计算,提出有效的主导特征co-location模式挖掘算法。在真实数据集和合成数据集上开展大量实验,验证了所提方法能够有效地识别co-location模式中的主导特征,所提算法能够高效地挖掘主导特征及模式。
    参考文献 | 相关文章 | 多维度评价
    24. 基于记忆增强 GAN 的异常检测
    周士金, 邢红杰
    计算机科学    2022, 49 (11A): 211000202-9.   DOI: 10.11896/jsjkx.211000202
    摘要556)      PDF(pc) (3189KB)(422)    收藏
    基于生成式对抗网络(Generative Adversarial Networks,GAN)的异常检测方法在训练阶段训练集仅由正常数据构成,当训练数据较为充分时,它在该训练集上能够取得较小的重构误差。然而在测试阶段,正常数据的重构误差和部分异常数据的重构误差之间的差别很小,使得基于GAN的异常检测方法的判别性能较差。为了解决该问题,提出了基于记忆增强GAN的异常检测方法。在基于GAN的异常检测方法中加入记忆增强模块,使模型能够记忆正常数据的特征,从而使得异常数据的重构误差变大,该方法的判别性能得到增强。在MNIST,Fashion-MNIST和CIFAR-10上的实验结果表明,与相关方法相比,所提方法具有更优的检测性能。
    参考文献 | 相关文章 | 多维度评价
    25. 基于核心节点影响力的社区发现方法
    原慧琳, 韩真, 冯宠, 黄碧, 刘军涛
    计算机科学    2022, 49 (11A): 211100002-7.   DOI: 10.11896/jsjkx.211100002
    摘要224)      PDF(pc) (3274KB)(309)    收藏
    社区发现是复杂网络研究领域的一个热点问题,目前已经有许多局部社区发现算法被提出用于快速发现高质量的社区,不过它们往往存在种子节点依赖或是稳定性问题。因此,部分算法试图根据核心节点被邻居高度包围且相互之间距离较远的拓扑特性来精确地锁定种子节点以避免上述问题,但距离的计算使得其时间复杂度较高。文中提出了一种基于核心节点影响力的社区发现方法CDIC,该方法首先根据核心节点的拓扑特性和网络邻接信息寻找所有可能是核心的节点,之后利用真正核心节点影响力较高的性质和标签传播的思想来扩张社区,并淘汰被误选为核心的节点以避免种子依赖问题,同时不涉及最短距离的计算也保证了较低的时间复杂度,最后依据相似度理论提出了一种社区对节点的吸引力来合并特异节点,以保证算法结果的稳定性。将CDIC与6种经典算法以及2种近年来提出的算法在64个人工网络和4个真实网络上进行仿真实验,并对其社区划分结果对应的标准化互信息值和纯度进行了比较,结果表明了CDIC的有效性。
    参考文献 | 相关文章 | 多维度评价
    26. 基于属性图注意力网络的电影推荐模型
    孙开伟, 刘松, 杜雨露
    计算机科学    2022, 49 (11A): 211100106-8.   DOI: 10.11896/jsjkx.211100106
    摘要230)      PDF(pc) (3128KB)(296)    收藏
    近年来,图网络被广泛应用于推荐领域并取得了较大进展,但是现有方法往往侧重于用户项目的交互建模,从而性能容易受到数据稀疏问题的限制。因此文中利用额外的属性信息,提出了一种基于属性图注意力网络的电影推荐模型。首先提出了一种基于注意力的GNN,采用显式反馈来计算实体和属性间的注意力得分,相比较使用拉普拉斯矩阵的聚合方式,能够更有效地区分不同属性对实体的影响,在属性和实体间信息聚合上更加有效。此外,由于不同实体受属性影响和行为影响的程度不同,文中设计了一种细粒度偏好融合策略,将属性群体偏好和个人行为偏好这两个方面的偏好更好地结合在一起,使实体的嵌入表示更加全面准确和个性化。在真实的数据集上进行实验,结果表明所提推荐方法充分利用属性图中蕴含的属性信息能够有效缓解数据稀疏问题,并且在电影推荐的两个评价指标召回率和nDCG上都明显优于其他基准算法。
    参考文献 | 相关文章 | 多维度评价
    27. 基于模糊邻域系统的模糊粗糙集模型
    冉虹, 候婷, 贺龙雨, 秦克云
    计算机科学    2022, 49 (11A): 211100224-5.   DOI: 10.11896/jsjkx.211100224
    摘要262)      PDF(pc) (1773KB)(301)    收藏
    针对模糊邻域系统,提出了基于一般模糊逻辑算子的模糊粗糙上、下近似算子并探讨了算子的基本性质。然后将邻域系统串行、自反、对称、一元、欧几里得的概念推广到模糊邻域系统。最后研究了当模糊邻域系统是串行、自反、对称、一元、欧几里得时模糊粗糙近似算子的相关代数结构。
    参考文献 | 相关文章 | 多维度评价
    28. 基于多源健康感知数据动静态关系融合的疾病诊断
    霍甜媛, 顾晶晶
    计算机科学    2022, 49 (11A): 211100241-9.   DOI: 10.11896/jsjkx.211100241
    摘要201)      PDF(pc) (3300KB)(277)    收藏
    疾病诊断是电子健康记录数据挖掘的热门研究领域,也是实现医疗诊断智能化的一个重要环节。但是,电子健康记录中健康感知数据的来源多样、数据结构复杂,且不同类型的数据之间有着潜在的相关性,在进行特征提取和挖掘分析过程中存在着异构数据应该如何融合的问题。只有对医学感测数据、个人体质记录数据、疾病间关系数据进行综合考虑,挖掘其中的相关隐藏特征,才能对多种类别疾病进行更准确的诊断。因此,基于多源健康感知数据动静态关系融合的疾病诊断模型(DSRF)首先通过动静态关系融合算法解决动态医学感测数据和静态体质记录数据的异构性问题并挖掘其相关关系,然后计算多类别疾病的关联矩阵来提取疾病间依赖关系,最后在门控循环单元网络架构的基础上将多种健康感知数据进行融合,完成了多源异构数据的综合分析。在美国MIMIC-III临床数据集上的实验结果证明,相比同类型主流模型,该模型可以更准确地对多种类别疾病进行联合诊断。
    参考文献 | 相关文章 | 多维度评价
    29. 基于公理化模糊集合的模糊随机事件及其概率
    谢健祥, 潘小东, 张波
    计算机科学    2022, 49 (11A): 211100242-7.   DOI: 10.11896/jsjkx.211100242
    摘要143)      PDF(pc) (1828KB)(318)    收藏
    基于公理化模糊集合研究模糊随机事件的概率,定义了模糊随机事件以及相应的概率,讨论了模糊随机事件概率的一些基本性质,给出了模糊随机事件概率的乘法公式,证明了模糊随机事件的全概率公式和贝叶斯公式。
    参考文献 | 相关文章 | 多维度评价
    30. 基于分数线预测的多特征融合高考志愿推荐算法
    王泽卿, 季圣鹏, 李鑫, 赵子轩, 王鹏旭, 韩霄松
    计算机科学    2022, 49 (11A): 211100266-7.   DOI: 10.11896/jsjkx.211100266
    摘要658)      PDF(pc) (2646KB)(670)    收藏
    近年来,随着我国高考人数逐年增多,考生对高考志愿填报服务的需求日益增加。面对海量的院校填报信息,考生往往很难在短期内做出比较符合自身意愿的合理选择,进而导致报考事故的发生。因此,针对高考志愿报名问题,在爬取历年高考录取数据的基础上,提出一种基于分数线预测的多特征融合推荐算法(Reco-PMF)。该算法首先利用历年高校最低投档位次,通过BP神经网络预测报考年份各高校最低投档位次以及最低投档分数线,然后根据考生分数进行院校初筛,进而构建3种与录取分数相关的特征,结合院校软科排名,通过遗传算法进行权值寻优,得到不同院校的录取概率,并在此基础上定义推荐度实现为考生进行不同录取风险层次的高校推荐,形成完整的推荐结果。实验结果表明,基于BP神经网络的高校录取分数预测算法在不同误差限下的表现均优于其他算法;相比百度和夸克的已有服务,所提算法在多层次测试分数下,平均录取率分别提升14.8%和24.1%,同时成功录取院校的平均位次分别提升了99名和87名。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共4页 共106条记录