1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    大数据&数据科学 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于主动重心的青年高血压患者心肺运动时序数据增强
    黄昉菀, 卢举鸿, 於志勇
    计算机科学    2023, 50 (6A): 211200233-11.   DOI: 10.11896/jsjkx.211200233
    摘要242)      PDF(pc) (2816KB)(232)    收藏
    精准医疗的逐步兴起,如挖掘青年高血压患者的心肺运动时序数据,可以了解不同个体对有氧运动训练的响应性,有助于提高患者高血压管理计划的制定效率,更有效地实现有氧运动干预的治疗。开展该研究的瓶颈之一在于难以获取充足的样本数据。为了解决获取数据难度大、成本高等问题,利用加权动态时间规整重心平均算法来进行时间序列数据增强,重点针对重心选择和权重分配进行了研究。针对重心选择问题,首次引入了主动重心的概念,提出了代表性重心与多样性重心选择策略,改善了数据增强的效果。此外,针对现有权重分配策略的不足,提出了随机权重距离递减分配策略,避免了合成重复样本,进一步提升了模型的泛化能力。实验结果表明,在该研究背景下同时考虑重心选择与权重分配进行数据增强,可以进一步提升青年高血压患者有氧运动干预疗效预测的准确性。
    参考文献 | 相关文章 | 多维度评价
    2. 一种时序情感记忆可约束可解释的序列推荐方法
    郑麟, 林艺璇, 周东霖, 朱福喜
    计算机科学    2023, 50 (6A): 220100066-8.   DOI: 10.11896/jsjkx.220100066
    摘要373)      PDF(pc) (3165KB)(332)    收藏
    序列推荐研究近年来在推荐领域中发展迅速,已有的序列推荐方法善于捕捉用户的时序行为来实现偏好预测。其中,一些先进的方法融入用户的情感信息来引导行为挖掘。然而,先进的基于情感的序列推荐模型未考虑对多类别的用户情感序列进行关联挖掘;并且,这类方法无法直观地解释时序情感对用户偏好的贡献。为了弥补上述方法的局限,本工作首次尝试以记忆体的形式存储时序情感并对其施加约束。具体地,文中提出了情感自我约束和情感相互约束两种机制,来挖掘多类别情感之间的关联并辅助用户行为完成序列推荐。进一步地,提出的记忆框架能记录用户的时序情感注意力,从而在准确预测用户时序偏好的基础上提供一定程度的直观解释。实验结果表明,所提方法的性能优于先进的序列推荐方法,并且比基于情感的序列推荐模型具有更好的可解释效果。
    参考文献 | 相关文章 | 多维度评价
    3. 基于改进CNN-BP的多波束声纳高程数据预测研究
    熊豪杰, 魏怡
    计算机科学    2023, 50 (6A): 220100161-4.   DOI: 10.11896/jsjkx.220100161
    摘要250)      PDF(pc) (2363KB)(225)    收藏
    为了建立精准的多波束声纳高程数据预测模型,解决人工鱼礁空方量预测准确性的问题,提出了一种基于改进卷积神经网络(Convolutional Neural Network,CNN)和BP神经网络组合模型的多波束声纳高程数据预测方法。首先,利用改进CNN对高程数据进行全卷积操作提取地形趋势特征,再输入到BP中进一步挖掘内部地形趋势变化规律,从而实现多波束声纳高程数据的预测。然后以某海底牧场的多波束声纳高程数据进行实验,并利用人工鱼礁的空方量进行交叉验证。最后,与传统克里金、BP、GA-BP、PSO-BP模型进行比较。结果表明:改进CNN-BP模型在多波束声纳高程数据和人工鱼礁空方量上的预测结果表现最优,验证了该方法的可行性、可靠性和精度高。
    参考文献 | 相关文章 | 多维度评价
    4. 基于图OLAP的学术网络分析
    杨恒, 朱焱
    计算机科学    2023, 50 (6A): 220100237-5.   DOI: 10.11896/jsjkx.220100237
    摘要258)      PDF(pc) (2894KB)(232)    收藏
    近年来学术领域逐渐积累了海量的数据,网络结构作为一种表示和分析大数据的有效方法,具有较丰富的维度且能够对现实生活中大量数据进行建模。Graph OLAP(图联机处理)技术继承了传统OLAP技术的相关思想,允许用户从不同角度与粒度对多维网络数据进行分析。然而现有的图OLAP技术大多围绕数据立方体的构建展开,相关操作大多都是传统OLAP技术在图数据上的简单扩展,并且构建的模型对网络自身的拓扑结构的挖掘能力较弱。为此,首先设计了学术网络星座模式和相关的图OLAP分析算法,更加明显地突出了学术网络的拓扑结构信息,提高了图OLAP的分析能力,其次提出了对应的物化策略,有效地提升了图OLAP分析的效率。
    参考文献 | 相关文章 | 多维度评价
    5. 基于多目标粒子群优化的属性网络局部社区检测算法
    周志强, 朱焱
    计算机科学    2023, 50 (6A): 220200015-6.   DOI: 10.11896/jsjkx.220200015
    摘要164)      PDF(pc) (2651KB)(222)    收藏
    社区结构是复杂网络中的重要特征,局部社区检测的目标是查询出包含一组种子节点的社区子图。传统的局部社区检测算法通常利用网络的拓扑结构进行社区查询,而忽略了网络中丰富的节点属性信息。针对现实中广泛存在的属性网络,提出了一种基于多目标粒子群优化的属性网络局部社区检测算法。首先根据节点与其多阶邻居之间的属性相似度构造属性关系边,并根据模体结构获取网络中的高阶信息得到拓扑关系边,然后基于种子节点使用随机游走算法对两种关系边采样得到备选节点集。在此基础上,通过多目标粒子群优化算法对备选节点集进行迭代筛选,得到拓扑结构紧密和节点属性同质的社区结构。在真实数据集上的实验结果表明,所提方法有效提升了局部社区检测的质量。
    参考文献 | 相关文章 | 多维度评价
    6. 面向交通流量预测的时空Graph-CoordAttention网络
    刘建松, 康雁, 李浩, 王韬, 王海宁
    计算机科学    2023, 50 (6A): 220200042-7.   DOI: 10.11896/jsjkx.220200042
    摘要276)      PDF(pc) (2713KB)(288)    收藏
    交通预测是城市智能交通系统的一个重要研究组成部分,使人们的出行更加效率和安全。由于复杂的时间和空间依赖性,准确预测交通流量仍然是一个巨大的挑战。近年来,图卷积网络(GCN)在交通预测方面表现出巨大的潜力,但基于GCN的模型往往侧重于单独捕捉时间和空间的依赖性,忽视了时间和空间依赖性之间的动态关联性,不能很好地融合它们。此外,以前的方法使用现实世界的静态交通网络来构建空间邻接矩阵,这可能忽略了动态的空间依赖性。为了克服这些局限性,并提高模型的性能,提出了一种新颖的时空Graph-CoordAttention网络(STGCA)。具体来说,提出了时空同步模块,用来建模不同时刻的时空依赖交融关系。然后,提出了一种动态图学习的方案,基于车流量之间数据关联,挖掘出潜在的图信息。在4个公开的数据集上和现有基线模型进行对比实验,STGCA表现了优异的性能。
    参考文献 | 相关文章 | 多维度评价
    7. 基于决策树改进深度交叉网络的推荐模型
    柯海萍, 毛宜军, 古万荣
    计算机科学    2023, 50 (6A): 220300084-7.   DOI: 10.11896/jsjkx.220300084
    摘要128)      PDF(pc) (2920KB)(270)    收藏
    特征挖掘是推荐算法模型中学习用户与物品之间交互行为的关键步骤,对提升推荐模型的准确度具有重要意义。现有的特征挖掘模型中,线性逻辑回归模型虽然简便,能够达到很好的拟合效果,但其泛化能力较弱,且模型对特征参数量的需求较大。深度交叉网络能够有效实现对特征的交叉提取,但其对数据特征的表征能力仍然不足。因此,文中引入多重残差结构与交叉编码思想,提出了一种基于决策树的方法来改进深度交叉网络的推荐模型。首先基于GBDT算法设计构建强化特征的树结构,加强模型对潜在特征的深度挖掘;其次对模型嵌入层的输入参数维度进行扩增优化;最后对改进的深度交叉网络推荐模型进行推荐预测。该设计不仅可以克服现有模型在泛化能力上的局限性,还能在保持特征参数量精简的同时令其表征能力有所加强,进而有效挖掘用户的隐藏关联,提高推荐的准确度。基于公测数据集的实验结果表明,所提出的模型预测效果比现有的特征交互方法更优。
    参考文献 | 相关文章 | 多维度评价
    8. 基于DBSCAN的动态邻域密度聚类算法
    张朋, 李小林, 王李妍
    计算机科学    2023, 50 (6A): 220400127-7.   DOI: 10.11896/jsjkx.220400127
    摘要132)      PDF(pc) (3072KB)(259)    收藏
    传统的密度聚类算法在聚类划分时不会考虑数据点间的属性差异,它将所有数据点都看成同质化的点。对此,在DBSCAN算法的基础上,提出了一种动态邻域密度聚类算法DN-DBSCAN(Dynamic Neighborhood-Density Based Spatial Clustering of Applications with Noise)。该算法在聚类时由样本点的属性决定其自身的邻域半径,因此各点的邻域半径是动态变化的,由此可将具有不同属性的点对集群产生的不一样的影响力体现在聚类结果之中,使密度聚类算法更具有现实意义。在算例分析的基础上,针对长三角城市群划分问题应用所提DN-DBSCAN算法进行分析求解,并对比分析DBSCAN算法、OPTICS算法和DPC算法的求解效果。结果显示,DN-DBSCAN算法能根据各城市属性的不同合理地划分出长三角城市群,准确率为95%,准确率分别高于上述3种对比算法85%,85%,88%,说明其具有更好的解决实际问题的能力。
    参考文献 | 相关文章 | 多维度评价
    9. 基于嵌套集合模型的时态层次数据管理方法
    杨振凯, 曹一冰, 赵鑫科, 郑景飚
    计算机科学    2023, 50 (6A): 220500290-5.   DOI: 10.11896/jsjkx.220500290
    摘要129)      PDF(pc) (2361KB)(199)    收藏
    时态层次数据是层次数据在时间维度的扩展,用于描述随时间变化的层次结构。相较于非时态层次数据,现有的时态层次数据管理方法仍存在存储方案复杂以及查询和更新效率低下等问题。针对上述问题,提出了一种基于嵌套集合模型的时态层次数据管理方法。首先从节点变化角度分析了层次数据变化的4种类型,在此基础上通过扩展时间标签字段实现了多版本节点在关系数据库中的存储和查询功能,最后提出了一种基于存量空间的嵌套集合模型(Abundantly Gapped Nested Intervals Scheme,AGNIS),用于解决主流嵌套集合模型插入数据记录效率较低的问题。基于我国2021-2022年行政区划及其调整数据的实验结果表明:提出的数据管理方法能够实现历史层次数据的存储和任意时刻层次结构快照的查询,且兼顾了时态层次数据查询和更新操作的高效性。
    参考文献 | 相关文章 | 多维度评价
    10. 改进的森林优化特征选择算法在信用评估中的应用
    黄宇航, 宋友, 王宝会
    计算机科学    2023, 50 (6A): 220600241-6.   DOI: 10.11896/jsjkx.220600241
    摘要257)      PDF(pc) (1795KB)(191)    收藏
    信用评估是金融领域的一个关键问题,它可以预测出一个用户是否存在拖欠风险,从而减少坏账损失。信用评估的关键挑战之一就是数据集存在着大量无效或冗余特征。为了解决该问题,提出了一种改进的森林优化特征选择算法(Improved Feature Selection using Forest Optimization Algorithm,IFSFOA)。该算法针对原始算法FSFOA的不足,在初始化阶段使用基于卡方校验的初始化策略代替随机化初始,提升算法寻优的能力;在局部播种阶段利用多层级变异策略,优化局部搜索能力,解决FSFOA的搜索空间受限和局部性问题;在更新候选森林时,使用贪婪选取策略挑选优质树,淘汰劣质树,收敛搜索发散过程。最后在涵盖了低维、中维和高维的公开信用评估数据集上设置对比实验,结果表明IFSFOA在分类和维度缩减方面的能力的综合表现均优于FSFOA和近年提出的较为高效的特征选择算法,验证了IFSFOA的有效性。
    参考文献 | 相关文章 | 多维度评价
    11. GDLIN:一种利用梯度下降的学习索引
    陈珊珊, 高隽, 马振禹
    计算机科学    2023, 50 (6A): 220600256-6.   DOI: 10.11896/jsjkx.220600256
    摘要107)      PDF(pc) (2402KB)(228)    收藏
    在大数据时代,数据访问速度是衡量大规模存储系统性能的一个重要指标,而索引是用于提升数据库系统中数据存取性能的主要技术之一。近几年,使用机器学习模型代替B+树等传统索引,拟合数据分布规律,将数据的间接查找优化为函数直接计算的学习索引(Learned Index,LI)被提出,LI提高了查询的速度,减少了索引空间开销。但是LI的拟合误差较大,不支持插入等修改性操作。文中提出了一种利用梯度下降算法拟合数据的学习索引模型GDLIN(A Learned Index By Gradient Descent)。GDLIN利用梯度下降算法更好地拟合数据,减少拟合误差,缩短本地查找的时间;同时递归调用数据拟合算法,充分利用键的分布规律,构建上层结构,避免索引结构随着数据量而增大。另外,GDLIN利用链表解决LI不支持数据插入的问题。实验结果表明,GDLIN在无新数据插入的情况下,吞吐量是B+树的2.1倍;在插入操作占比为50%的情况下,是LI的1.08倍。
    参考文献 | 相关文章 | 多维度评价
    12. 基于动态时空神经网络的城市交通流量预测方法
    孟祥福, 许睿航
    计算机科学    2023, 50 (6A): 220600266-7.   DOI: 10.11896/jsjkx.220600266
    摘要298)      PDF(pc) (2489KB)(242)    收藏
    交通流量预测对城市道路规划、交通安全问题和建设智慧城市等具有重要意义。然而,现有大部分交通预测模型无法很好地捕捉交通数据的动态时空相关性。针对该问题,提出了一种基于动态时空神经网络的城市交通流量预测方法。首先,通过对交通数据的最近周期依赖、日周期依赖和周周期依赖进行建模,在每个分量上使用三维卷积神经网络提取城市交通高维特征;然后,使用改进的残差结构捕捉远距离区域对与预测区域的相关度,融合空间注意力和时间注意力机制捕捉不同区域不同时间段上的交通流量之间的动态相关性;最后,使用基于参数矩阵的方法对3个分量的输出进行加权融合,得到预测结果。在TaxiBJ和BikeNYC两个公开数据集上开展实验,结果表明所提模型的预测性能优于主流交通预测模型。
    参考文献 | 相关文章 | 多维度评价
    13. 基于多模态特征融合的时间序列异常检测
    张国华, 燕雪峰, 关东海
    计算机科学    2023, 50 (6A): 220700094-7.   DOI: 10.11896/jsjkx.220700094
    摘要269)      PDF(pc) (2243KB)(361)    收藏
    多元时间序列的有效异常检测对于数据的分析挖掘具有重要意义。然而,已有的检测方法大多基于单模态,不能有效利用时间序列在多模态空间中的分布信息,对于多模态特征缺乏自适应融合方式且难以提取其时空依赖关系。为此,提出了一种多模态特征融合的时间序列异常检测方法,建立了一个多模态特征自适应融合模块,通过一维卷积网络和软选择方式对多元时间序列的多模态特征进行自适应融合。对于融合后的多模态特征,构建由时间注意力和空间注意力组成的时空注意力模块,同时提取其时间和空间依赖关系得到时空注意力向量,由时空注意力向量得到模型预测结果。通过学习正常样本分布,根据预测值与真实值的误差度量实现异常检测。在4个公开数据集上进行测试,结果表明,所提方法优于其他模型,证明了所提方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    14. 文本细粒度情绪识别方法与应用综述
    王希雅, 张宁, 程馨
    计算机科学    2023, 50 (6A): 220900137-7.   DOI: 10.11896/jsjkx.220900137
    摘要326)      PDF(pc) (1927KB)(319)    收藏
    互联网中海量文本包含的情绪信息,表达着公众观点与态度,如何识别与利用情绪资源已成为各领域的研究焦点。通过梳理细粒度情绪识别相关理论与文献,从分类方法与应用场景两方面进行总结归纳,讨论情绪识别技术面临的挑战及实践缺口。通过分析发现,细粒度情绪识别主要有基于情绪词典、统计机器学习与神经网络学习的方法,且多应用于商务分析与舆情管理中。针对未来研究趋势,首先可对网络情绪词实时更新、领域词典构建及语义分析等技术展开研究;其次,如何提升训练数据分类自动化、打造半监督学习模型亟待深入探讨;此外,商务分析与舆情管理的研究,可开展对方面提取与情绪识别融合的探索。文中对情绪识别技术与应用的总结评述,有望为后续研究提供参考。
    参考文献 | 相关文章 | 多维度评价
    15. 区块链架构下医疗数据共享的三方演化博弈研究
    杨健, 王开选
    计算机科学    2023, 50 (6A): 221000080-7.   DOI: 10.11896/jsjkx.221000080
    摘要388)      PDF(pc) (3024KB)(314)    收藏
    为促进健康医疗大数据的发展,积极推动医疗数据安全共享,基于区块链架构,构建了系统管理方、数据提供方和数据需求方的三方演化博弈模型。首先,将前景理论与演化博弈模型相结合,利用前景价值函数对传统演化博弈的变量和参数进行改进;其次,讨论博弈均衡存在的可能性及其演化趋势;最后,通过数值模拟探讨不同因素对区块链架构下医疗数据共享各参与方的决策影响。结果表明,初始策略选择对博弈策略稳定性有显著影响。通过提高系统管理方的监管收益、降低数据提供方的感知损失以及提高数据需求方举报不合规行为的补偿可以加快系统的演化进程,增强参与方之间的信任,进而促进信任关系的形成。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共15条记录