1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    数据库&大数据&数据科学 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. ST-WaveMLP:面向交通流量预测的时空全局感知网络模型
    包锴楠, 张钧波, 宋礼, 李天瑞
    计算机科学    2024, 51 (5): 27-34.   DOI: 10.11896/jsjkx.230100086
    摘要186)      PDF(pc) (3240KB)(289)    收藏
    交通流量预测在智能交通系统中起着至关重要的作用。精准的交通流量预测不仅能帮助城市管理者进行更好的交通管理,也能帮助人们制定合适的出行计划。然而精准预测交通流量颇具挑战性,主要难点在于如何捕获交通流量数据中复杂的时空依赖性。近年来,深度学习方法已被成功应用于网格交通流量预测,主要采用深度卷积神经网络来捕获时空依赖性。但是卷积神经网络主要关注数据中空间特征的提取与整合,难以充分挖掘其中复杂的时空依赖性,而且单层卷积网络只能捕获局部空间依赖,因此,要想捕获全局空间依赖就需要对超多层的卷积网络进行堆叠,这将使整个网络模型训练收敛速度变慢。为了解决些问题,提出了一种面向交通流量预测的全局感知时空网络模型ST-WaveMLP,主要使用以多层感知机(MLP)为基础的可重复结构ST-WaveBlock来捕获相关的时空依赖。ST-WaveBlock中包含了捕获全局空间依赖和局部时间依赖的模块(SGAC),以及用于捕获局部空间依赖和全局时间依赖的模块(SLAC)。ST-WaveBlock具有较强的时空表征学习能力,通常仅用2~4个ST-WaveBlock堆叠就能有效捕获数据中的时空依赖性。最后,在4个实际交通流量数据集上进行实验验证,结果表明ST-WaveMLP具有更好的收敛性以及更高的预测精度,相较于之前最好的方法,所提方法预测精度的提升最高可达9.57%,模型收敛速度的提升最高可达30.6%。
    参考文献 | 相关文章 | 多维度评价
    2. 基于对抗策略类别特定的多样性时间序列shapelets提取
    罗颖, 万源, 王礼勤
    计算机科学    2024, 51 (5): 35-44.   DOI: 10.11896/jsjkx.230200074
    摘要90)      PDF(pc) (2780KB)(124)    收藏
    在时间序列分类任务中,通过提取时间序列的shapelets进行分类的方法因分类准确率高且具有良好的可解释性而受到广泛关注。针对现有方法学习到的shapelets是所有类共享,可以区分大多数类但不能准确地区分某一类和其他类,以及使用对抗策略的模型生成的shapelets存在多样性不足等问题,提出了一种基于对抗策略类别特定的多样性时间序列shapelets提取方法。该方法将类别信息嵌入时间序列,采用多生成器模块对抗地生成多个有差别的类别特定shapelets,再通过施加差异约束来提高shapelets的多样性,最后使用shapelet转换得到的特征对时间序列进行分类。在36个时间序列数据集上与5种基于shapelets的算法和11种先进的分类算法进行实验对比,实验结果表明,所提方法分别在36个数据集中的26个和20个数据集上取得了最优结果,且均取得了最高的平均秩,平均分类准确率相比其他方法最少提高了2.4%,最多提高了17.8%。消融性分析以及可视化分析验证了多样性和类别特定的思路在时间序列分类上的有效性。
    参考文献 | 相关文章 | 多维度评价
    3. 融入时间信息的预训练序列推荐方法
    陈稳中, 陈红梅, 周丽华, 方圆
    计算机科学    2024, 51 (5): 45-53.   DOI: 10.11896/jsjkx.230200049
    摘要95)      PDF(pc) (2607KB)(130)    收藏
    序列推荐旨在根据用户与项目的历史交互序列,学习用户动态偏好,为用户推荐后续可能感兴趣的项目。基于预训练模型在适应下游任务方面具有优势,预训练机制在序列推荐中备受关注。现有序列推荐预训练方法忽略了现实中时间对用户交互行为的影响,为了更好地捕获用户与项目交互的时间语义,提出了融入时间信息的预训练序列推荐模型TPTS-Rec(Time-aware Pre-Training method for Sequence Recommendation)。首先,在嵌入层引入时间嵌入矩阵以获取用户交互项目与时间的关联信息。然后,在自注意力层采用同一时间点采样的方法以学习项目间的时间关联信息。最后,在微调阶段从时间维度扩增用户交互序列长度以缓解数据稀疏性问题。在真实数据集上的对比实验结果表明,与基线模型相比,所提模型TPTS-Rec的推荐效果有显著提升。
    参考文献 | 相关文章 | 多维度评价
    4. 结合图对比学习的多图神经网络会话推荐方法
    卢敏, 原子婷
    计算机科学    2024, 51 (5): 54-61.   DOI: 10.11896/jsjkx.230300092
    摘要96)      PDF(pc) (2737KB)(143)    收藏
    会话推荐根据匿名用户短期内的交互数据预测下一个交互物品。针对会话中物品少、物品长尾分布等特性,现有基于图对比学习的会话推荐模型提出对会话内物品采用随机裁剪、扰动等方式构造正负样本。然而,上述随机退出策略进一步缩减较短会话中的可用物品,使得会话更加稀疏,引起会话兴趣学习偏差。为此,提出了结合图对比学习的多图神经网络会话推荐方法。其核心思想是:在物品局部图、物品全局图等上提取融入物品局部和全局的高阶邻域物品表示,并生成物品级的会话表示,然后设计会话-会话图并学习会话级的会话表示,最后递归利用不同级别会话兴趣生成正负样本对,通过对比学习机制增强会话兴趣区分性。与退出策略相比,所提模型保留了完整的会话信息,实现了真正的数据扩充。在两个基准数据集上进行了大量实验,结果表明,该算法的推荐性能远优于主流基线方法。
    参考文献 | 相关文章 | 多维度评价
    5. 基于双域稀疏Transformer的变电站设备故障预警方法
    张建亮, 李洋, 朱春山, 薛泓林, 马军伟, 张丽霞, 毕胜
    计算机科学    2024, 51 (5): 62-69.   DOI: 10.11896/jsjkx.230300001
    摘要113)      PDF(pc) (2800KB)(114)    收藏
    利用变电站电气设备运行时产生的时间序列数据,可以构建其未来运行状态的预测模型,从而提前发现异常数据,排除故障隐患,提升变电站的稳定性和可靠运行能力。Transformer模型是一种新兴的序列化数据处理模型,在面对较长序列时更具优势,可以满足故障预警前瞻性的需求。然而Transformer的模型结构使其具有较高的计算复杂度与空间占用率,难以直接应用到故障预警任务中。据此提出了一种基于时间序列预测的变压器设备故障预警方法,通过改进Transformer模型实现对设备运行数据的建模。该模型使用双塔式的编码器结构提取序列在频域和时域的特征,将时间特征数据和空间特征数据进行多维数据融合,从而提取更细致的信息。其次,用稀疏化处理的注意力机制代替标准的注意力机制,降低Transformer的计算复杂度和空间占用率,以满足实时预警的需求。在ETT变压器设备数据集上通过实验证明了所提模型的优越性,以及所改进的模块的必要性。相较于其他方法,该模型在多数预测任务中的MSE与MAE指数都达到了最优,尤其在长序列预测任务中表现出了更佳的性能,且预测速度更快。
    参考文献 | 相关文章 | 多维度评价
    6. 大图中多样化Top-k模式挖掘算法研究
    何宇昂, 王欣, 沈玲珍
    计算机科学    2024, 51 (5): 70-84.   DOI: 10.11896/jsjkx.230300003
    摘要75)      PDF(pc) (5498KB)(105)    收藏
    频繁模式挖掘(Frequent Pattern Mining,FPM)是图数据挖掘领域的一项重要任务。该任务的目标是从图数据中找到出现频次大于给定阈值的所有模式。近年来,随着社交网络等大规模图数据的涌现,单一大图上的FPM问题受到广泛关注,并得到了较为充分的研究,取得了一系列研究成果。然而,已有技术大都存在着计算成本高、挖掘结果理解困难以及并行计算难等问题。针对上述问题,文中提出了一种从大规模图数据中挖掘多样化top-k模式的方法。首先设计了一个多样化函数,用于度量模式集合的多样性;随后设计了一种面向分布式图数据,具有提前终止特性的分布式挖掘算法DisTopk,以实现多样化top-k模式高效挖掘。在真实图数据和合成图数据上进行了大量实验,结果表明,与传统分布式挖掘算法相比,DisTopk算法能更高效地挖掘多样化top-k模式。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共6条记录