1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    人工智能* 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 基于强化学习的推荐研究综述
    余力, 杜启翰, 岳博妍, 向君瑶, 徐冠宇, 冷友方
    计算机科学    2021, 48 (10): 1-18.   https://doi.org/10.11896/jsjkx.210200085
    摘要 (496)   PDF (2455KB) (866)  
    推荐系统致力于从海量数据中为用户寻找并自动推荐有价值的信息和服务,可有效解决信息过载问题,成为大数据时代一种重要的信息技术。但推荐系统的数据稀疏性、冷启动和可解释性等问题,仍是制约推荐系统广泛应用的关键技术难点。强化学习是一种交互学习技术,该方法通过与用户交互并获得反馈来实时捕捉其兴趣漂移,从而动态地建模用户偏好,可以较好地解决传统推荐系统面临的经典关键问题。强化学习已成为近年来推荐系统领域的研究热点。文中从综述的角度,首先在简要回顾推荐系统和强化学习的基础上,分析了强化学习对推荐系统的提升思路,对近年来基于强化学习的推荐研究进行了梳理与总结,并分别对传统强化学习推荐和深度强化学习推荐的研究情况进行总结;在此基础上,重点总结了近年来强化学习推荐研究的若干前沿,以及其应用研究情况。最后,对强化学习在推荐系统中应用的未来发展趋势进行分析与展望。
    参考文献 | 相关文章 | 多维度评价
    2. 移动机器人全局路径规划算法综述
    王梓强, 胡晓光, 李晓筱, 杜卓群
    计算机科学    2021, 48 (10): 19-29.   https://doi.org/10.11896/jsjkx.200700114
    摘要 (213)   PDF (1835KB) (488)  
    全局路径规划是移动机器人室外工作的关键技术,全局路径规划相关算法主要应用于地理场景预知的室外环境中,机器人面对复杂多变的室外环境,通过对算法的优化改进来提高机器人路径规划的实时避障性、路径平滑性、规划有效性就成为了全局路径规划算法的核心研究内容。首先根据算法的智能程度,将移动机器人的全局路径规划算法分为传统全局路径规划算法和仿生智能全局路径规划算法,并深入阐述了实际应用更为广泛的多目标路径规划算法,然后介绍了当前每种算法的几种典型的优化改进方法,并对其优化改进后的算法的优缺点进行了分析总结,最后对全局路径算法的未来发展趋势进行了展望,指出全局路径规划算法将向优化已有常规算法路径规划的性能、多种算法优势融合、复杂环境中动态避障、适应多样化环境的地图表示方法这4方面发展。
    参考文献 | 相关文章 | 多维度评价
    3. 面向高维连续行动空间的蒙特卡罗树搜索算法
    刘天星, 李伟, 许铮, 张立华, 戚骁亚, 甘中学
    计算机科学    2021, 48 (10): 30-36.   https://doi.org/10.11896/jsjkx.201000129
    摘要 (196)   PDF (2138KB) (316)  
    蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)在低维离散控制任务中取得了巨大的成功。然而,在现实生活中许多任务需要在连续动作空间进行行动规划。由于连续行动空间涉及的行动集过大,蒙特卡罗树搜索很难在有限的时间内从中筛选出最佳的行动。作为蒙特卡罗树搜索的一个变种,KR-UCT(Kernel Regression UCT)算法通过核函数泛化局部信息的方式提高了蒙特卡罗树搜索在低维连续动作空间的模拟效率。但是在与环境交互的过程中,为了找出最佳的行动,KR-UCT在每一步都需要从头进行大量的模拟,这使得KR-UCT算法仅局限于低维连续行动空间,而在高维连续行动空间难以在有限的时间内从行动空间筛选出最佳的行动。在与环境交互的过程中,智能体可以获得环境反馈回来的信息,因此,为了提高KR-UCT算法在高维行动空间的性能,可以使用这些反馈信息剪枝树搜索过程来加快KR-UCT算法在高维连续行动空间的模拟效率。基于此,文中提出了一种基于策略-价值网络的蒙特卡罗树搜索方法(KR-UCT with Policy-Value Network,KRPV)。该方法使用策略-价值网络保存智能体与环境之间的交互信息,随后策略网络利用这些信息帮助KR-UCT算法剪枝KR-UCT搜索树的宽度;而价值网络则通过泛化不同状态之间的价值信息对蒙特卡罗树搜索在深度上进行剪枝,从而提高了KR-UCT算法的模拟效率,进而提高了算法在高维连续行动任务中的性能。在OpenAI gym中的4个连续控制任务上对KRPV进行了评估。实验结果表明,该方法在4个连续控制任务上均优于KR-UCT,特别是在6维的HalfCheetah-v2任务中,使用KRPV算法所获得的奖励是KR-UCT的6倍。
    参考文献 | 相关文章 | 多维度评价
    4. 基于情节经验回放的深度确定性策略梯度方法
    张建行, 刘全
    计算机科学    2021, 48 (10): 37-43.   https://doi.org/10.11896/jsjkx.200900208
    摘要 (183)   PDF (2351KB) (428)  
    强化学习中的连续控制问题一直是近年来的研究热点。深度确定性策略梯度(Deep Deterministic Policy Gradients,DDPG)算法在连续控制任务中表现优异。DDPG算法利用经验回放机制训练网络模型,为了进一步提高经验回放机制在DDPG算法中的效率,将情节累积回报作为样本分类依据,提出一种基于情节经验回放的深度确定性策略梯度(Deep Determinis-tic Policy Gradient with Episode Experience Replay,EER-DDPG)方法。首先,将经验样本以情节为单位进行存储,根据情节累积回报大小使用两个经验缓冲池分类存储。然后,在网络模型训练阶段着重对累积回报较大的样本进行采样,以提升训练质量。在连续控制任务中对该方法进行实验验证,并与采取随机采样的DDPG方法、置信区域策略优化(Trust Region Policy Optimization,TRPO)方法以及近端策略优化(Proximal Policy Optimization,PPO)方法进行比较。实验结果表明,EER-DDPG方法有更好的性能表现。
    参考文献 | 相关文章 | 多维度评价
    5. 一种基于图的文档关键词和摘要协同抽取方法研究
    毛湘科, 黄少滨, 余秦勇
    计算机科学    2021, 48 (10): 44-50.   https://doi.org/10.11896/jsjkx.200900082
    摘要 (91)   PDF (1767KB) (182)  
    关键词提取和摘要抽取的目的都是从原文档中选择关键内容并对原文档的主要意思进行概括。评价关键词和摘要抽取质量的好坏主要看其能否对文档的主题进行良好的覆盖。在现有基于图模型的关键词提取和摘要抽取方法中,很少涉及到将关键词提取和摘要抽取任务协同进行的,而文中提出了一种基于图模型的方法进行关键词提取和摘要的协同抽取。该方法首先利用文档中词、主题和句子之间的6种关系,包括词和词、主题和主题、句子和句子、词和主题、主题和句子、词和句子,进行图的构建;然后利用文档中词和句子的统计特征对图中各顶点的先验重要性进行评价;接着采用迭代的方式对词和句子进行打分;最后根据词和句子的得分,得到关键词和摘要。为验证所提方法的效果,文中在中英文数据集上进行关键词提取和摘要抽取实验,发现该方法不管是在关键词提取还是摘要抽取任务上都取得了良好的效果。
    参考文献 | 相关文章 | 多维度评价
    6. 多源异构用户生成内容的融合向量化表示学习
    纪南巡, 孙晓燕, 李祯其
    计算机科学    2021, 48 (10): 51-58.   https://doi.org/10.11896/jsjkx.200900194
    摘要 (46)   PDF (3514KB) (152)  
    随着移动网络和APPs的发展,包含用户评价、标记、打分、图像和视频等多源异构数据的用户生成内容(User Generated Contents,UGC)成为提高个性化服务质量的重要依据,对这些数据的融合和表示学习成为其应用的关键。对此,提出一种面向多源文本和图像的融合表示学习。采用Doc2vec和LDA模型,给出多源文本的向量化表示,采用深度卷积网络获取与评价文本相关的图像特征;给出多源文本向量化表示的多策略融合机制,以及文本和图像卷积融合的表示学习。将所提算法应用于亚马逊含UGC内容的商品数据集上,基于UGC向量化表示物品的分类准确率说明了该算法的可行性和有效性。
    参考文献 | 相关文章 | 多维度评价
    7. 基于单词-章节关联的科技论文摘要
    付颖, 王红玲, 王中卿
    计算机科学    2021, 48 (10): 59-66.   https://doi.org/10.11896/jsjkx.200900180
    摘要 (58)   PDF (3789KB) (144)  
    为科技论文生成自动摘要,这能够帮助作者更快撰写摘要,是自动文摘的研究内容之一。相比于常见的新闻文档,科技论文具有文档结构性强、逻辑关系明确等特点。目前,主流的编码-解码的生成式文摘模型主要考虑文档的序列化信息,很少深入探究文档的篇章结构信息。为此,文中针对科技论文的特点,提出了一种基于“单词-章节-文档”层次结构的自动摘要模型,利用单词与章节的关联作用增强文本结构的层次性和层级之间的交互性,从而筛选出科技论文的关键信息。除此之外,该模型还扩充了一个上下文门控单元,旨在更新优化上下文向量,从而能更全面地捕获上下文信息。实验结果表明,提出的模型可有效提高生成文摘在ROUGE评测方法上的各项指标性能。
    参考文献 | 相关文章 | 多维度评价
    8. 具有博弈概率选择的多子群粒子群算法
    田梦丹, 梁晓磊, 符修文, 孙媛, 李章洪
    计算机科学    2021, 48 (10): 67-76.   https://doi.org/10.11896/jsjkx.200800128
    摘要 (55)   PDF (5821KB) (151)  
    针对粒子群算法在求解复杂多峰函数时存在早熟、易陷入局部最优、全局收敛性能差等缺陷,考虑种群结构、多模式学习和个体间博弈等因素,提出了具有博弈概率选择的多子群粒子群算法。该算法从改善群体多样性、提升个体搜索能力的角度出发,构建了动态多种群结构,并针对每个子群构建不同的学习策略(极端学习、复合学习、邻域学习和随机学习),子群间进行最优信息共享,形成异构多子群的多源学习方式;将进化博弈思想引入群体搜索过程中,个体通过收益矩阵和扎根概率进行策略概率选择,进入适合个体能力提升的子群进行学习。基于12个标准测试函数,针对算法中重要参数子群规模L的取值进行了组合实验,结果表明L取值N/2或N/3时,种群适应度分布及中位值具有明显优势;针对算法性能测试,利用不同维度下的标准测试函数与7种同类型算法进行对比实验,实验结果显示,改进算法在最优值、求解稳定性及收敛特征上整体优于对比算法,说明多源学习和博弈概率选择策略可以有效改善粒子群算法的性能。
    参考文献 | 相关文章 | 多维度评价
    9. 基于深度神经网络和自注意力机制的医学实体关系抽取
    张世豪, 杜圣东, 贾真, 李天瑞
    计算机科学    2021, 48 (10): 77-84.   https://doi.org/10.11896/jsjkx.210300271
    摘要 (81)   PDF (1514KB) (275)  
    随着医学信息化的推进,医学领域已经积累了海量的非结构化文本数据,如何从这些医学文本中挖掘出有价值的信息,是医学行业和自然语言处理领域的研究热点。随着深度学习的发展,深度神经网络被逐步应用到关系抽取任务中,其中“recurrent+CNN”网络框架成为了医学实体关系抽取任务中的主流模型。但由于医学文本存在实体分布密度较高、实体之间的关系交错互联等问题,使得 “recurrent+CNN”网络框架无法深入挖掘医学文本语句的语义特征。基于此,在“recurrent+CNN”网络框架基础之上,提出一种融合多通道自注意力机制的中文医学实体关系抽取模型,包括:1)利用BLSTM捕获文本句子的上下文信息;2)利用多通道自注意力机制深入挖掘句子的全局语义特征;3)利用CNN捕获句子的局部短语特征。通过在中文医学文本数据集上进行实验,验证了该模型的有效性,其精确率、召回率和F1值与主流的模型相比均有提高。
    参考文献 | 相关文章 | 多维度评价
    10. 基于数据增强的中文隐式篇章关系识别方法
    王体爽, 李培峰, 朱巧明
    计算机科学    2021, 48 (10): 85-90.   https://doi.org/10.11896/jsjkx.200800115
    摘要 (66)   PDF (1439KB) (219)  
    由于缺乏显式连接词,隐式篇章关系识别是一个具有挑战性的任务。文中提出了一种结合主动学习和多任务学习来间接扩充隐式篇章关系训练数据的隐式篇章关系识别方法,旨在在增强训练数据的同时尽量少地引入伪隐式篇章关系数据中的噪声。首先,基于BERT模型通过主动学习方法的分类不确定性来选择部分显式篇章关系样本;然后,移除显式篇章关系数据中的显式连接词作为伪隐式篇章关系数据;最后,采用多任务学习方法使伪隐式篇章关系数据有助于隐式篇章关系识别。在中文篇章树库(CDTB)上进行的实验的结果显示,相比基准模型,所提方法在宏平均F1、微平均F1值上均得到了提高。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共2页 共17条记录