1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    人工智能 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 基于机器学习的编译器自动调优综述
    池昊宇, 陈长波
    计算机科学    2022, 49 (1): 241-251.   https://doi.org/10.11896/jsjkx.210100113
    摘要 (41)   PDF (1692KB) (48)  
    现代编译器提供的优化选项众多,选择何种参数因子、选择哪些选项组合以及以何种顺序应用这些选项成为复杂的问题,其中优化次序问题是最困难的优化问题。随着传统方法的改进(迭代编译结合启发式优化搜索)以及新技术的出现(机器学习),构建一种相对高效、智能的编译器自动调优框架成为可能。文中通过调查过去数十年的相关研究,总结了前人的研究思路和应用方法。首先介绍了编译器自动调优的发展历程,包括早期的手工方法、成本函数驱动的方法、启发式优化搜索驱动的迭代编译、基于机器学习的直接预测以及机器学习驱动的迭代编译方法。然后重点梳理了基于机器学习的直接预测和机器学习驱动的迭代编译自动调优方法,统计和对比了一些较为成功的框架和最新的研究成果。最后提出了当前编译器优化存在的问题和今后的重点研究方向。
    参考文献 | 相关文章 | 多维度评价
    2. 融入自注意力机制的深度学习情感分析方法
    胡艳丽, 童谭骞, 张啸宇, 彭娟
    计算机科学    2022, 49 (1): 252-258.   https://doi.org/10.11896/jsjkx.210600063
    摘要 (17)   PDF (1915KB) (52)  
    文本情感极性分析是自然语言处理的热点领域,近年来基于中文语料的情感分析方法受到了学术界的广泛关注。目前大部分基于词向量的循环神经网络与卷积神经网络模型对于文本特征的提取和保留能力不足,为此文中引入了多层自注意力机制,提出了一种结合双向门控循环单元(BGRU)和多粒度卷积神经网络的中文情感极性分析方法。该方法首先使用BGRU获取文本的序列化特征信息,然后使用自注意力机制进行初步特征筛选,将处理后的特征信息导入含有不同卷积核的卷积神经网络;再使用自注意力机制对获得的局部特征进行动态权重的调整,注重关键特征的抽取;最后经Softmax获得文本情感极性。实验结果证明,模型在两种中文语料数据集上都体现了较好的分析处理性能,其中在ChineseNLPcorpus的online_shopping_10_cats数据集上取得了92.94%的情感分类准确性,在中科院谭松波学者整理的酒店评论数据集上取得了92.75%的情感分类准确度,相比目前的主流方法,其性能均有显著的提升。
    参考文献 | 相关文章 | 多维度评价
    3. 基于DNA链置换的逻辑推理问题研究
    吴立波, 黄玉芳
    计算机科学    2022, 49 (1): 259-263.   https://doi.org/10.11896/jsjkx.210200131
    摘要 (13)   PDF (2708KB) (22)  
    基于DNA链置换反应构建了逻辑推理问题的DNA计算模型。在不依托荧光标记技术等DNA实验技术的前提下,利用尽量少的DNA反应链和链置换反应以及构建0-1函数,实现了DNA链的浓度变化与布尔逻辑信号值之间的对应关系,将DNA模拟计算和数字逻辑运算相结合,设计出基于DNA链置换反应的基本逻辑运算“与”“或”“非”的DNA计算模型。利用DNA链置换反应的级联特性,将基本逻辑运算进行任意的组合,形成组合逻辑表达式,以满足不同逻辑推理问题的需求及实现完整的逻辑推理过程。通过实例得到了可满足性问题这一特殊逻辑推理问题的可行解。所有DNA链置换反应的过程和相关DNA链的浓度变化均通过Visual DSD软件仿真模拟实现。
    参考文献 | 相关文章 | 多维度评价
    4. 基于信息传播的致病基因识别研究
    李家文, 郭炳晖, 杨小博, 郑志明
    计算机科学    2022, 49 (1): 264-270.   https://doi.org/10.11896/jsjkx.201100129
    摘要 (17)   PDF (2785KB) (23)  
    基因在生命科学领域的研究中占据着重要地位,而致病基因则是关键重心之一。对致病基因的精准识别可以揭示疾病在分子层面的发病机制,为疾病的预防、诊断及治疗等多个阶段提供强力支撑。准确识别致病基因的关键在于给出基因之间的相似性度量。文中利用复杂网络对生物系统进行建模,并提出了一种带有耗散机制的多源头重启随机游走模型DRWMR来度量基因之间的功能相似程度。首先基于NCBI等生物数据库构建人类基因相互作用网络,并在KEGG的疾病-基因关联数据集上开展实验对已知致病基因进行识别。与SP,RWR和PRINCE 3种现有模型进行对比,DRWMR准确预测了581种疾病中的156种,而其余模型平均正确预测了121.3种,DRWMR的平均预测分数相比其余模型的预测分数均值高出9.46%。最后使用所提模型预测哮喘、血友病和PEHO综合征的潜在致病基因,预测结果均在文献或数据库中找到了理论或实验支持。
    参考文献 | 相关文章 | 多维度评价
    5. 基于风格感知的无监督领域适应算法
    宁秋怡, 史小静, 段湘煜, 张民
    计算机科学    2022, 49 (1): 271-278.   https://doi.org/10.11896/jsjkx.201200094
    摘要 (13)   PDF (2032KB) (19)  
    近年来,神经机器翻译的译文质量取得了显著的进步,但是其在训练过程中严重依赖平行的双语句子对。然而对于电子商务领域来说,平行资源是稀缺的,此外,文化的不同导致产品信息表达存在风格差异。为了解决这两个问题,提出了一种基于风格感知的无监督领域适应算法,该算法在互训练方法中充分利用电子商务单语数据,同时引入拟知识蒸馏的方法处理风格差异。通过获取电商产品数据信息构建非平行双语语料,基于该语料以及中英新闻平行语料进行多组实验,结果表明,相比各种无监督领域适应方法,该算法显著提高了翻译质量,较最强的基线系统提高了约5个BLEU点。此外,将该算法在Ted,Law和Medical OPUS 3类数据上进一步拓展应用,均取得了更佳的翻译效果。
    参考文献 | 相关文章 | 多维度评价
    6. 高效计算因果网中的干预
    李超, 覃飙
    计算机科学    2022, 49 (1): 279-284.   https://doi.org/10.11896/jsjkx.210300028
    摘要 (13)   PDF (1532KB) (30)  
    在因果网中,对和积问题因果效果的计算是其首要问题,从有向无环图的角度,研究者们发现每一个因果网都有一个与之对应的贝叶斯网络,干预是因果网的一个基本操作。类似于贝叶斯网络中的剪枝策略,在剪枝掉所有无效结点后,文中设计了一种优化的算法OFDo来计算对因果网中每个结点的完全原子干预。文中接着研究多干预操作,发现多干预操作具有可交换性,并基于多干预操作的可交换性证明了多干预操作的优化计算策略。最后,通过实验证实OFDo计算对因果网中所有结点完全原子干预的效率比目前的算法都好。
    参考文献 | 相关文章 | 多维度评价
    7. 基于序列特征融合的蛋白质可溶性预测
    牛富生, 郭延哺, 李维华, 刘文洋
    计算机科学    2022, 49 (1): 285-291.   https://doi.org/10.11896/jsjkx.201100117
    摘要 (14)   PDF (2692KB) (25)  
    蛋白质可溶性在药物设计的研究中起着重要的作用,传统生物实验测试蛋白质可溶性费时费力,因此基于计算方法对可溶性进行预测成为一个重要的研究方向。针对传统可溶性预测模型不能充分表示蛋白质特征的问题,文中设计了一种基于多种蛋白质序列信息的神经网络模型PSPNet,并应用到蛋白质可溶性预测中。该模型首先使用氨基酸残基序列嵌入信息和氨基酸序列进化信息表示蛋白质序列;然后采用卷积神经网络提取氨基酸序列嵌入特征的局部关键信息;其次利用双向LSTM网络提取蛋白质序列远程依赖特征;最后利用注意力机制将该特征与氨基酸进化信息融合,并将包含了多种序列信息的融合特征用于蛋白质可溶性预测。实验结果表明,相比基准方法,该模型提高了蛋白质可溶性预测的精度,并具有良好的可扩展性。
    参考文献 | 相关文章 | 多维度评价
    8. 基于领域适应嵌入的军事命名实体识别
    刘凯, 张宏军, 陈飞琼
    计算机科学    2022, 49 (1): 292-297.   https://doi.org/10.11896/jsjkx.201100007
    摘要 (15)   PDF (2065KB) (30)  
    为了解决单一军事领域语料不足导致的领域嵌入空间质量欠佳,使得深度学习神经网络模型识别军事命名实体精度较低的问题,文中从字词分布式表示入手,通过领域自适应方法由额外的领域引入更多有用信息帮助学习军事领域的嵌入。首先建立领域词典,将其与CRF算法结合,对收集到的通用领域语料和军事领域语料进行领域自适应分词,作为嵌入训练语料,并将词向量作为特征与字向量拼接,以丰富嵌入信息并验证分词效果;然后对训练所得的通用领域和军事领域的异构嵌入空间进行领域自适应转换,生成领域自适应嵌入,并作为基础模型BiLSTM-CRF层的输入;最后通过CoNLL-2000进行识别评价。实验结果表明,在相同模型下,输入领域适应嵌入比输入一般分词后的语料训练所得的军事领域嵌入,其模型识别的精确率(P)、召回率(R)、综合F1值(F1)分别提高了2.17%,1.04%,1.59%。
    参考文献 | 相关文章 | 多维度评价
    9. 一种快速收敛的最大置信上界探索方法
    敖天宇, 刘全
    计算机科学    2022, 49 (1): 298-305.   https://doi.org/10.11896/jsjkx.201100194
    摘要 (14)   PDF (2606KB) (22)  
    深度强化学习(Deep Reinforcement Learning,DRL)方法在大状态空间控制任务上取得了出色效果,探索问题一直是该领域的一个研究热点。现有探索算法存在盲目探索、学习慢等问题。针对以上问题,提出了一种快速收敛的最大置信上界探索(Upper Confidence Bound Exploration with Fast Convergence,FAST-UCB)方法。该方法使用UCB算法探索大状态空间,提高探索效率。为缓解Q值高估的问题、平衡探索与利用关系,加入了Q值截断技巧。之后,为平衡算法偏差与方差,使智能体(agent)快速学习,在网络模型中加入长短时记忆(Long Short Term Memory,LSTM)单元,同时使用一种改进混合蒙特卡洛(Mixed Monte Carlo,MMC)方法计算网络误差。最后,将FAST-UCB应用到深度Q网络(Deep Q Network,DQN),在控制类环境中将其与ε-贪心(ε-greedy)、UCB算法进行对比,以验证其有效性。在雅达利(Atari) 2600环境中将其与噪声网络(Noisy-Network)探索、自举(Bootstrapped)探索、异步优势行动者评论家(Asynchronous Advantage Actor Critic,A3C)算法和近端策略优化(Proximal Policy Optimization,PPO)算法进行对比,以验证其泛化性。实验结果表明,FAST-UCB算法在这两类环境中均能取得优秀效果。
    参考文献 | 相关文章 | 多维度评价
    10. 检索式聊天机器人技术综述
    吴俣, 李舟军
    计算机科学    2021, 48 (12): 278-285.   https://doi.org/10.11896/jsjkx.210900250
    摘要 (175)   PDF (2335KB) (246)  
    随着自然语言处理技术的飞速发展以及互联网上对话语料的不断积累,闲聊导向对话系统(简称聊天机器人)取得了令人瞩目的进展,受到了学术界的广泛关注,并在产业界进行了初步的尝试。当前,聊天机器人分为检索式聊天机器人和生成式聊天机器人,而检索式聊天机器人由于其生成的回复流畅且计算资源消耗小,仍然是目前工业界聊天机器人的主要实现手段。文中首先简要介绍了检索式聊天机器人的研究背景、基本架构以及组成模块,重点阐述了回复选择模块的约束要求和相关数据集;然后,针对检索式聊天机器人中最为核心的回复选择技术,进行了深入分析与详细梳理。文中将近年来经典的回复选择技术归纳为如下4类:基于统计模型的方法、基于表示的神经网络模型的方法、基于交互的神经网络模型的方法以及基于预训练技术的方法,并指出了这4类方法的优点和不足。在此基础上,分析了目前检索式聊天机器人技术研究所面临的问题,并对其未来的发展趋势进行了展望。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共211页 共2104条记录