计算机科学

47卷第12期目录

计算机科学. 2020, 47 (12): 0-0.

摘要 ( 306 )

PDF(289KB) ( 835 )

相关文章 | 多维度评价

复杂软件系统的重构技术:现状、问题与展望

孟繁祎, 王莹, 于海, 朱志良

计算机科学. 2020, 47 (12): 1-10. doi:10.11896/jsjkx.200800067

摘要 ( 870 )

PDF(1695KB) ( 3106 )

参考文献 | 相关文章 | 多维度评价

软件重构是改善软件质量的一种重要手段它在不改变软件外部行为特性的情况下通过调整软件内部结构来提高软件的可理解性、可维护性和可扩展性.然而随着开源软件的迅猛发展软件的规模和复杂程度日益增加现有的重构技术在应对规模庞大且复杂的软件系统时重构效果并不如意.因此提高重构技术的可扩展性一直是软件工程领域研究的热点.从技术负债角度出发探究重构时机思考重构技术对软件质量的深入影响明确重构技术旨在寻找重构代码的自动化方法从而降低维护成本提高代码质量.文中对工程实例进行分析并对文献进行梳理调研了自2010年至今国内外96篇相关领域的文献尝试以复杂系统的视角对这些研究工作进行归纳、比较提炼总结软件重构领域的研究方向与技术方法探讨重构技术研究中的特点与难点思考重构技术研究中存在的问题及未来的研究方向对软件重构技术的研究趋势进行了展望.

微服务时代的复杂服务软件开发

吴文峻, 于鑫, 蒲彦均, 汪群博, 于笑明

计算机科学. 2020, 47 (12): 11-17. doi:10.11896/jsjkx.200700181

摘要 ( 898 )

PDF(2389KB) ( 2012 )

参考文献 | 相关文章 | 多维度评价

微服务时代的软件系统变得越来越复杂传统的软件开发理论、方法和技术不再适用.面向复杂服务软件开发的过程微服务架构有着可扩展性强、灵活性高的优点同时对运维能力和服务管理能力提出了更高的要求需要借鉴群体智能的研究思路和方法直面复杂软件系统开发过程中面临的一系列挑战.文中以复杂系统和群体智能的方法论为指导提出以微服务架构实现智能服务适配开发复杂服务软件系统的技术路线阐述复杂服务软件的自适应架构、模型框架、开发技术和典型支撑工具并通过共享出行的案例分析加以具体解释.

用户如何看待产品中的预测分析功能？——面向非功能性需求的调研报告

杨经纬, 魏子麒, 刘璘

计算机科学. 2020, 47 (12): 18-24. doi:10.11896/jsjkx.201200055

摘要 ( 504 )

PDF(2274KB) ( 1198 )

参考文献 | 相关文章 | 多维度评价

随着近年来数据分析技术的发展预测分析功能被嵌入到众多互联网商业产品中为企业带来了巨大的服务收益.然而这类功能影响哪些非功能性目标？这类功能对普遍关注的非功能性目标包括软件的可用性、性能和透明度以及用户的隐私乃至个人身心健康等的影响如何？在软件服务商进一步拓展这类技术的应用之前我们需要对预测分析功能所带来的直接和间接影响进行进一步了解.首先对来自国内的565名受访者进行了问卷调研搜集了他们对预测分析功能应用的反馈.初步的分析结果表明尽管许多消费者认可预测分析功能所带来的便利但他们也表示了对产品的透明度、个人生活和隐私等方面的顾虑.在特定情况下由于存在这些顾虑部分用户会选择停止使用预测分析功能甚至放弃使用整个产品.基于调研结果从需求工程的视角讨论了如何把预测分析技术与产品进行有机融合以减轻和消除用户的顾虑同时充分挖掘预测分析技术的价值.

工业界需求工程关注点分析

贾经冬, 张筱曼, 郝璐, 谭火彬

计算机科学. 2020, 47 (12): 25-34. doi:10.11896/jsjkx.201200048

摘要 ( 530 )

PDF(2587KB) ( 1387 )

参考文献 | 相关文章 | 多维度评价

为使理论有效指导实践以提高需求工程质量了解工业界对需求工程的关注点是十分有必要的.为此提出了基于数据挖掘的4步研究框架.首先筛选合适的工业界数据源包括博客类和问答类网站然后确定合适的关键词以爬取数据并进行清洗随后根据不同的数据特点进行相似度分析和数据标注处理最后完成数据统计分析.研究结果表明国内外工业界对需求工程的关注点各有异同.国内外都关注敏捷需求;国内外都关注用户故事和用例的区别其潜在反映了实践中传统和敏捷混合开发模式下的需求实践问题;国内外都关注实践中工具的应用虽然国内使用工具种类多样但自主开发的工具相对少;国内工业界还关注需求工程的概念和方法以及需求工程师的职业发展但国外基本不关注.此外国内实践中关注需求分析多于需求变更还关注与需求相关的测试和项目管理领域.该研究结果可有效指引需求工程相关理论在工业界的应用以解决实践中的难点并为学术界和工业界提供了可能的研究和发展方向.

基于主题模型的Ubuntu操作系统缺陷报告的分类及分析

周凯, 任怡, 汪哲, 管剑波, 张芳, 赵言亢

计算机科学. 2020, 47 (12): 35-41. doi:10.11896/jsjkx.200100022

摘要 ( 581 )

PDF(2318KB) ( 1159 )

参考文献 | 相关文章 | 多维度评价

软件缺陷(Bug)是造成系统失效的主要原因之一为了更好地开发软件与修复软件失效需要对缺陷的分布等特征有更好的理解.Ubuntu是一款得到广泛应用的开源软件也是Linux操作系统当前在全球最成功的发行版之一.利用缺陷报告来发掘软件缺陷特征对缺陷进行合理分类并分析操作系统常见缺陷的分布规律及特点对于基于Ubuntu的国产混源操作系统开发、测试及维护过程中的代码质量分析及提升具有重要参考价值.首先获取Launchpad上32805份Ubuntu操作系统的缺陷报告.然后采用主题模型分析Ubuntu上常见的缺陷并结合操作系统的组成特点将其分为内核相关异常、桌面环境异常、网络相关异常、硬件驱动相关异常以及上层应用及开发环境相关异常.进一步利用F1值对分类结果进行评估结果表明缺陷分类具有较好的准确率.最后通过分析缺陷报告统计结果得到Ubuntu操作系统的近期缺陷的一般分布规律和特点同时通过缺陷报告的分类结果得到了有助于进一步认知Ubuntu操作系统缺陷的相关发现和结论.

面向机器学习系统的需求建模与决策选择

杨立, 马佳佳, 江华禧, 马肖肖, 梁赓, 左春

计算机科学. 2020, 47 (12): 42-49. doi:10.11896/jsjkx.201200021

摘要 ( 620 )

PDF(3545KB) ( 1804 )

参考文献 | 相关文章 | 多维度评价

机器学习支撑的系统应用越来越普遍但是此类系统的需求通常难以表达完整且可能存在一些难以检测的冲突使得这些系统通常无法在生产环境中高效满足用户的综合需求.此外对于在实际场景中使用的机器学习系统用户信任通常取决于包含可解释性、公平性等非功能需求在内的综合需求的满足程度且在不同领域内应用机器学习通常有特定的需求为保证需求描述的质量及实施过程的决策带来了挑战.为解决以上问题文中提出了一个机器学习系统的需求建模和决策选择框架包括一个MLS(Machine LearningSystems)需求概念模型和机器学习管道过程元模型以及对训练数据集、算法等组件的决策选择方法旨在规范实际场景中机器学习系统的需求设计、开发和评估.实例研究表明提出的MLS需求描述和实现方法是可行且有效的.

云环境下的系统使用模式与故障分析

田宇立, 李宁

计算机科学. 2020, 47 (12): 50-55. doi:10.11896/jsjkx.200700145

摘要 ( 576 )

PDF(2774KB) ( 1255 )

参考文献 | 相关文章 | 多维度评价

从软件系统使用视角出发开展系统使用模式与故障分析可以帮助软件提供者更准确地把握用户需求、评价系统质量、指导系统运营和完善系统维护方案.云计算系统整合海量计算资源并通过网络接入为用户提供可配置的计算解决方案受到了学术界和工业界的一致关注.深入理解云计算系统的使用负载和软件故障特征对于提高云计算系统的资源利用效率和系统服务可靠性具有重要的促进作用.文中针对云计算环境下的系统使用模式和系统故障进行研究深入分析了Googlecluster云计算系统的真实执行日志从系统使用模式和故障特征等方面对系统进行了描述和总结揭示了系统存在的质量问题并为提高云计算系统的质量奠定了基础.

面向中文APP用户评论数据的软件需求挖掘方法

王莹, 郑丽伟, 张禹尧, 张晓妘

计算机科学. 2020, 47 (12): 56-64. doi:10.11896/jsjkx.201200031

摘要 ( 763 )

PDF(2077KB) ( 1863 )

参考文献 | 相关文章 | 多维度评价

从APP用户反馈数据中挖掘用户需求是APP迭代更新和需求获取的一种重要方式用户在APP应用市场中发表对APP不同维度的评价其中蕴含着用户对APP软件的改善需求.但是目前用户反馈数据存在数量大、质量良莠不齐的状况如何从海量的用户评论数据中省时省力地挖掘出有价值的需求具有重要的研究与现实意义.文中着眼于APP开发问题选取360手机助手中的APP用户评论数据旨在挖掘蕴含于用户评论数据中的软件需求.首先从功能性需求与非功能性需求两个维度出发将APP用户评论数据中蕴含的软件需求划分为功能待添加、功能待改进、性能、可用性、可靠性5个需求类别;其次对用户评论进行数据采集、标注构建APP评论需求挖掘数据集;最后利用构建好的数据集进行模型训练与交叉验证探究主流深度学习方法相较于统计机器学习模型在该任务上的表现.实验表明采用的深度学习模型TextCNNText RNN和Transformer相比传统的统计机器学习模型在此任务上更具优势.

从信息物理融合系统问题模型到UML用例图的变换方法

李智, 邓杰, 杨溢龙, 韦尚锋

计算机科学. 2020, 47 (12): 65-72. doi:10.11896/jsjkx.201200044

摘要 ( 605 )

PDF(3269KB) ( 1642 )

参考文献 | 相关文章 | 多维度评价

问题框架(Problem FramesPF)方法在需求工程研究中已经获得广泛重视特别是应用于基于环境建模的信息物理融合系统中但如何有效地把问题模型(问题图及相关描述)转换为软件设计和实现仍是一个亟待解决的问题.文中提出了一种问题框架与模型驱动技术相结合的方法其可将问题模型转换为UML(Unified Modeling Language)需求模型中的用例图和概念类图进而指导软件系统的设计和实现.所开发的CASE工具通过支持领域涉众和软件设计人员合作建模来提高需求质量并允许从问题空间的需求模型平滑过渡到解空间的软件设计.通过文献中一个基准案例(邮件分拣控制问题)的扩展版本展示了其可行性及在实际应用场景下的使用从而对推动问题框架方法从理论研究走向实际应用具有重要意义.

一种AltaRica3.0模型到NuSMV模型的转换方法

陈朔, 胡军, 唐红英, 石梦烨

计算机科学. 2020, 47 (12): 73-86. doi:10.11896/jsjkx.190400035

摘要 ( 473 )

PDF(6000KB) ( 1335 )

参考文献 | 相关文章 | 多维度评价

Alta Rica3.0是一类面向复杂关键系统的安全性建模与分析语言缺乏时态属性的模型检验技术不支持穷尽式的空间检验而Nu SMV支持穷尽式的模型检验技术因此对Alta Rica3.0模型进行扩展提出了基于语言解析器生成器ANTLR(Another Tool for Language Recognition)的Alta Rica3.0模型到NuSMV模型的转换规则和算法.首先利用ANTLR构建Alta Rica3.0平展化GTS模型的AST(Abstract Syntax Tree);其次设计语言结构转换规则显示Alta Rica3.0和NuSMV之间的行为语义对应关系;然后设计转换算法G2N在遍历AST时G2N对结点存储的GTS模型语言信息进行获取和转换在保留语义的情况下通过不断地遍历转换过程来获取转换后的Nu SMV文件;最后以需求工程中的4个典型案例为例进行实验分析验证了G2N的有效性和需求模型的安全性.实验结果表明G2N算法可以在词法和语法层次上完成AltaRica3.0模型到Nu SMV模型的转换工作.

基于AADL的自主无人系统可成长框架

丁嵘, 于千惠

计算机科学. 2020, 47 (12): 87-92. doi:10.11896/jsjkx.201100173

摘要 ( 527 )

PDF(1602KB) ( 1364 )

参考文献 | 相关文章 | 多维度评价

近年来自主无人系统的开发成本随着硬件设备性能的提高而增加如何高效、智能化地完成开发工作成为无人系统的热门研究领域.基于AADL(Architecture Analysisand DesignLanguage)的自主无人系统可成长框架从系统架构方式、基于配置项的系统工作模式以及原型系统等方面实现了无人系统(无人机、无人车等)软件适应性方案以支撑资源、任务、环境变化时无人系统软件的成长和演化.搭建系统框架时采用基于模型驱动的思想使用AADL模型基表示系统的中间组件既保留了组件之间的继承关系又便于开发者更直观地观察系统结构.系统模块化是实现其可成长性的基础通过统一规范接口书写规则的方式AADL模型基将可替换算法封装在中间组件中算法的迭代与进化映射出了系统的可持续演化过程.通过爬虫的方式建立一个不断扩展的系统组件库组件库除了支持自适应扩展功能外还支持自定义模型的基功能.系统框架的可成长特性除了表现在系统文件的内容可扩展外还表现在系统配置方案的选择多样性.在不同的环境、任务、资源状况下系统的最佳配置项方案可能不同为了找出适应条件的无人系统配置项选项的最优解采用进化算法的思想使系统实现自主进化的过程.最后利用代码自动生成技术实现AADL模型到系统文件之间的转换.通过可成长软件管理平台的运行与测试验证了自主无人系统可成长框架的可行性.

DCGAN模型改进与SAR图像生成研究

徐永士, 贲可荣, 王天雨, 刘斯杰

计算机科学. 2020, 47 (12): 93-99. doi:10.11896/jsjkx.200700109

摘要 ( 740 )

PDF(2800KB) ( 1399 )

参考文献 | 相关文章 | 多维度评价

针对SAR图像识别软件通过改进DCGAN模型单生成器与单判别器对抗的结构采用多生成器与单判别器进行对抗设计了控制各生成器生成图像平均质量的算法提出了一种基于改进的DCGAN生成SAR图像的方法.为测试和验证多个同类图像识别软件并进行择优需要自行设计不同于训练用的图像来对测软件进行测试.此方法可以为择优测试提供一个公平的基准测试集.实验分别使用原DCGAN模型和改进的DCGAN模型生成目标图像和场景图像并使用公开判别器分别对两种模型生成的新图像进行质量验证.实验结果表明改进的DCGAN模型比原DCGAN模型生成的图像效果更好经其训练生成的新SAR图像与原SAR图像相比质量相当且多样性更好可以满足软件择优测试的需要.

开源软件关键开发者类型及协作网络鲁棒性分析

卢冬冬, 吴洁, 刘鹏, 盛永祥

计算机科学. 2020, 47 (12): 100-105. doi:10.11896/jsjkx.200300147

摘要 ( 306 )

PDF(2733KB) ( 952 )

参考文献 | 相关文章 | 多维度评价

文中以开源软件Angular JS项目为例探究关键开发者类型和协作网络鲁棒性.通过抽取代码修订关系构建开发者协作网络分析网络的结构和功能.综合开发者的结构与功能属性进行类型划分探究不同类型开发者流失后网络的结构和功能鲁棒性以此识别出关键开发者类型.最后模拟新开发者的加入机制探讨网络鲁棒性的提升策略.研究发现:开发者的结构和功能属性的不对称性导致了开发者协作网络的结构和功能鲁棒性的不一致性;与传统方法相比对开发者进行类型划分能够更有效地识别关键开发者类型;在社团内部较活跃、与其他社团之间存在密切联系并且拥有大量贡献度的中央核心型开发者对网络鲁棒性影响最大;拥有较大初始度且选择倾向性连接的新开发者加入机制能够有效提高网络鲁棒性.

基于排序学习的软件众包任务推荐算法

余敦辉, 成涛, 袁旭

计算机科学. 2020, 47 (12): 106-113. doi:10.11896/jsjkx.200300107

摘要 ( 490 )

PDF(2366KB) ( 1383 )

参考文献 | 相关文章 | 多维度评价

为了更有效地实现软件众包任务推荐提升软件开发质量为工人推荐合适的任务降低工人利益受损风险以达到工人和众包平台双赢的效果设计了一种基于排序学习的软件众包任务推荐方法.首先基于改进的隐语义模型提取工人-任务间的隐含特征;然后结合隐式信息对排序学习模型进行改进并将提取的隐含特征进行排序学习训练获得最优排序模型;最终通过排序模型对测试集任务进行排序得到任务推荐列表从而为工人进行众包任务推荐并采用NDCGMAPRecall推荐评价指标对推荐结果进行检验.实验表明所设计的方法能有效提高软件众包任务推荐的精度其推荐评价指标的NDCGMAPRecall值分别达到0.7220.3260.169.与基于用户的协同过滤算法相比推荐精度提升了18.6%;与仅基于RankNet的排序学习算法相比精度提升了10.2%因此能够有效指导软件众包任务推荐.

开源课程及数据科学导论的开源

朝乐门

计算机科学. 2020, 47 (12): 114-118. doi:10.11896/jsjkx.200900028

摘要 ( 362 )

PDF(1383KB) ( 1138 )

参考文献 | 相关文章 | 多维度评价

为解决当前课程建设面临的教师备课工作效率低、教育管理部门的激励覆盖面受限以及MOOC课程在教师群体关注点上存在盲区等问题提出了开源课程行动倡议.在此基础上结合作者自2017年以来建设首门示范开源课程——数据科学导论——的经验教训给出了开源课程的内涵与特征并探讨了开源课程建设的流程、原则和关键技术.开源课程行动倡议是继MOOC之后的一项全新的教学改革思想为进一步推动教学改革尤其是在复用教学资源、提升备课质量、分享教学经验、弥补MOOC课程的不足方面具有较高的参考价值.

融合节点结构和内容的网络表示学习方法

张虎, 周晶晶, 高海慧, 王鑫

计算机科学. 2020, 47 (12): 119-124. doi:10.11896/jsjkx.190900027

摘要 ( 418 )

PDF(3207KB) ( 1165 )

参考文献 | 相关文章 | 多维度评价

随着神经网络技术的快速发展面向复杂网络数据的网络表示学习方法受到越来越多的关注其旨在学习网络中节点的低维度潜在表示并将学习到的特征表示有效应用于基于图的各种分析任务.典型的浅层随机游走网络表示学习模型主要基于节点结构相似和节点内容相似不能同时有效捕获节点结构和内容的相似信息因此在结构和内容等价混合的网络数据上表现较差.为此探索了节点结构相似和节点内容相似的融合特征提出了一种基于无监督浅层神经网络联合学习的表示方法SN2vec.实验分别利用节点结构和内容等价混合的Brazilianair-trafficAmericanair-trafficWikipedia数据集在多标签分类和降维可视化任务上进行验证.结果显示SN2vec在多标签分类任务中的Micro-F1值优于现有的浅层随机游走网络表示方法并且可以较好地学习到潜在结构表示一致的节点.

一种基于深度LSTM和注意力机制的金融数据预测方法

刘翀, 杜军平

计算机科学. 2020, 47 (12): 125-130. doi:10.11896/jsjkx.200700050

摘要 ( 828 )

PDF(2144KB) ( 3148 )

参考文献 | 相关文章 | 多维度评价

随着互联网的迅速发展金融市场每日产生了大量在线金融数据如每日的交易次数以及交易的总金额等.近年来金融市场数据的动态预测成为了研究热点.金融市场数据量大输入序列较多且会随着时间发生变化.针对这些问题文中提出了基于深度LSTM和注意力机制的金融数据预测模型.首先该模型能处理复杂的金融市场数据输入主要是多序列的输入;其次该模型使用深度LSTM网络对金融数据进行建模解决了数据间长依赖的问题并能学习到更加复杂的市场动态特征;最后该模型引入了注意力机制使得不同时间的数据对预测的重要程度不同预测更加精准.在真实的金融大数据集上的实验表明所提模型在动态预测领域具有准确性高、稳定性好的特点.

基于Bootstrapping的水利空间关系词提取

相颖, 冯钧, 夏珮珮, 陆佳民

计算机科学. 2020, 47 (12): 131-138. doi:10.11896/jsjkx.191000161

摘要 ( 532 )

PDF(1686KB) ( 1406 )

参考文献 | 相关文章 | 多维度评价

目前在利用水利领域数据库构建知识图谱的过程中发现水利空间关系词的提取存在以下问题:数据库中水利对象空间关系词较少难以满足查询需要;水利对象间的关系类型复杂依靠人工构建太过费力.为了解决上述问题文中首先从专业性强的高质量水利公文文本中提取空间关系词形成种子集;然后通过外部词典进行空间关系词的扩展并结合语料提取面向水利空间关系词的句法模式;最后通过泛化后的句法模式对大规模水利文本数据进行空间关系词提取生成空间关系元组再将其作为种子集重复上述步骤.该方法使用少量的人工操作便可从语料中获得大量空间语义句法模式以及空间关系元组逐步扩展构建并最终形成水利空间关系词词典成为扩充水利对象知识图谱、提升智能检索的准确率的重要支撑.

Spark平台中的并行化FP_growth关联规则挖掘方法

朱岸青, 李帅, 唐晓东

计算机科学. 2020, 47 (12): 139-143. doi:10.11896/jsjkx.191000110

摘要 ( 302 )

PDF(1410KB) ( 1147 )

参考文献 | 相关文章 | 多维度评价

为了提高关联规则挖掘效率文中提出了一种适用于Spark平台的并行化FP_growth关联规则挖掘方法.首先利用Spark平台在分布式系统中的所有节点的内存RDD中完成遍历扫描运算得到频繁集以便生成FP_Table并更新FP_Tree.然后引入时间序列来预测待挖掘的项目集以便实现分布式系统中的所有节点能够均衡分担挖掘任务从而充分利用各节点的FP_Tree遍历功能获取FP_growth关联规则挖掘结果.实验结果显示相比单机情况并行化FP_growth关联规则挖掘在效率方面提高了约60%.经过负载均衡处理后的FP_growth关联规则挖掘的效率更高提高了约14%这说明各节点遍历任务的分配更均衡并行化程度更高.

基于概率矩阵分解算法的社交网络用户兴趣点个性化推荐

张敏军, 华庆一

计算机科学. 2020, 47 (12): 144-148. doi:10.11896/jsjkx.191000064

摘要 ( 632 )

PDF(1937KB) ( 1053 )

参考文献 | 相关文章 | 多维度评价

在社交网络环境中传统社交网络用户兴趣点的个性化推荐方法存在网络用户兴趣行为的预测精准性低、用户社交数据覆盖率低的问题不能充分挖掘用户兴趣点的时空序列特征为此提出了一种基于概率矩阵分解算法的社交网络用户兴趣点个性化推荐方法.在模型训练的伪代码群中计算与矩阵概率的变异算子相关的数值结果实现社交关系网络的物理分割完成基于概率矩阵分解算法的社交网络节点建模.在此基础上搭建个性化社交网络框架按照用户兴趣行为的特征挖掘结果选择个性化的用户来推荐节点完成社交网络用户兴趣点个性化推荐方法的建立.实用性检测结果表明与传统方法相比应用新型个性化推荐方法后网络用户兴趣行为的预测精准度最高可达100%用户社交数据覆盖率约为75%提高了网络用户兴趣行为的预测精准性和用户社交数据覆盖率社交网络用户兴趣点的时空序列特征得到了充分挖掘.

图像描述技术综述

苗益, 赵增顺, 杨雨露, 徐宁, 杨皓然, 孙骞

计算机科学. 2020, 47 (12): 149-160. doi:10.11896/jsjkx.200500039

摘要 ( 1573 )

PDF(3031KB) ( 3237 )

参考文献 | 相关文章 | 多维度评价

图像描述技术就是以图像为输入通过数学模型和计算使计算机输出对应图像的自然语言描述文字使计算机拥有"看图说话"的能力是图像处理领域中继图像识别、图像分割和目标跟踪之后的又一新型任务.文中以图像描述技术的发展历程为主线对图像描述任务的方法、评价指标和常用数据集进行了详细的综述.针对图像描述任务的技术方法总结了基于模板、检索和深度学习的图像描述生成方法重点介绍了基于深度学习的图像描述的多种方法并对不同方法的实验结果进行了总结和讨论;详细介绍了图像描述任务的实验结果评价指标及其计算方法和该任务中常用的数据集;最后提出了该任务现有的问题和未来的发展方向.

基于语言描述的细粒度美妆图片排序

姚林丽, 陈师哲, 金琴

计算机科学. 2020, 47 (12): 161-168. doi:10.11896/jsjkx.200800209

摘要 ( 432 )

PDF(2150KB) ( 991 )

参考文献 | 相关文章 | 多维度评价

文中研究了化妆领域中基于文本的细粒度视觉推理问题具体探究了一个新颖的多模态任务即根据有序的化妆步骤描述对化妆过程中打乱顺序的人脸图片进行排序.针对这个新颖的任务通过数据的处理和分析提出了两个排序模型:第一个排序模型从单模态的角度出发只利用图片的信息进行排序;第二个模型从多模态的角度出发通过建立文本描述和图片之间的联系来指导图片排序.在You Makeup VQA Challenge数据集上进行了详实的实验以及分析实验结果表明所提出的两个模型在不同的图片对数据上具有互补性在美妆图片排序任务上具有良好的表现在测试集上的选择准确率分别达到了70%和58.93%.

采用多相关滤波策略的鲁棒长时自适应目标跟踪

谭建豪, 殷旺, 刘力铭, 王耀南

计算机科学. 2020, 47 (12): 169-176. doi:10.11896/jsjkx.191000021

摘要 ( 378 )

PDF(5328KB) ( 1066 )

参考文献 | 相关文章 | 多维度评价

传统相关滤波方法在目标运动模糊和光照变化上取得了一定的鲁棒效果但当目标存在形变、颜色变化、重度遮挡等干扰因素时难以实现跟踪鲁棒性差且当目标丢失后不能再恢复无法实现长时间跟踪.因此文中提出了一种鲁棒长时自适应目标跟踪算法.首先提出了一种特征互补策略将方向梯度直方图和全局颜色直方图的特征响应线性加权学习对颜色变化和形变都具有鲁棒性的相关滤波模型用以估计目标位移;然后仅提取目标前景HOG特征学习一个判别滤波器用以保持对目标外观的长期记忆使用该长期滤波器的输出响应来判别是否出现遮挡或跟踪失败采用在线SVM分类器对丢失目标进行再检测从而能够跟踪已丢失目标以实现长期跟踪;其次学习了以目标位置为中心的特征金字塔模型以预测尺度变化防止目标框漂移;最后在OTB目标跟踪基准数据集上对算法进行实验并与目前较为流行的目标跟踪算法进行对比进一步验证了所提算法的鲁棒性、准确性和优越性.

基于深度多任务学习的社交图像标签和分组联合推荐

耿蕾蕾, 崔超然, 石成, 申朕, 尹义龙, 冯仕红

计算机科学. 2020, 47 (12): 177-182. doi:10.11896/jsjkx.191000141

摘要 ( 733 )

PDF(2998KB) ( 1081 )

参考文献 | 相关文章 | 多维度评价

随着在线社交的多媒体共享网站的蓬勃发展社交图像推荐逐渐成为研究热点.人们通常对社交图像进行标签化、分组化使得图像数据更加易于管理.传统的图像标签或分组推荐方法往往只关注特定任务忽略了标签推荐和分组推荐任务之间的隐含关系.多任务学习则可以充分挖掘不同任务对图像的共享或相互关联的隐含表示融合多种任务抽取图像特征对于提高单一任务的准确性具有积极意义.因此文中提出了一种基于深度多任务学习的社交图像标签和分组联合推荐模型.该方法使用基于比较的偏序学习深度网络分别进行标签推荐和分组推荐有效缓解了单任务中的数据稀疏性问题.此外在处理社交图像视觉特征的卷积神经网络中首先使用多任务学习将来自不同任务的中间层特征进行连接然后通过卷积实现降维和特征的自动融合使得不同任务的图像特征得到共享同时降维后的融合特征能够满足下一层卷积神经网络的尺寸要求使得单一任务的整体结构得以保持.从大量Flickr图片共享网站上爬取的真实数据集上的实验结果表明与现有经典推荐算法相比所提算法获得的准确率和召回率均有较大提升证明了该方法的有效性和可行性.

双语图像标题联合生成研究

张凯, 李军辉, 周国栋

计算机科学. 2020, 47 (12): 183-189. doi:10.11896/jsjkx.190900181

摘要 ( 502 )

PDF(1960KB) ( 964 )

参考文献 | 相关文章 | 多维度评价

图像标题(ImageCaption)的研究大多是对图像生成单一语言的标题而在当今各国语言交汇融合的情况下对一张图像生成两门甚至多门语言标题是必然趋势以让不同母语的人理解其他人对同一张图片的评价.对此提出一种双语图像标题即图像同时生成两种语言标题的方法.该方法由一个编码器和两个不同的解码器组成其中编码器基于卷积神经网络用于提取图像特征;解码器基于长短时记忆网络两个不同的解码器分别用于解码两种不同的语言特征.由于两种语言标题之间存在着互译的特性因此提出了双语料图像标题的联合生成模型.具体地在解码端采用交替的方式生成两种语言的标题使得在预测某种语言的下一个单词时不仅可以利用该语言标题的历史信息还可以利用另一门语言标题的历史信息同时促进两种语言标题生成的性能.基于MSCOCO2014数据集的实验结果表明双语图像标题联合生成能够同时提高两门语言的性能在英文上较英文单语言标题生成的性能提高了1.0个BLEU_4值和0.98个CIDEr值在日文上较日文单语言标题生成的性能提高了1.0个BLEU_4值和0.31个CIDEr值.

面向分块压缩感知的交叉子集导引自适应观测

田伟, 刘浩, 陈根龙, 宫晓蕙

计算机科学. 2020, 47 (12): 190-196. doi:10.11896/jsjkx.200800197

摘要 ( 662 )

PDF(2940KB) ( 981 )

参考文献 | 相关文章 | 多维度评价

相比传统的图像信号处理方法分块压缩感知能够以较低的复杂度实现图像信号的采集与编码这为功耗受限的无线传感设备提供了一种较为理想的选择方案.针对传感图像的分块压缩感知提出了一种结合螺旋顺序的交叉子集导引自适应观测方法通过为不同区域分配与其内容大小相适应的采样率并且融入观测块预测可以在提高图像重构质量的同时提升观测块的编码效率.所提方法以一幅图像的中心块为起点采用螺旋式扫描顺序将图像平均分成内区、中区、外区3个区域将每个区域每隔若干块放入交叉子集3个区域的交叉子集块以基本采样率进行采样观测根据得到的观测数据结果按权重自适应分配不同的采样率给3个区域的剩余子集剩余子集分别采用给定的自适应采样率进行采样观测.此外对于每一个剩余子集中的观测块所提方法自适应地扩大该观测块的周围邻域来寻找最佳预测块对预测差值进行标量量化.实验结果表明与目前比较流行的观测方法相比所提方法不仅可以在主观上改善图像重构质量还可以在客观上将图像重构的平均率失真性能至少提升3.2%.

结合LoG边缘检测和增强局部相位量化的模糊图像识别

陈晓文, 刘光帅, 刘望华, 李旭瑞

计算机科学. 2020, 47 (12): 197-204. doi:10.11896/jsjkx.191000054

摘要 ( 513 )

PDF(4315KB) ( 1221 )

参考文献 | 相关文章 | 多维度评价

针对原始的局部相位量化(Local Phase QuantizationLPQ)算法对具有模糊不变性的相位特征描述不准确、缺少对图像重要细节信息描述的缺点提出了一种结合高斯拉普拉斯(Laplace of GaussianLoG)边缘检测和增强局部相位量化(Enhanced Local Phase QuantizationELPQ)的模糊图像识别算法记为MrELPQ&MsLoG(Multi-resolution ELPQand Multi-scaleLoG).首先在频域中将图像进行短时傅里叶变换后得到的实部与虚部进行正负量化和幅值量化得到互补的符号特征ELPQ_S和幅值特征ELPQ_M;其次在空间域中利用多尺度高斯拉普拉斯与图像进行卷积得到图像空间域的边缘特征;最后将频域上的符号特征ELPQ_S和幅值特征ELPQ_M与空间域上的边缘特征结合生成最终的特征直方图采用SVM进行识别.在有模糊干扰的Brodatz和KTH-TIPS纹理库中文中提出的ELPQ算法相比原始的LPQ算法有较大的性能提升且空间域和频域结合的MrELPQ&MsLoG算法能进一步提高算法的识别性能;在具有模糊的AR、Extend YaleB人脸库和实际拍摄的铁路扣件库中将MrELPQ&MsLoG算法与目前模糊鲁棒性较好的算法进行对比发现MrELPQ&MsLoG算法保持着较高的识别率.实验结果表明MrELPQ&MsLoG算法对模糊具有较强的鲁棒性且特征提取时间较短具有实时性.

基于深度学习的特种车辆跨模态检索方法

邵阳雪, 孟伟, 孔德珍, 韩林轩, 刘扬

计算机科学. 2020, 47 (12): 205-209. doi:10.11896/jsjkx.191000132

摘要 ( 624 )

PDF(2297KB) ( 1187 )

参考文献 | 相关文章 | 多维度评价

保证正在执行任务的特种车辆的道路优先通行权是合理配置城市交通资源、实施和保证应急救援的前提.特种车辆的跨模态识别是实现智慧交通的重要核心技术尤其是在智能车联网尚未成熟、未来长期存在无人驾驶和有人驾驶混合交通的环境中实现无人车对正在执行任务的特种车辆进行合理避让显得尤为重要.针对无人驾驶对特种车辆识别的需求文中构建了跨模态检索与识别网络(Cross-Modal Retrievaland Recognition NetCMR²Net)提出了一种基于深度学习的特种车辆跨模态检索和识别方法.CMR²Net由两个卷积子网络和一个特征融合网络组成卷积子网络分别用于提取特种车的图像与音频特征在高层语义空间中利用相似性度量的方法进行特征匹配以达到跨模态检索和识别的目的.在特种车跨模态数据集上进行的跨模态识别实验表明所提方法对跨模态检索和识别任务具有较高的识别率甚至在缺失一种模态的场景下也可准确识别出特种车辆.本研究对于提升"城市大脑"的性能具有重要的理论指导意义对设计、实现和改善未来智慧交通具有较高的工程应用价值.

基于最小二乘的双权重学习法

李斌, 刘全

计算机科学. 2020, 47 (12): 210-217. doi:10.11896/jsjkx.191100084

摘要 ( 580 )

PDF(2633KB) ( 1114 )

参考文献 | 相关文章 | 多维度评价

强化学习是人工智能领域中的一个研究热点.在求解强化学习问题时传统的最小二乘法作为一类特殊的函数逼近学习方法具有收敛速度快、充分利用样本数据的优势.通过对最小二乘时序差分算法(Least-Squares Temporal DifferenceLSTD)的研究与分析并以该方法为基础提出了双权重最小二乘Sarsa算法(Double Weights WithLeast Squares SarsaDWLS-Sarsa).DWLS-Sarsa算法将两权重通过一定方式进行关联得到目标权重并利用Sarsa方法对时序差分误差进行控制.在算法训练过程中两权重会因为更新样本的不同而产生不同的值保证了算法可以有效地进行探索;两权重也会因为样本数据的分布而逐渐缩小之间的差距直到收敛至同一最优值确保了算法的收敛性能.最后将DWLS-Sarsa算法与其他强化学习算法进行实验对比结果表明DWLS-Sarsa算法具有较优的学习性能与鲁棒性可以有效地处理局部最优问题并提高算法收敛时的表现效果.

具有自适应步长的柯西变异乌鸦算法

霍林, 郭雅蓉, 覃志健

计算机科学. 2020, 47 (12): 218-225. doi:10.11896/jsjkx.191100207

摘要 ( 476 )

PDF(2000KB) ( 1532 )

参考文献 | 相关文章 | 多维度评价

针对乌鸦算法收敛速度慢、容易陷入局部最优的问题提出了一种具有自适应步长的柯西变异乌鸦算法(Cauchy mutation crow search algorithm with adaptive step sizeCMCSA)对标准乌鸦算法中两种情况下的位置更新策略进行了改进.在每次迭代时利用柯西变异优化gbest来增强全局搜索能力和增大变异范围以提高种群多样性避免陷入局部最优;引入判别概率在引导者发现自己被跟随的情况下优化当前个体的位置更新策略;根据当前位置和引导者之间的位置距离自适应地调整步长使算法平稳快速地收敛到全局最优从而控制搜索速度和精度有效弥补了标准CSA寻优方式的盲目性和收敛速度慢的缺陷.为评价CMCSA算法的有效性将其应用于10个基本测试函数进行寻优实验并与其他8种智能优化算法进行比较.实验结果表明所提算法的平均收敛性和鲁棒性都优于其他算法寻优平均值和标准差的平均排名均为第一总体性能良好.

基于改进深度强化学习方法的单交叉口信号控制

刘志, 曹诗鹏, 沈阳, 杨曦

计算机科学. 2020, 47 (12): 226-232. doi:10.11896/jsjkx.200300021

摘要 ( 747 )

PDF(3420KB) ( 1734 )

参考文献 | 相关文章 | 多维度评价

利用深度强化学习技术实现路口信号控制是智能交通领域的研究热点.现有研究大多利用强化学习来全面刻画交通状态以及设计有效强化学习算法以解决信号配时问题但这些研究往往忽略了信号灯状态对动作选择的影响以及经验池中的数据采样效率导致训练过程不稳定、迭代收敛较慢等问题.为此文中在智能体模型设计方面将信号灯状态纳入状态设计并引入动作奖惩系数来调节智能体动作选择以满足相位最小绿灯时间和最大绿灯时间的约束.同时结合短期内交通流存在的时序相关性文中采用优先级序列经验回放(Priority Sequence Experience ReplayPSER)的方式来更新经验池中序列样本的优先级使得智能体获取与交通状况匹配度更高的前序相关样本并通过双Q网络和竞争式Q网络来进一步提升DQN(Deep Q Network)算法的性能.最后以杭州市萧山区市心中路和山阴路形成的单交叉口为例在仿真平台SUMO(Simulation of Urban Mobility)上对算法进行验证实验结果表明提出的智能体模型优于无约束单一状态模型在此基础上提出的算法能够有效缩短车辆平均等待时间和路口总排队长度控制效果优于实际配时策略以及传统的DQN算法.

基于篇章信息和Bi-GRU的中文事件检测

朱培培, 王中卿, 李寿山, 王红玲

计算机科学. 2020, 47 (12): 233-238. doi:10.11896/jsjkx.191100031

摘要 ( 618 )

PDF(1841KB) ( 1139 )

参考文献 | 相关文章 | 多维度评价

事件抽取是信息抽取中一个重要的研究方向其中事件检测是事件抽取的关键.目前中文神经网络事件检测方法均是基于句子的方法这种方法获得的局部上下文的信息不足以解决事件触发词的歧义性.针对这个问题文中探索了篇章信息的作用.首先以双向门控循环单元网络(Bidirectional Gated Recurrent UnitsBi-GRU)模型为基线定义3个窗口来学习句子特征;然后将句子表示进行拼接利用双向门控循环单元网络学习句子的上下文特征;最后将句子表示和上下文表示进行融合以丰富句子的语义信息并减少候选触发词语义模糊现象通过Softmax函数进行事件触发词的分类.在ACE2005数据集上的实验结果表明句子的上下文特征能够有效提升中文事件检测方法的性能该中文事件检测方法的F1值比当前最好的模型高1.5%.

多目标优化算法求解多柔性作业车间调度问题

董海, 徐晓鹏, 谢谢

计算机科学. 2020, 47 (12): 239-244. doi:10.11896/jsjkx.191100042

摘要 ( 508 )

PDF(2591KB) ( 1352 )

参考文献 | 相关文章 | 多维度评价

针对车间调度中存在的机器柔性、工人柔性和并行工序柔性文中用优先级间的加工顺序替代单独工件间的顺序约束来表示并行工序柔性建立了以最小化最大完成时间、总耗能和平均完成时间为目标的多柔性作业车间调度模型设计了一种四染色体编码方法及对应的交叉和变异算子并用两条染色体来编码加工顺序.结合入侵肿瘤生长优化算法的算法结构和NSGAIII算法中对解的筛选机制提出一种多目标优化算法求解模型.该算法使用快速非支配排序方法和基于特征点的选择方法对细胞进行分类和转化设计替代重复细胞的机制并基于交叉和变异算子重新设计了细胞的生长和入侵机制.最后求解数值实例用超体积、延展度和分布度对比所提算法和其他多种智能算法得到的解集结果证明所提算法收敛更快且所得解集分布更均匀.

基于特征学习的链路预测模型TNTlink

王慧, 乐孜纯, 龚轩, 左浩, 武玉坤

计算机科学. 2020, 47 (12): 245-251. doi:10.11896/jsjkx.190700020

摘要 ( 702 )

PDF(2793KB) ( 987 )

参考文献 | 相关文章 | 多维度评价

在合作作者网络中链路预测可以预测当前网络中缺失的链接以及新的或已解散的链接根据网络中观测到的信息来推断两位作者在不久的将来是否会产生合作对于挖掘和分析网络的演化、重塑网络模型具有重要意义.链路预测是计算机科学和物理学的重要研究方向对此已有较深入的研究其主要研究思路是基于马尔可夫链、机器学习和无监督的学习.然而这些工作大多只使用单一的特征即基于网络拓扑特征或者属性特征进行预测很少将这些跨学科的特征组合考虑结合多学科特征进行链路预测的研究非常少.文中设计开发了TNTlink模型该模型结合网络拓扑特征、基本特征和附加特征并结合物理学和计算机科学的领域知识利用深度神经网络将这些特征集成到一个深度学习框架中其在解决链路预测问题时取得了不错的效果.文中使用了5个数据集(ca-AstroPhca-CondMatca-GrQcca-HepPh和ca-HepTh)包含69032个节点和450617条边从捕获的信息中利用二进制相似度和模糊余弦相似度计算和识别特征.如果节点在这些特征中表现出更多的相似性(如相似的节点、相同的关键字或彼此之间密切的关系)则两个节点间更有可能生成链接.除了考虑节点的特征外还考虑了节点重要性对链路形成的影响进而提出了一种新的链路预测指标MI以区分强影响和弱影响对节点的重要影响进行建模.将所提模型与主流分类器在5个数据集上进行比较结果表明MI和TNTlink有效地提高了链路预测的AUC值.

基于特征检测与深度特征描述的点云粗对齐算法

史文凯, 张昭晨, 喻孟娟, 吴瑞, 聂建辉

计算机科学. 2020, 47 (12): 252-257. doi:10.11896/jsjkx.191000069

摘要 ( 326 )

PDF(3067KB) ( 1344 )

参考文献 | 相关文章 | 多维度评价

点云对齐是点云数据处理的重要步骤之一粗对齐则是其中的难点.近年来基于深度学习的点云对齐取得了较大进展特别是3DMatch方法能够在噪声、低分辨率以及数据缺失的条件下取得较好的对齐效果.3DMatch采用随机采样的方式产生待匹配点当采样点个数较少时会导致匹配率较低因此对齐效果不佳.为此利用ISS特征点检测代替随机采样然后以3DMatch为特征点生成描述符最后通过匹配特征描述符实现数据对齐.由于ISS特征点检测具有良好的重复性同时3DMatch能够提供具有高区分度的描述符因此该方法大大提高了匹配的鲁棒性和准确性.实验结果表明与随机采样相比特征点采样在初始点云无噪、弱噪和强噪的情况下对齐效果更好、鲁棒性更强并且在粗对齐效果相似的情况下所需特征采样点的个数仅为随机采样点个数的10%极大地提高了对齐的效率.

基于Gabor小波变换和多核支持向量机的电梯导靴故障诊断方法

朱晓玲, 李琨, 张长胜, 杜付鑫

计算机科学. 2020, 47 (12): 258-261. doi:10.11896/jsjkx.200700039

摘要 ( 421 )

PDF(2040KB) ( 890 )

参考文献 | 相关文章 | 多维度评价

电梯导靴作为电梯轿厢的重要组成部分对电梯的安全问题具有直接的影响.为了对电梯导靴故障进行更加准确的综合诊断提出了一种基于Gabor小波变换和多核支持向量机的诊断方法.首先通过加速度传感器采集设备主体的振动信号并利用经验模态分解得到固有模态函数分量.然后采用Gabor滤波器对低频分量进行滤波去噪以使提取低频率上数据的特征.最后采用权重的方式将局部和全局的核函数进行线性相加组成多核支持向量机对数据进行分类.实验结果验证了所提方法的有效性相比基于小波变换-最小二乘支持向量机的故障诊断方法所提方法的故障诊断准确率提高了约5%达到了87.6%.

一种新型半监督极限学习机及其在防震锤锈蚀检测中的应用

王红星, 陈玉权, 沈杰, 张欣, 黄祥, 于滨

计算机科学. 2020, 47 (12): 262-266. doi:10.11896/jsjkx.200500085

摘要 ( 429 )

PDF(1882KB) ( 976 )

参考文献 | 相关文章 | 多维度评价

基于机器学习的视觉探伤技术已经被广泛地应用于包括锈蚀检测在内的工业领域.针对已有算法存在的复杂度高、依赖大量人工标注等问题文中提出了一种新型半监督极限学习机HyLap-S3ELM用于防震锤锈蚀缺陷检测.其具有以下优点:模型参数存在封闭解因此可以直接计算得到对运算资源的依赖性较小;引入了超图拉普拉斯矩阵可以更好地描述数据的平滑性以提升半监督分类的精度;引入了风险正则化项当数据平滑性假设不准确或者有标注样本存在偏移时能够提升半监督分类器的稳定性.最后通过大量实验证明了所提方法的有效性与优越性.

基于物理层信道特征的无线网络认证机制

李兆斌, 崔钊, 魏占祯, 赵洪, 郭超

计算机科学. 2020, 47 (12): 267-272. doi:10.11896/jsjkx.190900095

摘要 ( 548 )

PDF(2091KB) ( 1348 )

参考文献 | 相关文章 | 多维度评价

在轻量级物联网中针对传统认证方式存在的高能耗、高时延等问题文中提出一种基于物理层信道特征的无线网络认证机制.该方案利用信道冲激频率响应(ChannelImpulse ResponseCIR)进行身份认证并将其作为初始消息认证码(Message Authentication CodeMAC)进行消息认证;采用"哈希链"迭代的方式生成标签信号进而实现MAC的更新提高通信双方对数据包调换、篡改等攻击行为的敏感度;将身份认证与消息认证、标签信号与数据包紧密结合适用于工业物联网、智能家居等安全要求高、设备资源有限的通信环境.安全性分析与仿真结果表明与HMAC(Hash-based Message Authentication Code)、祖冲之完整性算法(EIA3)等相比该方案的认证时延较短具有一定的实用性.

基于改进乌鸦算法的车载网络频谱分配方案

樊英, 张达敏, 陈忠云, 王依柔, 徐航, 王栎桥

计算机科学. 2020, 47 (12): 273-278. doi:10.11896/jsjkx.190900199

摘要 ( 442 )

PDF(2398KB) ( 869 )

参考文献 | 相关文章 | 多维度评价

车载网络(Vehicle Ad Hoc Networks)是一种新型的智能网络它通过智能地接入网络实现人与车、车与车、车与路边基础设施之间的互联通信增强车辆行驶过程中的安全预测报警功能满足用户对车辆多媒体接入的需求提升车辆用户体验.针对认知车载网络(Cognitive Vehicular AdHoc NetworksCR-VANET)频谱分配效率低的问题文中提出一种基于改进乌鸦算法的频谱分配方案.首先对乌鸦算法的两个位置更新参数引用曲线自适应参数进行改进以更好地平衡集约化与多元化;其次采用收敛因子策略解决乌鸦算法收敛速度慢和不稳定的问题;然后对随机数混沌化以提高搜索的遍历性和收敛速度;最后以车载网络吞吐量和认知车载用户之间的接入公平性作为参考评价指标将改进后的乌鸦算法应用于认知车载网络的频谱分配中.实验采用改进的方案、遗传算法(Genetic AlgorithmGA)、粒子群算法(Particle Swarm Optimization AlgorithmPSO)分配方案进行比较.仿真结果表明改进的分配方案具有较好的性能.

共引增强有向网络嵌入研究

吴勇, 王斌君, 翟一鸣, 仝鑫

计算机科学. 2020, 47 (12): 279-284. doi:10.11896/jsjkx.191000199

摘要 ( 318 )

PDF(2083KB) ( 885 )

参考文献 | 相关文章 | 多维度评价

网络嵌入旨在将网络节点嵌入到一个低维向量空间且最大程度地保存原有网络的拓扑结构及其属性.相比无向网络有向网络具有特殊的非对称传递性可体现在节点之间的高阶相似度量中如何较好地保存这一特性是当前有向网络嵌入研究的热点和难点.针对此问题通过引入有向网络的共引网络设计了共引信息的度量函数给出了一种有向网络高阶相似度量指标融合共引信息的统一框架提出了可以保存非对称传递性的共引增强的高阶相似保存网络嵌入模型(Co-Citation Enhancing High-Order Proximity preserved EmbeddingCCE-HOPE).在4个真实数据集上进行链路预测实验的结果表明不同高阶相似度量指标下不同比重共引信息对效果影响具有一般规律因此可以给出比重的最佳取值范围;在此范围内与现有方法相比CCE-HOPE方法可有效提高链接预测的准确度.

低轨卫星星座网络路由新方法

董超颖, 续欣, 刘爱军, 苌敬辉

计算机科学. 2020, 47 (12): 285-290. doi:10.11896/jsjkx.191000067

摘要 ( 786 )

PDF(1755KB) ( 1893 )

参考文献 | 相关文章 | 多维度评价

低轨卫星星座具有传输时延低、传播损耗小和覆盖区域广等特点是卫星通信领域的热门研究方向之一.星座路由技术作为低轨卫星星座网络的核心技术之一引起了人们的广泛关注.近年来为进一步满足不断涌现的大容量、高效率和高服务质量的卫星通信业务传输需求出现了诸多研究成果主要包括:基于人工智能的QoS星座路由算法、多层卫星星座路由算法和低轨星座多径路由算法.文中对近期国内外低轨卫星星座路由算法的前沿成果进行了归纳总结;对比分析了当前已有算法在计算复杂度、满足业务服务质量(Quality of ServiceQoS)和拥塞控制3个方面的优化;针对未来的星座网络面临的业务需求对未来的研究方向进行了展望.

基于能量优化的无线传感器网络任播路由算法

周文祥, 乔学工

计算机科学. 2020, 47 (12): 291-295. doi:10.11896/jsjkx.190900069

摘要 ( 501 )

PDF(1981KB) ( 846 )

参考文献 | 相关文章 | 多维度评价

路由算法是无线传感器网络的关键技术之一而任播技术是IPv6的三大通信模式之一.任播技术在均衡网络和服务器负载等方面有着广泛的应用前景.为了延长网络生存期文中提出一种基于能量优化的无线传感器网络任播路由算法.首先对网络所在区域进行分区然后计算发送节点到各基站路径的路径权重最后发送节点根据路径权重将数据分路传输.在权重计算中加入了节点剩余能量作为条件并添加了低能量阈值以防止少量路径过度损耗;添加了当前网络的生存期以调整网络运行前后期能量权重的比重;同时引入了灰狼算法对路径权重进行优化找出最优的权重调节参数以进一步延长网络生存期.仿真结果表明通过灰狼算法可以找到更好的权重调节参数使得网络生存期延长;通过与已有无线传感器路由算法进行比较可知所提算法可获得更长的网络生存期节点能耗也更加均匀.

区块链共识算法效能优化研究进展

张彭奕, 宋杰

计算机科学. 2020, 47 (12): 296-303. doi:10.11896/jsjkx.200700020

摘要 ( 623 )

PDF(1727KB) ( 3068 )

参考文献 | 相关文章 | 多维度评价

近年来区块链及其相关技术发展迅速区块链也迅速成为了学术界的热门领域.然而区块链的共识算法在资源花销、能源耗费和性能上都饱受诟病因此需要制定一个能衡量其执行效率的指标以评价其设计是否优良.由于共识算法的资源花销、能源耗费以及性能之间相互关联且关系复杂因此有必要从"效能"的角度对现有区块链的共识算法加以分析并总结研究思路.文中总结了区块链共识算法的效能优化研究进展.首先定义区块链共识算法的效能为"在正确性和有效性的前提下计算的共识算法性能、所需资源和能源消耗"并分析这3个影响因素的关联;然后从公有链与联盟链两方面对共识算法的效能优化进行整理与总结;最后从多链区块链、多个区块链与BaaS这3个方面提出关于共识算法的资源共享问题以供研究人员参考.

一种对抗网络侦察的自适应欺骗防御机制

赵金龙, 张国敏, 邢长友, 宋丽华, 宗祎本

计算机科学. 2020, 47 (12): 304-310. doi:10.11896/jsjkx.200900126

摘要 ( 456 )

PDF(2917KB) ( 1068 )

参考文献 | 相关文章 | 多维度评价

静态配置的网络主机信息在面对攻击者侦察时易于暴露进而带来了严重的安全隐患.主机地址跳变及部署虚假节点等欺骗方法能够扰乱攻击者对网络的认知增加其网络侦察的难度.但如何高效地利用这些手段来对抗攻击者的侦察行为仍存在诸多困难.为此在对攻防双方行为进行建模描述的基础上提出了一种高效的自适应欺骗防御机制(Self-adaptive Deception MethodSADM)来应对网络侦察.SADM结合网络侦察过程中攻防双方多阶段持续对抗的特点以资源约束下防御方的综合收益最大化为目标进行建模并在此基础上通过启发式方法进行自适应防御决策以快速应对攻击者的多样化扫描行为.仿真实验结果表明SADM能够有效延缓攻击者的探测速度在保证防护效果的同时降低部署欺骗场景的代价.

基于COQ的有限域GF(2ⁿ)的形式化研究

范永乾, 陈钢, 崔敏

计算机科学. 2020, 47 (12): 311-318. doi:10.11896/jsjkx.190900197

摘要 ( 453 )

PDF(1418KB) ( 1074 )

参考文献 | 相关文章 | 多维度评价

有限域GF(2ⁿ)是多种安全关键性算法的基础包括AES加密算法、椭圆曲线加密和感染函数掩码等.相关资料表明有限域上的运算因为自身的复杂性而容易出错从而导致系统问题.基于测试和基于模型检测的验证方法只能在n固定的特定有限域上进行验证而且计算量往往超出计算机的能力.基于交互式定理证明器的形式化验证为有限域性质的通用验证提供了可能性但这方面的工作难度较大.已有研究主要针对有限域的抽象性质进行形式化验证但计算机领域更关心的是有限域的构造性定义及相关性质的验证.针对这些问题借助定理证明器COQ建立了有限域GF(2ⁿ)并给出了其基本运算的构造性定义同时对一组与有限域有关的基本性质进行了形式化验证包括有限域加法基本性质的验证、多项式乘法基本性质的验证等其中多项式乘法是有限域乘法的基础.这项工作为有限域的完整的形式化及基于有限域的算法的形式化验证奠定了基础.

基于粗糙集聚类的报文格式推断方法

李毅豪, 洪征, 林培鸿, 冯文博

计算机科学. 2020, 47 (12): 319-326. doi:10.11896/jsjkx.191000193

摘要 ( 375 )

PDF(2202KB) ( 864 )

参考文献 | 相关文章 | 多维度评价

报文聚类是报文格式推断的基础现有的报文聚类方法大多以报文的全局相似性为聚类的标准这类聚类方法的准确率往往不高进而影响后续报文格式提取的准确率.针对这一问题文中提出了一种基于粗糙集聚类的报文格式推断方法该方法包括预处理、基于粗糙集的聚类、特征词提取和报文格式推断4个阶段.首先通过数据预处理分离出目标报文中的业务类报文和控制类报文;其次按照粗糙集理论中基于属性划分样本的方法对报文的统计特征进行聚类这种聚类方法能够准确获取报文序列的局部特征能够达到较好的聚类效果;然后根据长度、频率和位置特征来提取协议特征词;最后将协议特征词分为必选字段和可选字段并用它们来描述报文格式.实验结果表明该方法能够准确地获取协议的报文格式.

基于编辑距离的多实体可信确认算法

孙国梓, 吕建伟, 李华康

计算机科学. 2020, 47 (12): 327-331. doi:10.11896/jsjkx.191100176

摘要 ( 396 )

PDF(1913KB) ( 909 )

参考文献 | 相关文章 | 多维度评价

随着自媒体的蓬勃发展任何人都可以在网上随意发布和转发信息而这些信息可能是真实的也可能是道听途说或被故意篡改的.互联网上数据的严重冗余和弱可信问题导致现有数据的可用性很差.Bi-LSTM-CRF(Bi-Long Short Term Memory with Conditional Random Field Layer)网络虽然能够解决数据中命名实体识别的准确率问题但不能满足识别出的实体是可信的这一要求.文中提出一种基于编辑距离的多实体可信确认算法并通过人物命名实体识别实例对该算法进行验证.首先通过分布式爬虫抓取同一个邮箱地址在多个搜索引擎上的TopN网页记录然后使用经过双语语料训练后的Bi-LSTM-CRF模型抽取每个页面内的人物命名实体最后通过实体多参数融合确定邮箱所对应的人物命名实体.实验结果表明多实体可信确认算法能够将邮箱地址与邮箱真实主人的匹配准确率MRR(Mean Reciprocal Rank)提高到91.32%相比只使用词频的算法其MRR提升了23.08%.实验数据充分说明多实体可信确认算法能很好地从弱可信数据中获得强可信度的实体降低海量数据中的低质特性从而有效地增强实体数据源的可信度.

多级字典存储的未知文本协议候选关键词链式合并方法

陈庆超, 王韬, 尹世庄, 冯文博

计算机科学. 2020, 47 (12): 332-335. doi:10.11896/jsjkx.190900116

摘要 ( 481 )

PDF(1382KB) ( 830 )

参考文献 | 相关文章 | 多维度评价

关键词提取是进行未知网络协议逆向的关键步骤.鉴于现有的关键词提取方法存在精确度不高、需要较多先验知识、操作繁琐等问题提出了一种基于位置信息的关键词自动化提取算法.首先通过Trigram分词获取候选关键词附加上位置信息后将其组织成多级字典;在此基础上根据位置信息将传统的对候选关键词进行树状合并改进为对其进行链式合并以获得更精确的最长候选关键词.实验结果表明当设置频繁度阈值为0.6时该方法即可以准确提取出文本协议的关键词.同时分析了频繁度的设置对实验效果的影响并讨论了基于频繁序列对关键词进行挖掘的相关算法的局限性.