1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    智能数据治理技术与系统* 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 人工智能治理理论及系统的现状与趋势
    朝乐门, 尹显龙
    计算机科学    2021, 48 (9): 1-8.   https://doi.org/10.11896/jsjkx.210600034
    摘要 (362)   PDF (1734KB) (766)  
    人工智能(Artificial Intelligence,AI)治理是解决AI挑战的主要手段。AI治理的主要目的是充分发挥人工智能带来的优势和有效降低人工智能导致的风险,并通过整合技术、法律、政策、标准、伦理、道德、安全、经济、社会等多个方面的影响因素,最终建设负责任的人工智能(Responsible Artificial Intelligence,RAI)。AI治理可以从智能个体治理、智能群体治理以及人机合作与共生系统的治理等3个方面,分技术层、伦理层、社会及法律层等3个层面进行。AI治理的主要关键技术有4种:可理解性人工智能、防御对抗性攻击技术、建模及仿真技术和实时审计技术。从谷歌、IBM和微软等公司的AI治理实践来看,产业界主要关注的是RAI研发,在AI系统的可解释性、隐私保护和公平性检查等方面已出现一些专用组件工具。目前,AI治理需要研究的科学问题有:软件定义的AI治理、AI治理关键技术、大规模机器学习中的AI治理评价、基于联邦学习的AI治理、AI治理的标准制定、增强人工智能与人在回路型AI训练等。
    参考文献 | 相关文章 | 多维度评价
    2. 面向跨模态隐私保护的AI治理法律技术化框架
    雷羽潇, 段玉聪
    计算机科学    2021, 48 (9): 9-20.   https://doi.org/10.11896/jsjkx.201000011
    摘要 (304)   PDF (1659KB) (1717)  
    随着虚拟社区在网络用户中的普及,虚拟社区群已经成为一个小型社会,可通过用户浏览所留下的“虚拟痕迹”和发布的用户生成内容提炼出与用户相关的隐私类型资源。根据隐私类型资源自身的特性,可将其分类为数据资源、信息资源和知识资源,三者构成了用户的数据信息知识与智慧图谱(DIKW图谱)。虚拟社区中的隐私类型资源有4个流通过程,即隐私资源的感知、存储、传输和处理;4个过程分别由3个参与方(用户、AI系统和访问者)单独或合作完成,3个参与方所拥有的隐私权包括知情权、参与权、遗忘权和监督权。通过明确3个参与方在4个流通过程中的隐私权范围,结合隐私价值保护,设计了匿名保护机制/风险评估机制和监督机制,用于构建一个虚拟社区隐私保护的AI治理法律框架。
    参考文献 | 相关文章 | 多维度评价
    3. 面向推荐应用的差分隐私方案综述
    董晓梅, 王蕊, 邹欣开
    计算机科学    2021, 48 (9): 21-35.   https://doi.org/10.11896/jsjkx.201100083
    摘要 (346)   PDF (3571KB) (731)  
    大数据时代背景下,各行各业希望能基于用户行为数据来训练推荐模型,为用户提供精准推荐,所用数据的共性特点为总量庞大、携带敏感信息、易于获取。推荐系统在带来精准推荐和市场盈利的同时也正在实时分享着用户的隐私数据,差分隐私保护技术作为一门隐私保护技术,能够巧妙地解决推荐应用中存在的隐私泄露问题,其优势在于不需要考虑攻击方所具备的任何相关的背景知识、严格地对隐私保护进行了定义、提供了量化评估方法来保证数据集(在不同参数条件下)所提供的隐私保护水平具有可比较性。首先简述了差分隐私的概念和主流推荐算法的近期研究成果,其次重点分析了差分隐私与推荐算法相结合的应用情况,涉及的推荐算法有矩阵分解、深度学习推荐、协同过滤等,并对基于差分隐私保护的推荐算法的准确性进行了对比实验;然后讨论了与每种推荐算法结合的使用场景以及目前仍存在的问题,最后对基于差分隐私的推荐算法的未来发展方向提出了有效建议。
    参考文献 | 相关文章 | 多维度评价
    4. 面向科技前瞻预测的大数据治理研究
    王俊, 王修来, 庞威, 赵鸿飞
    计算机科学    2021, 48 (9): 36-42.   https://doi.org/10.11896/jsjkx.210500207
    摘要 (147)   PDF (4195KB) (392)  
    从模仿到创新、从跟随到引领,不仅是现阶段我国科学技术发展需要完成的重大转变,更是国家发展的重大战略需求。近年来,国内外相关学者陆续开展了科技发展趋势分析和热点跟踪等方面的研究,但由于缺乏系统的大数据采集与治理体系,其数据分析与挖掘范围往往局限于科技文献这一单一数据样本。文中面向科技发展前瞻预测这一目标,全面分析了影响科学技术发展过程的各类科技文献、学者动态、论坛热点和社交评论等海量异构数据,通过构建数据驱动的大数据治理体系,解决科技大数据在探测发现、精准采集、清洗聚合、融合处理、模型构建、预测计算过程中的数据整治难题。同时,在大数据整治基础上采用LDA模型实现技术趋势预测与分析,研究成果为系统解决海量科技大数据中隐含信息发现和关系推理提供了技术支撑。关键词:大数据;大数据治理;前瞻预测;体系研究;LDA模型;数据清洗
    参考文献 | 相关文章 | 多维度评价
    5. 时间感知的兴趣点推荐方法
    王营丽, 姜聪聪, 冯小年, 钱铁云
    计算机科学    2021, 48 (9): 43-49.   https://doi.org/10.11896/jsjkx.210400130
    摘要 (182)   PDF (1964KB) (271)  
    在基于位置的社交网络(Location-based Social Networks,LBSN)中,用户共享位置和与位置信息相关的内容。兴趣点推荐是LBSN的重要应用,根据用户历史访问签到记录推荐其可能感兴趣的位置。与其他推荐问题(如产品推荐或电影推荐)相比,用户对兴趣点的偏好在时间感知特征上尤为凸显。文中探索了时间感知特征对兴趣点推荐任务的影响,提出了时间感知的兴趣点推荐方法TAPR(Time Aware POI Recommendation)。该算法基于不同的时间尺度构建不同的关系矩阵,并且利用张量分解将构建出的多个关系矩阵分解从而得到用户与兴趣点的表示。最后,该算法利用余弦相似性计算用户与未访问POIs的相似性得分,并结合用户偏好建模的算法得到最终推荐分数。在两个公开数据集上的实验结果表明,TAPR算法比其他基于兴趣点推荐算法表现更好。
    参考文献 | 相关文章 | 多维度评价
    6. 基于多模态多层级数据融合方法的城市功能识别研究
    周新民, 胡宜桂, 刘文洁, 孙荣俊
    计算机科学    2021, 48 (9): 50-58.   https://doi.org/10.11896/jsjkx.210500220
    摘要 (145)   PDF (3639KB) (350)  
    城市功能区的划分与识别对分析城市功能区的分布现状和了解城市内部空间结构具有重要意义。这激发了多源地理空间数据融合的需求,特别是城市遥感数据与社会感知数据的融合。然而,如何有效实现城市遥感数据与社会感知数据的融合是一个技术难题。为了实现城市遥感数据与社会感知数据的融合,提高城市功能识别精度,以遥感图像和社会感知数据为例,引入多模态数据融合机制,提出了一种联合深度学习与集成学习的模型来推断城市区域功能。该模型分别利用DenseNet和DPN网络,从多源地理空间数据中提取城市遥感图像特征和社会感知特征,并进行特征级融合、决策级融合以及混合融合的多层级数据融合,对城市功能进行识别。所提模型在URFC数据集上得到了验证,其混合融合总体分类准确度、Kappa系数和平均F1值3个评价指标值分别为74.29%,0.67,71.92%。相比单模态数据的最佳分类方法,所提融合模型的3个评价指标值分别提高了18.83%,0.24,35.46%。实验结果表明,该数据融合模型具有更好的分类性能,能有效融合遥感图像数据和社会感知数据,实现城市区域功能的精准识别。
    参考文献 | 相关文章 | 多维度评价
    7. 基于频繁航路模式的航迹类型识别
    宋嘉庚, 张扶桑, 金蓓弘, 窦竹梅
    计算机科学    2021, 48 (9): 59-67.   https://doi.org/10.11896/jsjkx.210100014
    摘要 (97)   PDF (3566KB) (309)  
    随着全球定位系统和雷达技术的发展,越来越多的轨迹数据可以被收集到,其中,飞机、轮船、候鸟等对象产生的轨迹复杂多变,自由度较大。为了帮助识别飞行对象的行为和意图,航迹类型识别具有重要作用。文中提出了一种基于频繁航路模式的航迹分类方法。该方法包含一个频繁航路提取算法和一个卷积神经网络模型。算法首先对轨迹进行压缩,获得关键点;接着通过寻找轨迹自相交点提取闭合航路,然后寻找闭合航路中的频繁航路模式作为模型的分类依据;最后通过图像处理完成航迹类型的识别。文中利用FlightRadar24网站公开的真实航迹数据和模拟数据进行了大量的实验,结果表明,所提方法能有效识别复杂轨迹类型,与不经过轨迹提取的LeNet-5 CNN分类模型相比,所提方法性能更优,在轨迹分类上实现了95%以上的平均准确率。
    参考文献 | 相关文章 | 多维度评价
    8. 融合不完整多视图的异质信息网络嵌入方法
    郑苏苏, 关东海, 袁伟伟
    计算机科学    2021, 48 (9): 68-76.   https://doi.org/10.11896/jsjkx.210500203
    摘要 (114)   PDF (3412KB) (276)  
    异质信息网络(Heterogeneous Information Network,HIN)嵌入将复杂的异质信息映射到低维稠密的向量空间,有利于网络数据的计算和存储。现有的基于多视图的HIN嵌入方法考虑了节点之间的多种语义关系,但忽略了视图的不完整性。大多数视图存在数据缺失,直接融合多个不完整的视图会导致嵌入效果不佳。为此,文中提出了一种融合不完整多视图的HIN嵌入方法(Incomplete Multi-view Fusion Based HIN Embedding,IMHE)。IMHE的关键思想是聚合其他视图的邻居以重建不完整的视图。由于不同的单视图描述的是同一个网络,因此其他视图中的邻居可以一定程度上恢复不完整视图的结构信息。IMHE首先在不同视图中生成节点序列,并利用多头注意力方法学习单视图嵌入。对于每个不完整视图,IMHE在其他视图中找到缺失节点的k阶邻居,然后将不完整视图中邻居的单视图嵌入聚合在一起,为缺失节点生成新的嵌入。最后使用多视图典型相关性分析方法获得节点的统一嵌入,同时提取多个视图的隐藏语义关系。在3个真实数据集上的实验结果表明,相比现有研究,该方法的嵌入性能有显著提升。
    参考文献 | 相关文章 | 多维度评价
    9. 基于代价敏感卷积神经网络的非平衡问题混合方法
    黄颖琦, 陈红梅
    计算机科学    2021, 48 (9): 77-85.   https://doi.org/10.11896/jsjkx.200900013
    摘要 (145)   PDF (2590KB) (272)  
    非平衡问题是数据挖掘领域中普遍存在的一个问题,数据的偏态分布会使得分类器的分类效果不理想。卷积神经网络作为一种高效的数据挖掘工具,被广泛应用于分类任务,但其训练过程若受到数据非平衡的不利影响,则将导致少数类的分类准确率下降。针对二分类非平衡数据分类问题,文中提出了一种基于代价敏感卷积神经网络的非平衡问题混合方法。首先将密度峰值聚类算法与SMOTE相结合,通过过采样对数据进行预处理,降低原始数据集的不平衡程度;然后利用代价敏感思想对非平衡数据中的不同类别给予不同权重,并考虑预测值与标签值之间的欧氏距离,对非平衡数据中多数类和少数类赋予不同的代价损失,构建代价敏感卷积神经网络模型,以提高卷积神经网络对少数类的识别率。选取6个不同的数据集,用于验证所提方法的有效性。实验结果表明,所提方法可以提高卷积神经网络模型对非平衡数据的分类性能。
    参考文献 | 相关文章 | 多维度评价
    10. 基于历史行车轨迹集的车辆行为可视分析方法
    罗月童, 汪涛, 杨梦男, 张延孔
    计算机科学    2021, 48 (9): 86-94.   https://doi.org/10.11896/jsjkx.200900040
    摘要 (98)   PDF (4512KB) (345)  
    随着智慧城市的不断发展,基于交通卡口自动获取车辆行车轨迹,为基于轨迹的车辆行为分析奠定了基础。但是,因为卡口的位置固定,车辆轨迹表示为卡口序列,所以文中首先将卡口和轨迹分别映射为单词和句子,应用语句的语义相似性方法计算轨迹相似性;然后在轨迹相似性的基础上提出轨迹熵,用轨迹熵度量某个车辆所有轨迹的规律性;最后基于轨迹熵分析车辆的行为特征,如轨迹熵低的车辆意味着行车特别有规律,很可能是通勤车。为便于用户进行深入分析,文中进一步提供了包含多联动视图的可视分析系统,允许用户观察和比较车辆轨迹和轨迹熵,结合聚类分析和相关交互,帮助用户发现有意义的车辆行为,如上下班的通勤车的轨迹熵较低、游街模式的出租车轨迹熵很高。对昆明市2019年2月份的卡口数据集进行了分析,结果表明所提方法能有效发现不同轨迹熵区间内的车辆出行行为及其特点,证明了所提方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共2页 共14条记录