1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    第四届CCF大数据学术会议 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    1. 开放知识库构建技术的多维量化评价方法
    陈新蕾,贾岩涛,王元卓,靳小龙,程学旗
    计算机科学    2017, 44 (12): 17-22.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.003
    摘要 (134)   PDF (852KB) (236)  
    网络大数据时代的到来使得开放知识库的构建技术越来越受到学术界和工业界的关注。近年来,依托开放知识库构建技术而构建的知识库及相关应用层出不穷。然而,目前并没有一种较为统一、全面的开放知识库构建技术的多维量化评价方法。在已有工作的基础之上,提出了一套开放知识库构建技术的多维评价指标体系,综合考虑包括开放知识库的构建准确率、构建时间、构建规模在内的多个维度,并在此基础上提出了开放知识库构建技术的多维量化评价方法。实验表明,开放知识库构建技术的评价结果较传统的评价方法更为全面、合理,并且可以根据实际应用中维度的重要性差异产生不同角度的评价结果。
    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(2)
    2. 一种基于关联关系的有向网络关键节点挖掘算法
    梁莹莹,黄岚,王喆
    计算机科学    2017, 44 (12): 23-27.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.004
    摘要 (105)   PDF (734KB) (237)  
    关键节点在网络中的重要程度高于其他大部分节点,关键节点挖掘是网络分析的重要研究内容,对网络结构和网络中的关系等研究而言都具有非常重要的意义。已有的关键节点挖掘算法从不同的侧重点进行节点关键性评价,文中基于网络中节点的局部性信息,结合节点与其一阶邻居节点的关联关系,提出了一种有向网络关键节点挖掘算法。该算法在关注节点所处局部环境的同时考虑关联节点间的关联强度及重要性影响,根据局部重要性和关联重要性共同进行关键节点的评价。在实验网络上的影响力传播实验表明,相比于经典的度中心性等关键节点评价算法,所提算法挖掘得到的关键节点对影响力的传播能力更强,说明了算法的准确性。
    参考文献 | 相关文章 | 多维度评价
    3. 一种面向主题耦合的影响力最大化算法
    吕文渊,周丽华,廖仁建
    计算机科学    2017, 44 (12): 28-32.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.005
    摘要 (105)   PDF (716KB) (433)  
    网络逐渐成为了人与人之间的主要社交工具,在网络中挖掘最有影响力的用户成为了非常值得关注的问题。在传统影响力最大化算法的基础上提出了一种面向主题耦合的影响力最大化算法,该算法首先分析网络中不同主题之间的耦合相似性,在综合考虑主题之间耦合相似性与用户对不同主题偏好的基础上扩展独立级联模型,并使用经典的贪心算法挖掘最具有影响力的用户。与不考虑主题耦合的影响力最大化算法相比,所提算法考虑了传播主题之间的耦合相似性,并且能够与用户偏好进行更为有效地结合。最后,实验表明,相比于经典的影响力最大化算法,该算法能够更为有效地挖 掘在特定主题下最具有影响力的种子节点。
    参考文献 | 相关文章 | 多维度评价
    4. 基于Spark的极限学习机算法并行化研究
    刘鹏,王学奎,黄宜华,孟磊,丁恩杰
    计算机科学    2017, 44 (12): 33-37.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.006
    摘要 (126)   PDF (686KB) (232)  
    极限学习机算法虽然训练速度较快,但包含了大量矩阵运算,因此其在面对大数据量时,处理效率依然缓慢。在充分研究Spark分布式数据集并行计算机制的基础上,设计了核心环节矩阵乘法的并行计算方案,并对基于Spark的极限学习机并行化算法进行了设计与实现。为方便性能比较,同时实现了基于Hadoop MapReduce的极限学习机并行化算法。实验结果表明,基于Spark的极限学习机并行化算法相比于Hadoop MapReduce版本的运行时间明显缩短,而且若处理数据量越大,Spark在效率方面的优势就越明显。
    参考文献 | 相关文章 | 多维度评价
    5. 面向位置推荐的差分隐私保护方法
    夏英,毛鸿睿,张旭,裴海英
    计算机科学    2017, 44 (12): 38-41.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.007
    摘要 (128)   PDF (709KB) (198)  
    位置推荐服务能使用户更容易地获得周边的兴趣点信息,但也会带来用户位置隐私泄露的风险。为了避免位置隐私泄露带来的不利影响,提出一种面向位置推荐服务的差分隐私保护方法。在保持用户位置轨迹与签到频率特征的前提下,基于路径前缀树及其平衡程度采用均匀分配和几何分配两种方式进行隐私预算分配,然后根据隐私预算分配结果添加满足差分隐私的Laplace噪音。实验结果表明该方法能有效保护用户位置隐私,同时通过合理的隐私预算分配能减少差分隐私噪音对推荐质量的影响。
    参考文献 | 相关文章 | 多维度评价
    6. SVRRPMCC:一种支持向量回归机的正则化路径近似算法
    王梅,王莎莎,孙莺萁,宋考平,田枫,廖士中
    计算机科学    2017, 44 (12): 42-47.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.008
    摘要 (141)   PDF (12211KB) (258)  
    正则化路径算法是数值求解支持向量回归机(Support Vector Regression,SVR)的有效方法。根据SVR正则化路径的分段线性性质,该类算法可在相当于一次SVR求解的时间复杂度内求得正则化参数的所有可能取值及对应SVR的解。由于在解路径建立过程中需要求解线性方程组,已有的精确计算方法难以处理大规模的样本数据,因此研究了正则化路径近似算法,并提出了SVR正则化路径近似算法SVRRPMCC。首先,应用Monte Carlo方法实现线性方程组系数矩阵的随机采样,求得近似系数矩阵; 然后,应用Cholesky分解方法实现快速求解系数逆矩阵;进一步,分析了SVRRPMCC算法的近似误差和计算复杂性;最后,在标准数据集上的实验验证了SVRRPMCC算法的合理性和较高的计算效率。
    参考文献 | 相关文章 | 多维度评价
    7. 基于概念权重向量的MIMLSVM改进算法
    环天,郝宁,牛强
    计算机科学    2017, 44 (12): 48-51.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.009
    摘要 (129)   PDF (678KB) (234)  
    针对多示例多标记学习算法MIMLSVM只从包层面构造聚类,而忽略了包内示例分布对分类造成影响这一不足,提出一种基于概念权重向量的MIMLSVM改进算法——I-MIMLSVM算法。首先从示例层面构造聚类,挖掘出示例中的潜在概念簇,运用R-PATTERN算法计算每个概念簇的概念权重;然后利用TF-IDF算法计算每个概念簇在各个示例包中的重要度;最后将示例包表示为概念权重向量,向量的每一维即为概念簇的概念权重与其在该包中的重要度的乘积。将该算法在包含2000幅图像的自然数据集上进行实验验证,结果表明改进的算法在分类性能上整体优于原算法,尤其在Hamming loss,Coverage和Average precision这3个测评指标上较为明显。
    参考文献 | 相关文章 | 多维度评价
    8. 一种基于Bhattacharyya系数和项目相关性的协同过滤算法
    臧雪峰,刘天琦,孙小新,冯国忠,张邦佐
    计算机科学    2017, 44 (12): 52-57.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.010
    摘要 (100)   PDF (878KB) (220)  
    在大数据时代,为了满足用户的信息需求,个性化推荐系统得到了广泛应用。协同过滤是一种简单有效的推荐算法。然而,许多传统的相似度计算方法仅仅基于用户的共同评分值,且不适用于稀疏数据环境,因此提出了一种新的基于Bhattacharyya系数的相似度方法。该方法使用了所有用户对项目的评分信息,不仅可以通过用户的评分行为获得用户的相似兴趣特征,而且可以获得用户已评分物品之间的相关性;同时由于不同的用户有不同的评分习惯,新方法也考虑了每个用户的评分偏好。通过考虑用户相似性的更多因素,可以为目标用户选择更恰当的邻域用户,以更有效地提升推荐性能。在两个真实数据集上进行的实验表明,所提方法优于其他当前最好的相似度方法。
    参考文献 | 相关文章 | 多维度评价
    9. 结合缺失模式的不完整数据模糊聚类
    郑奇斌,刁兴春,曹建军
    计算机科学    2017, 44 (12): 58-63.   https://doi.org/10.11896/j.issn.1002-137X.2017.12.011
    摘要 (94)   PDF (882KB) (282)  
    数据的完整性是数据可用性的重要维度。由于数据采集等过程中存在的问题,现实中的数据往往存在缺失。现有的聚类算法在面对不完整数据时一般采用忽略缺失或填补缺失的策略,但是当数据缺失属于非随机缺失时,这样的处理策略会导致聚类精度严重下降。当数据缺失属于非随机缺失时,数据缺失模式与缺失属性的取值相关,因此在不完整对象的相似度量中加入缺失模式相似的度量,提出了两种结合缺失模式的 PCM(Possibilistic c-means)模糊聚类算法:最小化缺失模式距离之和的 PatDistPCM 算法和基于缺失模式聚类的 PatCluPCM 算法。在两个公开数据集上的实验证明, 考虑缺失模式的模糊聚类PatDistPCM和PatCluPCM算法,在对存在非随机缺失的数据进行聚类时 ,能有效提高聚类结果的准确性。
    参考文献 | 相关文章 | 多维度评价
    被引次数: Baidu(2)
    首页 | 前页| 后页 | 尾页 第1页 共1页 共9条记录