1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    智能信息处理 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于局部上下文特征的组合的中文真词错误自动校对研究
    刘亮亮,曹存根
    计算机科学    2016, 43 (12): 30-35.   DOI: 10.11896/j.issn.1002-137X.2016.12.005
    摘要266)      PDF(pc) (501KB)(838)    收藏
    中文的真词错误类似于英文的真词错误,指一个中文词错成另一个词典中的词。提出一种基于混淆集的真词错误发现方法,通过对目标词的局部特征的提取,形成局部左邻接二元、右邻接二元及3个三元特征,然后通过和目标词对应的混淆集中的混淆词来估计二元概率和三元概率。最后提出一种多特征融合的模型,然后利用规则来判断中文文本中的真词错误。将查错结果分为标记错误和更改错误两种类型,采用18组混淆集,构造2万行的测试语料进行实验。实验表明,该方法能有效地发现中文文本中的真词错误,并且能给出真词错误的修改建议。该方法是一种集自动查错和自动纠错于一体的中文文本自动校对方法。
    参考文献 | 相关文章 | 多维度评价
    2. 基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类
    阿力甫·阿不都克里木,李晓
    计算机科学    2016, 43 (12): 36-40.   DOI: 10.11896/j.issn.1002-137X.2016.12.006
    摘要474)      PDF(pc) (399KB)(660)    收藏
    针对维吾尔语文本的分类问题,提出一种基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类方法。首先,对输入文本进行预处理,滤除非维吾尔语的字符和停用词;然后,利用词语语义相似度、词语位置和词频重要性加权的TextRank算法提取文本关键词集合;最后,根据互信息相似度度量,计算输入文本关键词集和各类关键词集的相似度,最终实现文本的分类。实验结果表明,该方案能够 提取出具有较高识别度的关键词,当关键词集大小为1250时,平均分类率达到了91.2%。
    参考文献 | 相关文章 | 多维度评价
    3. 基于行为分析的微博传播模型研究
    郑志蕴,郭芳,王振飞,李钝
    计算机科学    2016, 43 (12): 41-45.   DOI: 10.11896/j.issn.1002-137X.2016.12.007
    摘要437)      PDF(pc) (517KB)(712)    收藏
    随着微博的迅速兴起和其影响力的不断提高,提取微博信息传播特征和构建传播模型已成为了研究热点。针对用户转发行为,首先分析了信息传播机制;然后从影响用户转发行为的发布用户、接收用户、用户亲密度和信息时效性4个方面提取出8个特征因素进行建模;在借鉴传染病动力学SIR模型的基础上,引入用户行为分析和接触节点,提出基于用户行为分析的SCIR模型,并给出动力学方程;最后利用新浪微博真实转发数据验证模型的合理性。实验结果表明,考虑用户转发行为的8个影响因素,结合行为分析结果,能够较好地拟合信息传播过程。
    参考文献 | 相关文章 | 多维度评价
    4. 直觉模糊小生境的自适应遗传算法求解旅行商问题
    梅海涛,王毅,华继学
    计算机科学    2016, 43 (12): 46-49.   DOI: 10.11896/j.issn.1002-137X.2016.12.008
    摘要331)      PDF(pc) (421KB)(531)    收藏
    提出一种基于直觉模糊距离测度的小生境技术,结合模糊控制的自适应遗传算法求解旅行商问题。运用个体在遗传算法迭代寻优中的适应度值,通过直觉模糊集的距离测度确定个体之间的相似性,使用共享函数和惩罚函数对适应度低的个体进行惩罚和淘汰,维护了种群个体的多样性;建立模糊推理系统,以自适应调节遗传算法迭代中的交叉率和变异率,使遗传算法能在局部寻优和全局寻优之间达到平衡,弥补遗传算法易早熟收敛和后期寻优能力差的缺陷;通过求解TSPLIB中的多组实例并进行对比,结果表明所提算法的收敛速度、优化精度、效率均具有明显优势。
    参考文献 | 相关文章 | 多维度评价
    5. 基于词或词组长度和频数的短中文文本关键词提取算法
    陈伟鹤,刘云
    计算机科学    2016, 43 (12): 50-57.   DOI: 10.11896/j.issn.1002-137X.2016.12.009
    摘要358)      PDF(pc) (725KB)(1143)    收藏
    中文文本的关键词提取是自然语言处理研究中的难点。国内外大部分关键词提取的研究都是基于英文文本的, 但其并不适用于中文文本的关键词提取。已有的针对中文文本的关键词提取算法大多适用于长文本,如何从一段短中文文本中准确地提取出具有实际意义且与此段中文文本的主题密切相关的词或词组是研究的重点。 提出了面向中文文本的基于词或词组长度和频数的关键词提取算法,此算法首先提取文本中出现频数较高的词或词组,再根据这些词或词组的长度以及在文本中出现的频数计算权重,从而筛选出关键词或词组。该算法可以准确地从中文文本中提取出相对重要的词或词组,从而快速、准确地提取此段中文文本的主题。实验结果表明,基于词或词组长度和频数的中文文本关键词提取算法与已有的其他算法相比,可用于处理中文文本,且具有更高的准确性。
    参考文献 | 相关文章 | 多维度评价
    6. 基于向量冲突表示方法的证据组合规则
    李军伟,刘先省
    计算机科学    2016, 43 (12): 58-62.   DOI: 10.11896/j.issn.1002-137X.2016.12.010
    摘要253)      PDF(pc) (418KB)(526)    收藏
    针对Dempster组合规则在高冲突证据融合的情况下常常会得到违背直觉的结果,提出了一种基于向量冲突表示方法的Dempster(VCRD)组合规则。首先,通过实例分析了冲突因子和Jousselme距离存在的不足;然后,利用证据向量的相似性和差异性共同衡量证据之间的冲突程度,通过证据之间的冲突程度确定修正证据的权重因子,对融合证据进行预处理;最后,利用Dempster组合规则进行融合。理论分析和仿真实验结果表明:与Dempster组合规则及其它改进算法相比,VCRD组合规则能够合理地处理高冲突证据情况下的融合问题,降低了决策风险。
    参考文献 | 相关文章 | 多维度评价
    7. 一种基于概率粗糙集的属性约简加速算法
    刘芳,李天瑞
    计算机科学    2016, 43 (12): 63-70.   DOI: 10.11896/j.issn.1002-137X.2016.12.011
    摘要213)      PDF(pc) (590KB)(599)    收藏
    介绍了基于概率粗糙集模型的启发式属性约简算法,提出了概率粗糙集模型中的概率近似精度和改进概率近似精度的增量更新机制,通过比较概率近似精度的更新值得到属性核,然后通过比较改进概率近似精度的值逐步得到概率粗糙集中的属性约简。最后提出了一种概率粗糙集模型中属性核与属性约简的加速求解算法,并举例说明了所提算法的有效性和可行性。
    参考文献 | 相关文章 | 多维度评价
    8. 多准则分类问题中近似集的增量更新方法
    李艳,靳永飞,吴婷婷,郭娜娜,于群
    计算机科学    2016, 43 (12): 71-78.   DOI: 10.11896/j.issn.1002-137X.2016.12.012
    摘要247)      PDF(pc) (629KB)(539)    收藏
    在优势关系粗糙集方法(DRSA)的框架下,优势关系可用于处理带有序关系属性(准则)的数据,并且已经被广泛用于处理多准则决策问题。然而在实际应用中,当属性集和对象集发生变化时,信息系统会随之不断更新。在这种动态环境下,DRSA中用于属性约简、规则提取以及决策制定的近似集需要得到相应的更新。针对对象集发生变化时(增加或删除一个对象)的多准则分类问题,采用增量方法来更新近似集并提出两种相应的更新算法DRSA1和DRSA2。同时,对不同情况下的更新原则进行了讨论并给出了相关的理论结果与详细的证明。最后给出算例,并在UCI数据集上进行大量的实验,与非增量的方法(传统的DRSA)进行对比,结果充分体现了所提增量方法的有效性与可扩展性。
    参考文献 | 相关文章 | 多维度评价
    9. 一种基于二进制表示的快速求核算法
    胡帅鹏,张清华,姚龙洋
    计算机科学    2016, 43 (12): 79-83.   DOI: 10.11896/j.issn.1002-137X.2016.12.013
    摘要255)      PDF(pc) (477KB)(468)    收藏
    在基于粗糙集的知识发现过程中,计算条件属性对论域的划分U/C和求解属性核是尤为关键的步骤。一般需要逐个比较对象的所有条件属性值才能得出结果。提出一种基于二进制表示的方法,只需比较对象的属性值的“和”。该方法先求得所有条件属性值的“和”,仅对该“和”进行一次比较,再通过判断该“和”是否重复,就能得出U/C,理论分析得到该算法的复杂度为O(|C||U|);然后把计算U/C的思想应用于求解属性核,提出了一种新的快速计算属性核的高效算法。理论分析表明,无论信息系统是否一致,该算法的复杂度均可达到O(|C||U|)。随后通过一个实例阐明了算法的具体步骤,最后通过实验验证了算法的正确性和高效性。
    参考文献 | 相关文章 | 多维度评价
    10. 模糊信息系统中基于OWA算子的模糊粗糙集模型
    杨霁琳,秦克云
    计算机科学    2016, 43 (12): 84-87.   DOI: 10.11896/j.issn.1002-137X.2016.12.014
    摘要250)      PDF(pc) (298KB)(608)    收藏
    在模糊信息系统中,属性值并不是一个确定的值,而是一个隶属度函数。因此,通过利用有序加权平均(OWA)算子聚合对象间在每个属性上的差异,刻画出对象之间的相似性,定义对象的相似度并讨论其相关性质。借助对象相似度,通过逻辑关系和相应的函数运算,分别给出了对象隶属于上、下近似集合的隶属度。最后,通过实例分析说明在模糊信息系统中,该相似度能较准确地刻画出对象的相似性,同时,对象对于上、下近似的隶属度能更直观、合理地反应对象隶属于某一集合的上、下近似的情况,且能更合理地描述这一粗糙集合。
    参考文献 | 相关文章 | 多维度评价
    11. 基于属性权重的时序模糊软集的群决策方法研究
    张其文,谢艳钊
    计算机科学    2016, 43 (12): 88-90.   DOI: 10.11896/j.issn.1002-137X.2016.12.015
    摘要197)      PDF(pc) (309KB)(466)    收藏
    针对模糊软集在群决策过程中其属性权重往往被忽略或依靠主观经验来确定的问题,提出了一种基于属性优势度的属性权重确定方法,并讨论了其相关性质及运算。在群决策过程中,针对决策信息是随时间变化而变化的这一特点,定义了时序模糊软集等概念,并建立了基于决策时间差的对数增长型时间权重确定公式。最后通过与其他决策方法进行对比分析验证了该方法的可行性和合理性。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共11条记录