1974年1月创刊(月刊)
主管/主办:重庆西南信息有限公司
ISSN 1002-137X
CN 50-1075/TP
CODEN JKIEBK
编辑中心
    粒计算与知识发现 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于序贯三支决策的半监督目标检测算法
    宋法兴, 苗夺谦, 张红云
    计算机科学    2023, 50 (10): 1-6.   DOI: 10.11896/jsjkx.230600035
    摘要477)      PDF(pc) (1901KB)(1522)    收藏
    深度学习对大规模数据的需求以及目标检测标注任务的复杂性促进了半监督目标检测任务的发展。近年来,半监督目标检测已经取得了很多优秀的成果。然而,伪标签中的不确定性依然是半监督目标检测研究中难以避免的问题,优越的半监督方法要求选取合适的过滤阈值来权衡伪标签的噪声信息比例和召回率,以最大程度保留准确有效的伪标签。为了解决此问题,在半监督检测的框架中引入了序贯三支决策算法,将模型输出的伪标签根据不同的筛选阈值划分为干净的前景标签、有噪声的前景标签,以及干净的背景标签,并对其采取不同的处理策略。对有噪声的前景标签采用负类学习损失来学习这些存在噪声的标签,避免学习到其中的噪声信息。实验结果表明了所提算法的性能优势,针对COCO数据集,在有监督数据占比只有10%的情况下,该方法实现了35.2%的检测精度,相比仅依靠有监督训练性能提升了11.34%。
    参考文献 | 相关文章 | 多维度评价
    2. 不完备形式背景中基于OE-cp-近似概念的规则提取
    牛丽慧, 米据生, 白宇璋
    计算机科学    2023, 50 (10): 7-17.   DOI: 10.11896/jsjkx.230600037
    摘要181)      PDF(pc) (1596KB)(1257)    收藏
    在许多实际的应用场景中,数据测量的误差、对数据的理解和传输失真等都会导致数据的丢失,这种数据不完整的形式背景即为不完备形式背景。为了丰富不完备形式背景中的知识获取模型,文中结合三支思想在不完备形式背景中利用正算子与粗糙集理论中的必然-可能性算子构造了共同-可能(cp)近似概念,讨论了对象诱导的共同-可能(cp)近似概念与经典概念、面向属性概念、对象诱导的三支近似概念的关系,提出了由经典概念和面向属性概念构造对象诱导的cp-近似概念的算法。进而,基于OE-cp-近似概念讨论了不完备决策形式背景中近似决策规则的获取,提出了OE-cp-协调的不完备决策形式背景下的正规则和可能性规则,并给出了与基于经典概念的决策规则之间的关系。
    参考文献 | 相关文章 | 多维度评价
    3. 覆盖多粒度下的形式概念更新方法
    王太滨, 李德玉, 翟岩慧
    计算机科学    2023, 50 (10): 18-27.   DOI: 10.11896/jsjkx.230600049
    摘要324)      PDF(pc) (1658KB)(1180)    收藏
    多粒度形式概念分析是数据挖掘与知识发现的重要工具。文中研究了覆盖多粒度下的形式概念的粗化和细化更新方法。首先,举例说明了现有的概念粗化更新算法可能导致概念缺失,通过分析缺失概念的本质特征,对现有概念粗化算法进行补充,并证明了新算法的正确性。其次,举例说明了现有的概念细化更新算法可能会生成冗余概念,通过分析冗余细概念的内涵特性,对现有的概念细化更新算法进行了优化,并证明了新算法生成结果的无冗余性,具有更低的时间复杂度。最后,通过实验验证了所提算法的有效性。
    参考文献 | 相关文章 | 多维度评价
    4. 考虑需求优先性的在线医患双边匹配方法
    范婷睿, 刘盾, 叶晓庆
    计算机科学    2023, 50 (10): 28-36.   DOI: 10.11896/jsjkx.230600042
    摘要210)      PDF(pc) (2172KB)(1260)    收藏
    近年来,随着互联网与智慧医疗的飞速发展,在线问诊平台逐渐成为满足大众基本医疗需求的重要渠道。随着在线问诊平台患者和医生数量的不断增长,医生回答参差不齐、患者提问响应不及时、答复率严重不足等问题不断涌现。如何从大量的在线医疗内容中挖掘患者需求信息和医生服务信息,刻画患者需求满意度和医生的服务能力,实现精确匹配是亟需解决的问题。基于此,文中提出了一个融合机器学习算法的多阶段匹配模型,用于提高匹配精度和多样性。首先,从医生和患者两个视角,利用机器学习算法和情感分析工具,深度挖掘患者服务需求和医生服务能力,同时考虑到患者强烈的风险规避态度,引入前景理论描述患者风险偏好。然后,考虑到患者需求的优先性,以粒计算思想为指导,以提高医患匹配的准确性和多样性为目的, 构建多阶段动态匹配模型。最后,通过爬取好大夫网站的真实数据来进行实验,结果验证了所提方法的有效性。
    参考文献 | 相关文章 | 多维度评价
    5. 基于粗糙集与密度峰值聚类的特征选择算法
    曹栋涛, 舒文豪, 钱进
    计算机科学    2023, 50 (10): 37-47.   DOI: 10.11896/jsjkx.230600038
    摘要281)      PDF(pc) (6046KB)(1150)    收藏
    特征选择可以有效地去除高维数据中的冗余和不相关的特征,保留重要的特征,从而降低模型计算的复杂性,提高模型精度。在特征选择过程中,针对数据中存在的离群点和边界点等可能影响分类效果的噪声数据,提出了基于粗糙集与密度峰值聚类的特征选择方法。首先,通过密度峰值聚类方法去除噪声数据,并挑出簇类中心;然后,结合粗糙集理论的思想,按簇类中心划分数据,并根据同一簇类的点应具有相同标签的假设,定义特征重要性评价指标;最后,设计了一种启发式特征选择算法,用于挑选出使簇类结构纯度更高的特征子集。在6个UCI数据集上,与其他算法进行了分类精度、特征选择个数和运行时间的对比实验,实验结果验证了所提算法的有效性和高效性。
    参考文献 | 相关文章 | 多维度评价
    6. 基于构造性神经网络与全局密度信息的不平衡数据欠采样方法
    严远亭, 马迎澳, 任艳平, 张燕平
    计算机科学    2023, 50 (10): 48-58.   DOI: 10.11896/jsjkx.230600022
    摘要289)      PDF(pc) (4922KB)(1089)    收藏
    多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失。然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样面临的主要挑战。针对该挑战,提出了一种基于构造性神经网络和全局分布密度的不平衡数据集欠采样方法。该方法首先基于构造性神经网络,设计了一种多数类局部模式的学习方法;然后基于多数类局部模式,设计了两种具有结构保持特性的样本选择策略;最后针对局部模式学习的随机性可能导致的采样结果非优的问题,进一步引入了bagging集成策略,提升了方法的性能。在59个数据集上与13种对比方法进行了对比实验,验证了所提方法在G-mean,AUC和F1-score这3个常用指标上的有效性。
    参考文献 | 相关文章 | 多维度评价
    7. 结合共享近邻和流形距离的自适应谱聚类算法
    张喜梅, 解滨, 米据生, 徐童童, 张祎玲
    计算机科学    2023, 50 (10): 59-70.   DOI: 10.11896/jsjkx.230600010
    摘要324)      PDF(pc) (6167KB)(1083)    收藏
    谱聚类算法是建立在图论的基础上,将聚类问题转化为图的划分问题,能识别任意形状的类簇且易于实现,因此比传统聚类算法具有更强的适应性。然而,该算法中常用的距离度量不能同时考虑全局和局部一致性,且易受到噪声影响;聚类结果依赖由输入数据构造的相似度矩阵,且通过特征分解得到松弛划分矩阵和离散化过程的两步独立策略难以得到一个共同最优解。因此,提出一种结合共享近邻和流形距离的自适应谱聚类算法(SNN-MSC),引入一种新的具有指数项和比例因子的流形距离,可以灵活调整同一流形内数据的相似度和不同流形之间数据的相似度之比,并将密度因子纳入流形距离度量中,以消除噪声影响;采用共享近邻重新定义相似度度量,能挖掘数据点之间的空间结构和局部关系;同时,对拉普拉斯矩阵施加秩约束,使相似度矩阵中的连通分量完全等于簇个数,能够在优化求解过程中自适应优化数据相似度矩阵和聚类结构,无须再进行离散化操作。在人工数据集和UCI真实数据集上的对比实验显示,所提算法在多个聚类有效性指标上能体现出更好的性能。
    参考文献 | 相关文章 | 多维度评价
    8. 介粒度空间中的最优粒度选择和属性约简
    李腾, 李德玉, 翟岩慧, 张少霞
    计算机科学    2023, 50 (10): 71-79.   DOI: 10.11896/jsjkx.230500218
    摘要207)      PDF(pc) (1418KB)(1060)    收藏
    以往的形式概念分析采用介粒度形式背景,满足对数据跨层粒化的需求,但其既没有将寻找最优粒度和属性约简有效结合起来,又没有在多粒度的背景下高效地解决组合爆炸问题。为此,基于介粒度中粒度选择和属性约简的联系,提出了一种新的最优粒度选择方式——最优粒度约简,以同步进行粒度选择和属性约简。鉴于寻找最优粒度约简存在组合爆炸的问题,设计了逐步搜索方法,通过已搜索的信息更新粒度空间,去除大量非最优粒度约简,显著提高了搜索效率。实验结果表明了所提方法的有效性和优势。
    参考文献 | 相关文章 | 多维度评价
    9. 基于多粒度特征融合的新型图卷积网络用于方面级情感分析
    邓入菡, 张清华, 黄帅帅, 高满
    计算机科学    2023, 50 (10): 80-87.   DOI: 10.11896/jsjkx.230600036
    摘要178)      PDF(pc) (2117KB)(1109)    收藏
    方面级情感分析是情感分析中的细粒度任务,旨在检测给定句子中方面词的情感极性。随着图卷积网络的兴起,通过依赖树构建的图卷积网络模型被广泛用于该任务,并取得了令人满意的效果。但大多数研究只获取图卷积网络最后一层输出作为分类层的输入,忽略了其他层的节点特征,且深层图卷积网络存在节点平滑问题。近年来,有研究者将图卷积网络的多层节点特征进行集成,提高了情感分类模型的性能。文中结合自适应特征融合与高速公路网络,提出了一种基于多粒度特征融合的高速公路图卷积网络模型,用于方面级情感分析。首先,该模型通过句法依赖结构和双向的上下文信息构建图卷积网络;同时,在图卷积网络引入高速公路网络缓解深层图卷积网络过平滑的问题,加深图卷积网络的深度。然后,使用自适应融合机制从不同深度图卷积网络获得多粒度节点信息。最后,在公共数据集上进行实验,实验结果表明,与基准模型相比,所提模型能更好地捕获更多粒度的句法信息和长距离依存关系。
    参考文献 | 相关文章 | 多维度评价
    10. 基于分类不确定性最小化的半监督集成学习算法
    何玉林, 朱鹏辉, 黄哲学, Fournier-Viger PHILIPPE
    计算机科学    2023, 50 (10): 88-95.   DOI: 10.11896/jsjkx.230600048
    摘要308)      PDF(pc) (2418KB)(1094)    收藏
    半监督集成是将半监督学习与集成学习相结合的一种学习范式,它一方面通过无标记样本来提高集成学习的多样性,同时解决集成学习样本量不足的问题,另一方面集成多个分类器能够进一步提升半监督学习模型的性能。现有的研究从理论和实践两个角度证明了半监督学习与集成学习之间的互益性。针对当前半监督集成学习算法对无标记样本信息利用不完全的缺陷,文中提出了一种新的基于分类不确定性最小化的半监督集成学习(Classification Uncertainty Minimization-Based Semi-Supervised Ensemble Learning,CUM-SSEL)算法,它引入信息熵作为对无标记样本进行打标的置信度评判标准,通过最小化无标记样本打标过程中的不确定性迭代地训练分类器,实现对无标记样本的高效利用,以增强分类器的泛化性能。在标准的实验数据集上对CUM-SSEL算法的可行性、合理性和有效性进行了验证,实验表明:随着基分类器的增加,CUM-SSEL算法的训练呈现收敛的趋势,同时它能够获得优于Self-Training,Co-Training,Tri-Training,Semi-Boost,Vote-Training,Semi-Bagging以及CST-Voting算法的分类精度。
    参考文献 | 相关文章 | 多维度评价
    11. 基于层次聚类的三支决策移动策略
    徐怡, 骆帆, 王敏
    计算机科学    2023, 50 (6): 92-99.   DOI: 10.11896/jsjkx.220900037
    摘要148)      PDF(pc) (2731KB)(293)    收藏
    治略是三支决策TAO模型中的一个重要步骤,是实现对象移动的重要手段。通过实施策略,促使对象从不利区域移动到有利区域。近年来,对于治略方面的研究,学者们提出了两种移动策略,一种是基于区域的移动,另一种是基于对象的移动。然而,这两种移动策略都是从单层次的角度分析和制定移动策略,并未从多层次上考虑移动策略的制定。因此,为了制定多个层次上的移动策略,文中引入层次聚类,提出了一种基于层次聚类的三支决策移动策略模型。首先,使用层次聚类,将不利区域中的对象划分成不同的层次,每一层次上的聚类结果不同。然后,根据全局属性值频率最高准则,为每个层次中的簇制定一个移动策略,不同的簇有不同的移动策略。此外,文中还利用移动过程中产生的收益和代价,对不同层次上的移动策略进行评估。最后,实验结果证明了所提模型的有效性。
    参考文献 | 相关文章 | 多维度评价
    12. 基于局部半径的三支DBSCAN算法
    申秋萍, 张清华, 高满, 代永杨
    计算机科学    2023, 50 (6): 100-108.   DOI: 10.11896/jsjkx.220800074
    摘要394)      PDF(pc) (5819KB)(267)    收藏
    DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种经典的基于密度的聚类算法,它通过两个全局参数即半径Eps和最少点数MinPts,能够对任意形状的数据进行聚类,并自动确定类个数。但是,使用全局半径的DBSCAN对于密度不均匀数据集的聚类效果较差,且无法对重叠数据集进行聚类。因此,定义了密度递减原则和局部半径,并根据k-近邻距离自动确定局部半径,从而提出了基于局部半径的DBSCAN算法(LE-DBSCAN);然后,通过考虑近邻的标签,对二支聚类结果的临界点和噪声点进行重新划分,从而提出了基于局部半径的三支DBSCAN算法(LE3W-DBSCAN)。将LE-DBSCAN和LE3W-DBSCAN与该领域的相关算法在UCI数据集和人工数据集上进行对比,实验结果表明,所提算法在常用的硬聚类指标和软聚类指标上都具有较好的表现。
    参考文献 | 相关文章 | 多维度评价
    13. 三元概念的布尔矩阵表示方法
    王霞, 李俊余, 吴伟志
    计算机科学    2023, 50 (6): 109-115.   DOI: 10.11896/jsjkx.220900111
    摘要173)      PDF(pc) (1474KB)(255)    收藏
    将布尔矩阵引入到三元概念分析,研究三元背景和三元概念的布尔矩阵表示方法。首先,定义三元背景的关系矩阵,将每一个条件下的三元背景看作一个布尔矩阵,那么三元背景是一个布尔分块矩阵,该布尔分块矩阵即为三元背景的关系矩阵。然后,利用关系矩阵给出三元背景上诱导算子的布尔矩阵表示方法,进而得到生成三元概念的外延、内涵和方式的布尔矩阵表示方法,该方法在生成三元概念时只使用一些基本的布尔矩阵运算而不涉及三元背景的诱导算子。最后,给出构造三元概念的枚举法的布尔矩阵表示方法以及基于对象-条件三元概念构造三元概念的布尔矩阵表示方法。三元概念的布尔矩阵表示方法从矩阵的角度理解三元背景和三元概念,为研究三元概念分析提供了新的视角。
    参考文献 | 相关文章 | 多维度评价
    14. 基于人工蜂群的三支k-means聚类算法
    徐天杰, 王平心, 杨习贝
    计算机科学    2023, 50 (6): 116-121.   DOI: 10.11896/jsjkx.220800150
    摘要157)      PDF(pc) (1319KB)(254)    收藏
    聚类在数据挖掘技术中起着至关重要的作用。传统的聚类算法都是硬聚类算法,即对象要么属于一个类,要么不属于一个类,在处理不确定数据时,强制划分会带来决策错误。三支k-means聚类算法可以对边界不确定数据进行更加合理的分类,但仍然存在对初始聚类中心敏感的问题。为解决这一问题,将人工蜂群算法与三支k-means聚类算法相结合,提出了一种基于人工蜂群的三支k-means聚类算法。通过定义类内聚集度函数和类间离散度函数来构造蜜源的适应度函数,引导蜂群向高质量的蜜源进行全局搜索。利用蜂群之间不同角色的相互协作与互换,对数据集进行多次迭代聚类,找到最优的蜜源位置,作为初始聚类中心,并在此基础上交替迭代聚类。实验证明,该方法对聚类结果的性能指标有所提高。在UCI数据集上的实验验证了该算法的有效性。
    参考文献 | 相关文章 | 多维度评价
    15. 基于概念复合的对偶三支概念格及其概念约简
    刘津, 米据生, 李仲玲, 李美争
    计算机科学    2023, 50 (6): 122-130.   DOI: 10.11896/jsjkx.220800109
    摘要340)      PDF(pc) (1497KB)(264)    收藏
    三支概念格通过正负算子相结合,既表示出了共同拥有的信息,又表示出了共同不拥有的信息,是对经典概念格的扩展。但在处理一些实际问题时,人们也会从反向出发,考虑集合的补集可能不拥有的信息和可能拥有的信息,对偶三支概念格应运而生。文中提出了一种基于形式背景的对偶概念及其补背景中对偶概念的复合来构造对偶三支概念格的方法,经验证,通过概念复合方法得到的对偶三支概念与通过对偶三支算子得到的概念相同。进一步讨论了基于可辨识矩阵求解对偶三支概念格的属性约简方法,并借助此思想,给出了基于概念可辨识矩阵的对偶三支概念约简方法。
    参考文献 | 相关文章 | 多维度评价
    16. 不协调广义决策多尺度序信息系统的最优尺度选择与规则提取
    杨烨, 吴伟志, 张嘉茹
    计算机科学    2023, 50 (6): 131-141.   DOI: 10.11896/jsjkx.220800149
    摘要132)      PDF(pc) (1437KB)(248)    收藏
    粒计算模拟人类思考问题的模式,在大数据挖掘和知识发现方面有独特优势。针对不协调的广义决策多尺度序信息系统的知识获取问题,利用证据理论来研究不协调的广义决策多尺度序信息系统的最优尺度选择与规则提取。首先,将优势关系引入决策多尺度信息系统中,并介绍广义决策多尺度序信息系统的相关概念;其次,通过引入不协调广义决策多尺度序信息系统的尺度组合概念,给出不同尺度组合下信息粒和集合的下近似与上近似的表示及其相互关系,并进一步定义了几种针对不同决策的不协调广义决策多尺度序信息系统的最优尺度组合概念,讨论了它们之间的关系;最后,给出了基于广义优势决策函数的辨识矩阵属性约简与规则提取方法。
    参考文献 | 相关文章 | 多维度评价
    首页 | 前页| 后页 | 尾页 第1页 共1页 共16条记录