摘要: 目前,事件抽取的流行方法是以事件元素或触发词进行驱动,但该方法容易导致正反例不平衡,且在语料库规模较小时存在一定的数据稀疏问题。提出了一种基于事件实例驱动的事件抽取方法。首先,从文档句子中抽取出刻画一个事件发生有代表性的特征,构成候选事件实例表示;其次,通过二元分类器对新闻文本中的事件实例与非事件实例进行分类;最后,对事件实例采用基于层次聚类的k-mcdoids算法完成事件抽取。该方法不仅克服了正反例失衡以及数据稀疏问题,而且解决了预先定义事件类别的局限性。实验结果验证了该方法的有效性,对比传统方法,事件抽取的准确率与召回率均获得了显著的提高。
许旭阳,李弼程,张先飞,韩永峰. 基于事件实例驱动的新闻文本事件抽取[J]. 计算机科学, 2011, 38(8): 232-235. https://doi.org/
XU Xu-yang, LI Bi-cheng,ZHANG Xian-fei,HAN Yong-feng. News Text Event Extraction Driven by Event Sample[J]. Computer Science, 2011, 38(8): 232-235. https://doi.org/