摘要: 统计自然语言处理中,一个很复杂的问题是数据稀疏问题。主要有两种平滑方法解决:回退法和线性插值法。本文分析和比较了几种典型的线性插值方法,着重研究了它们所引发的词性聚类倾向。在此基础上,给出了2种改进的平滑方法。实验表明,改进的方法比原来的方法有更出色的平滑效果。
张敬芝 高强 耿桦 潘金贵. 统计自然语言处理中的线性插值平滑技术[J]. 计算机科学, 2007, 34(6): 223-225. https://doi.org/
ZHANG Jing-Zhi, GAO Qiang, GENG Hua, PAN Jin-Gui (State Key Laboratory for Novel Software Technology of Nanjing University,Nanjing 210093). [J]. Computer Science, 2007, 34(6): 223-225. https://doi.org/