摘要: 随着后基因组时代的到来,如何去揭示序列背后隐藏的生命信息已成为当前生命科学探讨的主题。而控制基因表达的正是启动子序列,如何去识别和预测序列的启动子区域是基因研究的重点课题。隐马尔可夫模型是最近几年研究基因最主要的模型。本文首先探讨了EM算法并提出了随机迭代算法,在初始状态分布和散发矩阵都随机假设,而转移矩阵由序列计算出的奈件下时人类启动子序列进行识别,平均识别率达到了92.05%。改进了多分类问题中的“投票策略”,提出了“一票决定”算法,使算法次数由O(N2)降到了O(N),由此对多个DNA家族进行分类,
No related articles found! |
|