算法主要考虑四方面:
- 标题中词语与正文中其他词的关系;
- 句子的长度;
- 句子的位置(一般文章的第二句比第一句要重要,作者往往在这里引入关键要点);
- 如果文章所在网站某些词出现更频繁,这些词要加权重。
一般自动摘要比较常用的一个是摘取文章中的关键词,另一个则是摘取文章中的关键的句子
extrank算法-句子的摘取
textrank其实就是pagerank算法扩展到句子上,来的到一些全局的信息。
本文共 246 字,大约阅读时间需要 1 分钟。
算法主要考虑四方面:
一般自动摘要比较常用的一个是摘取文章中的关键词,另一个则是摘取文章中的关键的句子
extrank算法-句子的摘取
textrank其实就是pagerank算法扩展到句子上,来的到一些全局的信息。
转载于:https://www.cnblogs.com/zzzsun/p/4102473.html