下载地址:
下载地址1(本站为飞网专业下载站,域名:down.cfei.net)
资源简介:
关键词抽取(Keywords Extraction)指的是如何从一篇文档(或多篇相关文档)中自动抽取出能很好地代表文档主题的若干个词或短语。关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤、文档摘要等各种智能文本信息处理领域,具有很好的应用价值。I3S KeyExtrator采用适合于汉语特点的关键词抽取技术。该系统基于中科院计算所多年积累的背景知识库,将汉语智能分词算法与基于AV邻接的新词/短语识别方法有机结合,并利用信息论方法对抽取出的词和短语进行重要性评估,同时借助模糊匹配技术对中间抽取结果进行冗余过滤,使抽取出的关键词具有很好的主题代表性和区分度。
飞网下载站,免费下载共享资料,内容涉及教育资源、专业资料、IT资源、娱乐生活、经济管理、办公文书、游戏资料等。