火车采集器/自动中文分词:修订间差异
来自站长百科
Spider.flynn(讨论 | 贡献) (新页面: {{火车采集器导航}} 在新建标签里边选“使用自定义固定格式的数据”,然后选"自动分词处理”。 '''注意''',可以对多个标签进行联合分词...) |
Spider.flynn(讨论 | 贡献) 无编辑摘要 |
||
第1行: | 第1行: | ||
{{火车采集器导航}} | |||
在新建标签里边选“使用自定义固定格式的数据”,然后选"自动分词处理”。 | 在新建标签里边选“使用自定义固定格式的数据”,然后选"自动分词处理”。 | ||
2011年6月14日 (二) 15:22的最新版本
在新建标签里边选“使用自定义固定格式的数据”,然后选"自动分词处理”。
注意,可以对多个标签进行联合分词.
最下边的自动分词,可以按词频对标签内的内容进行关键字提取。 打开辅助工具里的‘中文分词效果’测试“,看下具体的过程。
可以点击上边的编辑用户词库和编辑禁用词库来实现更多的分词效果。如果需要设置关键词的词性,请打开选项->自动分词设置,即可以有选择性的获取某些词性的关键字。