此工具以自然语言处理工具为基础,结合我们长期积累的词库,对用户输入的中文(简体或繁体)文本内容进行分词和词性分析,输出指定数量高频词语的词频统计结果和词性分布数据,并生成可自定义编辑的词云图。
在平台【首页】或【话题】页中,点击【小工具】,可进入信度计算小工具页面。
平台支持直接输入文本和文件上传两种方式。文件上传支持上传xlsx/csv/docx/txt文件,xlsx及csv文件只会读取第一列内容。
分词粒度:默认只输出两个字或以上的词语,也可以选择包含单个字。
分词方式:支持通用词库和自定义词库。
分词数量:需要输出的高频词的数量。
分析词性:选择是否需要进行词性分析。
生成词云图后,右侧是词云编辑功能。
数据:支持在数据中编辑词语的名称、数量和词性
图形:支持在图形中自定义词云形状
样式:支持在样式中调整词云中词语显示的大小
注意:3000字符内的文档可以在小工具中处理。如果字符数超过3000,则需要前往算法挖掘中处理。