(一)模型介绍
基于情绪的分类结构理论,情绪分析模型通过分析社交媒体基本情绪词库(词库既包括标准的情绪词汇,也包括社交媒体上常用的情绪表达用语),并结合在线文本词汇匹配技术对文本数据进行分析测量,以获得快乐、悲伤、愤怒、恐惧和厌恶五种基本社会情绪强度分布。
(二)研发依据
1.董颖红,陈浩,赖凯声,乐国安.微博客基本社会情绪的测量及效度检验.心理科学[J].2015,38(5):1141-1146.
(三)算法说明
1.社交媒体基本情绪词库的构建
参考心境量表POMS 编制方法,构建了适合于推特研究的POMS–1(Pepe & Bollen, 2008)。该词库以POMS 量表的65个词作为种子词,从Wordnet(3版)和《罗热新千年同义词词典(1 版)》中搜索近义词,最后扩展而成的情绪词库。结合王一牛,周立明和罗跃嘉(2008) 研究情绪维度时所用的1500个名词、动词和形容词对词库进一步扩充,结合后期专业研究学者对词库的增删查改及归类比对而成。
2.五种基本社会情绪的计算过程为:通过构建的情绪词库识别出贴文中出现的全部情绪词,然后根据贴文的权重计算贴文在各种情绪类型上的得分,分数越高,情绪越强,分数越低,情绪越弱。模型默认返回分数最高的情绪类别作为该篇贴文所表达的情绪。
(四)适用场景
1.处理主观情绪比较明显的自然语言文本,自动判别结果的参考价值更有效。
2.处理句式、结构不是特别复杂的自然语言文本,自动判别结果的参考价值更有效。