DiVoMiner®设计理念及操作流程

DiVoMiner®平台是一站式内容分析法研究工具,结合传统方法和创新执行,能够帮助研究者进行文本数据挖掘和分析。平台提供了灵活且强大的团队协作管理功能,旨在满足实用性和学术性需求。

用户可利用在线或自行上传的定性与定量数据(如文字、二手统计数据、问卷数据、图片、音频、视频等)开展内容编码与统计分析。平台支持在线完成对文本内容的分类、语义判断、信度测试、类目设置(人工、AI)、编码(人工、NLP)等所有流程,从而形成可量化统计分析及可视化的全部流程。

DiVoMiner®是云平台,无需安装软件,在浏览器上即可访问和使用。提供简易的操作方式,用户即使不懂编程,也能进行文本内容分析,只需20%的时间就可完成过去占据80%时间的劳务性工作(数据处理和编码),产出高质量的论文,达到”数据进,价值出”(Data in Value out)的目标。

目前,DiVoMiner®已协助众多高校师生在新闻传播、经济管理、教育、旅游、医疗、艺术、体育等社会科学领域产出包括SCI、SSCI、核心期刊和毕业论文等。

点击查看DiVoMiner®用户的成果论文

人工智能辅助内容分析法

DiVoMiner®平台以人工智能辅助内容分析法为设计理念,兼顾量化和质化分析,具有系统化、客观性、可量化的特点。平台遵循严谨的内容分析法(Content Anaylsis)科学要求,结合人工智能、大数据技术,为用户提供文本数据分析的研究工具。可以说,人工智能辅助内容分析法源于传统研究方法,在新技术的加持下,有了创新的执行方式和研究分析潜力。

人工智能辅助内容分析的运行机制(见下图)是从海量数据采集结构化开始,汇集整合线上和(或)线下数据,使用网络挖掘、语义网络分析,甚至深度学习等自动化手段,寻找未知的规则,初步探索数据概貌。这部分正是传统方法所不能及、新技术给数据研究带来的巨大优势之一。

在线内容分析可以是人工编码、机器编码或是AI编码(尚未成熟,未来可期)。操作流程由人主导,并在机器的辅助下,完成对文本内容的分类和分析。

最后,完成质性数据的量化转换后,得到数据变量,并使用多种统计分析方法,获得意义和洞察,回答研究问题,验证研究假设。

注:AI编码暂未提供,未来可期。

具体的操作流程方面(见下图),随着技术的不断发展,传统内容分析法中的文献探讨、建立数据库、快速抽样、类目建构、编码工作、统计分析和可视化呈现等工作均可以使用人工智能协助研究,人工辅助校验,从而让研究员从繁琐的工作中释放出来,更加高效地进行研究。

DiVoMiner®操作流程介绍

依据人工智能辅助内容分析法,DiVoMiner®平台的操作流程主要分为四大部分,将传统内容分析法中强调的系统化、客观性和可量化的特点贯穿其中,并结合技术手段,将操作方法简化、明晰化,并且提供新的分析可能性。

  1. 准备样本

确定不同类型的数据来源,分别建立数据库,例如,历史文献数据与社交媒体数据格式有所不同;不同的社交媒体数据类型有所不同;将格式不同的数据类型分门别类上传至对应的数据子库,完成建库过程。

DiVoMiner®针对数据库的不同功能需求设计了四种类型数据库。用户上传数据至编码库,不同格式的数据放至不同的子库,不同子库之间字段可通用。后续数据探索、在线内容分析、统计分析及可视化等均基于编码库中数据进行分析。清洗数据后删除的数据放入回收库。

测试库设计用于测试编码(前测编码),要求编码员对相同的数据进行测试编码,计算编码员之间信度,在信度达到可接受的一致性水平后,开始正式人工编码。

如需要进行数据抽样,可建立抽样库,以随机或其他方式抽取部分数据,完成研究项目。

点击查看【编码库】【抽样库】【信度库】【回收库】之用途说明

  1. 探索数据

完成数据建库后,利用自动化算法等方法快速分析数据,查看数据结果,以了解数据概况。平台上可查询整体数据的自动化信息量趋势和词云图。还可以统计关键字次数、字数次数,用于数据的简单统计和后续数据清理。

另外,在开始介入人工内容分析之前,比如设置类目、进行人工或机器编码等,还可以在【统计分析】模块里对已有变量(如上传数据里标题、正文、来源、点赞量、分享数等等)进行统计分析,使用鼠标拖拽方式快速完成,一窥数据面貌。同时,【算法挖掘】提供自动化文本分析模型,可以快速得到情感分析、情绪分类、LDA主题、K-Means、相似度分析、语义网络分析、社交网络分析、语种识别等分析结果和可视化图表,这些途径均可以用来探索数据。

点击查看【算法挖掘】的用法

  1. 在线内容分析:

类目是内容分析法的基础,在一定程度上,类目建构的质量决定了内容分析的成败和好坏。编码类目表又叫编码表,相当于问卷调查中的调查表。由研究者设计编码类目,由编码员阅读文本材料并进行编码或分类。

对于内容编码可使用机器编码或人工编码,对于客观性较强的类目,比如人名、机构名等,可以交由机器判断,机器编码的准确性高,速度快,效率极高。对于主观性较强的类目,比如意向态度,机器判断的准确度可能较为欠缺,建议进行人工编码。

点击查看人工编码和机器编码的区别,应该如何选择?

对于质量控制,DiVoMiner®提供实时数据监测功能,可随时查看编码员工作绩效以及编码结果,提供便捷的方式修正数据结果。

  1. 结果呈现:

完成内容编码后,可进入数据分析环节。在平台上,用户可快速查看单变量的频数结果(【编码结果】页面),亦支持用户自制图表(【统计分析】页面),通过简单的拖拽式操作,快速生成图表,可调整可视化效果,满足用户需求。还可以利用全部变量(上传变量、内容编码产生的变量、算法挖掘产生的变量)综合进行多变量分析,结合质性文本、量化数据结合解读数据,最终获得数据价值。

点击查看快速查看编码结果(单变量、频数统计)的方法

点击查看【统计分析】的操作方法,可自定义词云图、交叉分析、卡方检验、相关性分析等

点击查看算法挖掘变量与其他变量进行多变量分析的方法

DiVoMiner®模块流程按照人工智能辅助内容分析法设计

DiVoMiner®平台上做研究,首先需要创建一个话题,等同于一个项目。话题内的左侧导航栏,便是按照方法论设计,可以用来执行完整的人工智能辅助内容分析法流程。

DiVoMiner®使用指引及教程

平台提供大量视频、文字、互动指引等使用教程,鼓励用户自主学习使用。此外,提供用户群、用户交流论坛、QQ在线客服等方式,提供针对性的服务。

QQ号:3625244667

微信号:DiVoMiner2023 【备注DiVoMiner用户及学科,加入对应用户群】

点击查看如何学习使用DiVoMiner?哪里找到在线教程和帮助?

Is this article helpful?