库的关系:【编码库】【抽样库】【信度库】【回收库】之用途说明

在DiVoMiner®上创建话题成功后,会自动进入到【数据管理】界面。刚开始接触平台的用户可能会有点疑惑,平台左侧的这些按钮,【编码库】、【抽样库】、【测试库】、【回收库】这些系统定义的数据库差别是什么?各自的作用又是什么呢?

首先小编请大家看下面这张图,做个初步了解,然后再一一详细介绍。

一、 数据库管理:【编码库】是内容编码及后续分析的基础

准备数据阶段,首先需要确定不同类型的数据来源,分别建立数据库,例如,历史文献数据与社交媒体数据格式有所不同;不同的社交媒体数据类型有所不同;将格式不同的数据类型分门别类上传至对应的数据库的【编码库】,给数据库命名,完成建库过程。

重点强调的是:不同数据库之间字段可通用,只需要对同一字段命名一致。后续数据探索、在线内容分析、统计分析及可视化等是基于【编码库】中数据进行分析。

接下来建立【抽样库】或是【测试库】也是在【编码库】中操作,使用功能键【抽样】、【随机导入到测试库】完成。

二、 抽样库-为研究方法带来更多的可能性

在DiVoMiner®平台的研究流程设计中,是否需要建立【抽样库】看研究者的需求。需要指出的是平台的设计理念及方法论核心是大数据技术辅助在线内容分析法,因此,面对体量庞大且结构繁杂,分析难度较大的文本大数据,其运算能力具有优势,在平台提供的范围内是能够保证对海量文本数据进行计算。

需要重点强调的是,在DiVoMiner®平台的研究设计中,【抽样库】和【编码库】是独立的关系,彼此独立!!!【抽样库】中同样有【编码库】、【测试库】和【回收库】的配置。点击查看抽样方法

三、 【测试库】-为编码员之间的信度测试提供数据

【测试库】是从【编码库】中抽取部分数据建立,用于测试编码(前测编码),要求编码员对相同的数据进行测试编码,计算编码员之间信度,在信度达到可接受的一致性水平后,开始正式人工编码。

四、 【回收库】-存储清洗数据后删除的数据

清洗数据后删除的数据全部会放到【回收库】中,可在【回收库】中对数据进行恢复【全部恢复】或彻底删除的操作【清空回收库】

Is this article helpful?

       

相关文章