如何上传Excel格式文档?上传失败怎么办?日期字段

目前DiVoMiner平台支持的上传文档格式有Excel、WORD、Text、PDF、图片、视频链接、音频和第三方数据源。其中Excel是数据结构化最理想的一种格式。前期数据预处理得当,后续分析的难度大为降低,分析空间也更佳。因此,推荐尽量使用Excel格式上传数据。

上传前,请先检查Excel内的数据,是否已经做过基本的整理,确保数据源预处理时分类清晰、字段属性准确,文档大小符合要求。具体注意事项如下:

  1. Excel文档必须是xlsx格式,单个文档上限200M
  2. 上传的文档有多个sheet文件时,默认识别第一个sheet文件
  3. 首行字段名(变量名)。从第二行开始,一行是一条数据。
  4. 日期、时间类型的数据需要在Excel里是对应的“日期”格式,这样上传至平台的过程中,平台才能识别为“日期”属性,支持后续的时序分析。如果上传的日期数据只有“年份”信息,缺少月日时分秒,上传后平台会自动补齐日期为“1月1日”“零时零分零秒”。

Excel格式文档上传方式:

Excel准备妥当后,在上传数据页面找到PDF/图片文档上传入口。

上传后,在【预览数据】页面可以看到数据呈现的效果,并且给每一列数据的字段类型下定义,可选择文本、数值、布尔值、日期和数组等字段形式。标有小红点的字段,意思是该字段是新上传字段,可修改字段类型和字段名称。曾上传过的字段不能够再次修改字段类型。如果是再次上传的字段,可“转化为已有字段“类型

  • 文本:文本型数据,一般包括汉字、英文字母、拼音符号等,阿拉伯数字也可以作为文本型数据;
  • 数值:按数字尺度测量的数据;后续可以参与做量化统计分析。
  • 布尔值:又称为逻辑数据类型,又二进制数字组成,0和1,即真/假(True/ False);
  • 日期:日期时间数据,后续可以支持时序分析。

进入【配置数据】页面,此页面下预览效果与在【编码库】、【内容编码】、【质量监控】页面下查看到的数据样式一致。同时,也是由用户定义机器编码参与字段人工编码中机器预选的参与字段。简言之,需要对什么字段进行编码,就将什么字段放置在左侧的“标题”或“正文”框内。

上传配置提供三类模式:

  1. 完整上传:上传Excel档中全部的数据
  2. 数据排重:按照用户指定字段进行匹配检查,该字段下数据如果已经存在,就不再上传该条数据,如果该字段下数据没有重复,则新增数据,具体示例见页面说明。

3. 数据更新:按照用户指定字段进行匹配检查,更新其他字段下数据。

选择合适的上传模式,点击确认,即可完成数据上传。点击【查看数据】可以检查数据显示的情况,是否符合研究要求。

如在上传文档过程中失败,可检查Excel文档的格式(必须xlsx格式)、是否有错行、日期字段是否在Excel里的格式不正确等。如多次尝试后,仍然上传无法成功,请联系平台页面右下角【帮助中心】中的在线qq客服,提供出现问题的页面网址(url)、完整页面截图和上传失败的文档,方便工作人员协助查找原因。

点这里查看上传数据的视频教程

Is this article helpful?

       

相关文章