1. 首页
  2. 数据库
  3. 其它
  4. Twitter_争吵 源码

Twitter_争吵 源码

上传者: 2021-02-22 00:40:24上传 ZIP文件 872.17KB 热度 17次
Twitter_争吵 我对Twitter存档进行了增强的第一个数据集进行了评估,发现以下质量问题: •Tweet_id类型为int,应为字符串 •删除非原始的推文(转发) •将时间戳数据类型从字符串更改为日期时间类型 •为狗创建专栏 •修复expanded_urls中缺少的值 对于第二个数据集,我们有一个图像projections.tsv,在对其进行评估之后,我发现了以下问题: •jpg_url列中的URL重复 •Tweet_id数据类型不正确,应为字符串 •请注意p1,p2和p3列中的一些无用的下划线而不是空格 •修复大写字母,并用小写字母替换 对于第三个数据集(即tweets jso
下载地址
用户评论