1. 首页
  2. 编程语言
  3. Python
  4. python处理数据,存进hive表的方法

python处理数据,存进hive表的方法

上传者: 2021-05-03 11:08:07上传 PDF文件 168.09 KB 热度 12次

首先,公司的小组长给了我一个任务,把一个txt的文件中的部分内容,存进一个在hive中已有的表的相同结构的表中。所以我的流程主要有三个,首先,把数据处理成和hive中表相同结构的数据,然后仿照已有的hive中表的结构再创建一张新的数据表,最后把本地的txt文件上传到hive中新建的数据表中。大家要注意几个地方,原来的数据是按照tab来划分的,所以我们要数好对应的tab的数目,好来计算出来数据的实际的位置信息,然后我们按照原来hive表中的数据顺序,重新排列我们新建表的数据的顺序,下面给大家看看结果:其中line[0]=null,line[1]=102,大家以此类推。建好表之后,把数据导入到新表之中:最后给大家看看我的最终的结果:

下载地址
用户评论