当前位置: 首页 > article >正文

CSV文件数据导入hive

一、加载CSV文件数据到hive表步骤:

1、Hive上建表,通常会指定字段分隔符为逗号(row format delimited fields terminated by ‘,’ )
2、导入CSV文件

二、实操

以csv 文件中出现字段中含有逗号的场景为例:{“2020”: “1”,“2022”: “8”,“2024”: “25”}

1、建表

CREATE TABLE ads.mem_continue_order_y (
member_id               string   comment '会员号'
,trans_info              string   comment '消费订单-年汇总信息')
COMMENT '会员连续下单_年_推送表'
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' -- 使用 OpenCSVSerde 作为数据序列化程序
with serdeproperties (
'separatorChar' = ',', -- 分隔符
'quoteChar' = '"', -- 引号包围符号
'escapeChar' = '\' -- 转义字符
)
tblproperties("skip.header.line.count"="1") -- 跳过文件首行(当csv存在文件头的情况)

如果不使用tblproperties(“skip.header.line.count”=“1”),也可用sed -i ‘1d’ 文件名 删除文件首行

2、加载CSV文件数据:

此处的文件目录是linux本地文件目录,所以是LOCAL INPATH

LOAD DATA LOCAL INPATH '/home/bgyetl/etl/tmp/mem_continue_order_y.csv' overwrite INTO TABLE ads.mem_continue_order_y;

http://www.kler.cn/a/405002.html

相关文章:

  • 时序论文23|ICML24谷歌开源零样本时序大模型TimesFM
  • 【2024最新】基于springboot+vue的疫情网课管理系统lw+ppt
  • Unity3D基于ECS的游戏逻辑线程详解
  • 六大核心应用场景,解锁AI检测系统的智能安全之道
  • 葡萄酒(wine)数据集——LDA、贝叶斯判别分析
  • vue3+elementui-plus el-dialog全局配置点击空白处不关闭弹窗
  • 开发中使用UML的流程_02 CIM-1:定义业务流程
  • Docker 安装单机版mysql 并持久化数据
  • 【GNU】addr2line
  • 大前端的发展过程
  • 图像处理 之 凸包和最小外围轮廓生成
  • 开发体育赛事直播平台防止数据泄露的技术安全方案
  • Redis性能优化的18招
  • 掌握Golang中的数据竞争检测:runtime/race包全面教程
  • 探索Linux内核中的Runqueue:从O(n)到O(1)的演进与负载均衡应用
  • 卷积神经网络(CNN)中的权重(weights)和偏置项(bias)
  • qt连接postgres数据库时 setConnectOptions函数用法
  • Docker部署Canal实现将Mysql数据同步至ES
  • 机器学习笔记——KNN(K-Nearest Neighbors,K 近邻算法)
  • 【MySQL的故事】认识MySQL中的聚合函数以及聚合函数的作用,拿捏这些细节
  • Idea集成ApiFox插件
  • Percona XtraBackup备份docker版本mysql 5.7
  • 趋势洞察|AI 能否带动裸金属 K8s 强势崛起?
  • 什么是反向 DNS 查找以及它的作用是什么?
  • Banana Pi BPI-CanMV-K230D-Zero 采用嘉楠科技 K230D RISC-V芯片设计
  • Linux nftables实现内外网配置