当前位置: 首页 > article >正文

StarRocks数据导出到Hive

文章目录

    • StarRocks数据导出到Hive
      • Hive建表
      • SR导出到HDFS
      • 导入Hive

StarRocks数据导出到Hive

Hive建表

# Hive建表列分隔符本次使用逗号
# 如果Hive正式表需要ORC或Parquet格式,需要先将SR导出的数据导入到TEXTFILE格式tmp表,然后再insert到ORC或Parquet格式正式表
# 如果Hive正式表需要TEXTFILE格式,SR可以直接EXPORT到正式表

# 临时表
CREATE TABLE xx_tmp (
    id INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',' 
LINES TERMINATED BY '\n'  
STORED AS TEXTFILE; 

# 正式表
CREATE TABLE xx (
    id INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',' 
LINES TERMINATED BY '\n'  
STORED AS ORC;

SR导出到HDFS

# SR导出的数据是csv文件

EXPORT TABLE ads_fms_point.ads_fund_conformance_his_waybill_cost 
TO "hdfs://10.82.192.4:8020/user/hive/warehouse/ads_fms_point.db/ads_fund_conformance_his_waybill_cost_tmp/" 
PROPERTIES
(
    "column_separator"=",",
    "load_mem_limit"="2147483648",
    "timeout" = "3600"
)
WITH BROKER
(
    "username" = "admin"
);

# 获取queryid
SELECT LAST_QUERY_ID();

# 查看导出状态
SHOW EXPORT WHERE queryid = "xx";

导入Hive

# 数据load到tmp表
LOAD DATA  INPATH '/user/hive/warehouse/ads_fms_point.db/ads_fund_conformance_his_waybill_cost_tmp/*'  INTO TABLE ads_fms_point.ads_fund_conformance_his_waybill_cost_tmp;

# 验证tmp表
select count(*) from ads_fms_point.ads_fund_conformance_his_waybill_cost_tmp;
hdfs dfs -ls /user/hive/warehouse/ads_fms_point.db/ads_fund_conformance_his_waybill_cost_tmp

# 写入正式表
insert into ads_fms_point.ads_fund_conformance_his_waybill_cost select * from ads_fms_point.ads_fund_conformance_his_waybill_cost_tmp;

# msck repair table ads_fms_point.ads_fund_conformance_his_waybill_cost;

ir table ads_fms_point.ads_fund_conformance_his_waybill_cost;



http://www.kler.cn/a/601030.html

相关文章:

  • Pear Admin Flask 开发问题
  • 深入理解现代C++在IT行业中的核心地位与应用实践
  • 【Linux网络-多路转接select】
  • PhotoShop学习02
  • 【蓝桥杯】每日练习 Day11 逆序对问题和多路归并
  • VMware 安装 mac os系统
  • vue项目中播放ws(Websocket协议)视频流
  • PHP开发:小区物业管理缴费小程序uniapp在线报修系统、活动报名、在线商城
  • Kotlin中 StateFlow 或 SharedFlow 的区别
  • 微信小程序开发:页面结构与样式设计
  • 如何在 Java 中查找 PDF 页面大小(教程)
  • 【C++初阶】--- 类与对象(中)
  • 蓝桥杯C++基础算法-多重背包(优化)
  • 字节跳动前端开发实习生面试总结
  • 石斛基因组-文献精读122
  • 【PostgreSQL教程】PostgreSQL 特别篇之 语言接口Python
  • chrome插件开发之API解析-chrome.scripting.executeScript()
  • STM32F103_LL库+寄存器学习笔记02 - 开启SysTick(滴答定时器)中断
  • 大摩闭门会:250324 学习总结报告
  • Tasklet_等待队列_工作队列