当前位置: 首页 > article >正文

ETL工具: Kettle入门(示例从oracle到oracle的数据导入)

kettle介绍

ETL工具,用于对数据的抽取(Extract), 转换(Transform),加载 (Load)

Kettle 是一种ETL工具, 现称为 Pentaho Data Integration (PDI)

特点:纯JAVA语言编写

官方学习文档

网站: https://docs.hitachivantara.com/r/en-us/pentaho-data-integration-and-analytics/10.2.x/mk-95pdia000/getting-started-with-pdi/pentaho-data-integration-pdi-tutorial/step-6-orchestrate-with-jobs

kettle界面: 点击learn>>开始>>目录里的PDI入门

示例

比如搭建数仓(oracle)银行项目把数据从DB层导入DWD层

导入前需要先在DWD层新建和DB层表结构一样的表

建表sql

CREATE TABLE DWD.CI_CIE_CORP_CUST_INFO AS  SELECT * FROM DB.CI_CIE_CORP_CUST_INFO WHERE 1=2;

 使用Kettle导入步骤

分别把输入/输出里面的表输入/表输出拖入转换区

点击表输入>>新建>>填写信息(连接名称自定义)>>测试>>确定>>获取查询sql>>选择想要的表>>确定>>选择在sql里面包含字段名

如果测试连接失败, 可能是Kettle里面缺失oracle的jar包

把oracle的3个jar包复制拖入Kettle安装文件的lib里面, 重启Kettle即可

找到Kettle安装位置: 桌面快捷方式>>右击>>打开文件所在位置>>lib文件

选中表输入,按住shift键,把表输入和表输出连接起来

点击表输出>>新建>>填写信息(用户名是DWD,连接名称写个新名称)>>勾选指定数据库字段>>数据库字段>>获取字段

查看数据是否导入成功(oracle)

SELECT * FROM DWD.CI_CIE_CORP_CUST_INFO 

导入下一张表的数据

点击表输入>>获取qsl查询语句>>通过获取sql查询语句>>重新选择数据源表

点击表输出>>目标表的浏览>>重新选择目标表>>获取字段>>清除并增加所有>>运行

结束后在oracle查询是否导入成功

依次导入所有的数据


http://www.kler.cn/a/558267.html

相关文章:

  • 51单片机学习——动态数码管显示
  • ROS2 应用:按键控制 MoveIt2 中 Panda 机械臂关节位置
  • SAP 代码扫描工具
  • 鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
  • Linux离线环境安装miniconda并导入依赖包
  • Spring 依赖注入实战指南:XML、注解、Java 配置全面对比
  • 备忘录模式:快速恢复原始数据
  • 图数据库Neo4j面试内容整理-关系类型
  • Linux 性能更好的ftp客户端 lftp 使用详解
  • PHP Libxml:深入解析XML解析库及其在PHP中的应用
  • 【WebGL】attribute方式实例化绘制
  • 深入理解 SQL 事务隔离级别:脏读、不可重复读和幻读
  • 编程考古-忘掉它,Delphi 8 for the Microsoft .NET Framework
  • Redis作为缓存和数据库的数据一致性问题
  • ES6中Object.defineProperty 的详细用法和使用场景以及例子
  • php文件上传
  • _vm.xxxxxx is not a function“ vue2错误
  • 贪心算法
  • 基于 DeepSeek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
  • 使用Java爬虫获取1688 item_search_factory 接口的工厂搜索数据