kettle不同数据源的字段不一致的合并后插入数据库
kettle不同数据源的字段不一致的合并后插入数据库
- 问题描述
- 尝试解决
- 最终解决
- 总结
问题描述
迁移数据时,要对一个数据源的数据列表 的每一行数据追加一个固定值,这个固定值不是常量,这个固定值需要查询另一个数据源获取,
最后还要把这个带固定值的数据列表插入新表。
详细描述如下:
合并前,字段完全不一样。
select t.id, t.name,t.sex from T t
数据源1: T表
数据源2: T1表
select t.group_name from T1 t where group_code='x'
现在期望转换后的效果
插入新表T2
INSERT INTO T2(id,name,sex,group_name ) VALUE(1,'xiaozhang',1,'A组');
尝试解决
你可能会觉得把这个分组的名称的可以设置变量(核心对象-作业-设置变量) ,合并时使用这个变量。
1、你可能kettle组件会用核心对象-连接-合并记录
这个使用前提是2张表的字段和行列要一致才行。
2、你可能kettle组件会用核心对象-连接-记录集连接
这个使用前提是2张表的字段和行列要一致才行。
3、你可能kettle组件会用核心对象-转换-增加常量
这个无法获取设置变量的值 ,因为要用${group_name}。
4、你可能kettle组件会用核心对象-转换-设置字段值
先查询这个group_name,同时设置成变量,然后插入/更新(核心对象-输出-插入/更新),就可以选这个这个变量,
没想到,插入时会找不到这个字段值。
最终解决
通过前面的大量的尝试,最终发现核心对象-作业-获取变量这个组件
核心对象-作业-设置变量
核心对象-作业**-获取变量**
这个获取变量可以取到${group_name}的值。巴适得板。
完美解决!!!
总结
对kettle的基本组件,还不是很熟悉,希望后续通过项目实践,多多学习kettle基础组件的使用,这次花了大半天才解决这个问题。希望后面解决问题,提高效率。
又学会一个Kettle变量的操作技巧。
有数据迁移问题,欢迎私信一起谈论学习。