当前位置: 首页 > article >正文

二百八十、ClickHouse——用Kettle对DWD层补全的清洗数据进行记录

一、目的

在对DWD层清洗数据进行补全后,需要生成相应的补全记录,作为数据的标记

二、实施步骤

2.1 建表

create  table  if not exists  hurys_jw.dwd_data_correction_record(
    data_type      Int32      comment '数据类型 1:转向比,2:统计,3:评价,4:区域,6:静态排队,7:动态排队',
    device_no      String     comment '设备编号',
    id             String     comment '唯一ID',
    create_time    DateTime   comment '创建时间',
    record_type    Int32      comment '记录类型 0:补全,1:修复',
    day            Date       comment '日期'
)
ENGINE = MergeTree
PARTITION BY day
PRIMARY KEY (day,id)
ORDER BY (day,id)
SETTINGS index_granularity = 8192;

2.2 SQL语句

--1.2统计数据补全记录
select
       '2' data_type,
       t2.device_no,
       t2.id,
       t2.create_time,
       '0' record_type,
       cast(t2.day as String) day
from hurys_jw.dwd_statistics as t2
left join hurys_jw.ods_statistics as t3
on t3.device_no=t2.device_no and t3.create_time=t2.create_time and t3.lane_no=t2.lane_no
       and t3.section_no = t2.section_no and t3.coil_no=t2.coil_no
where t2.day='2024-12-16'  and  length(t3.device_no)=0
;

注意红色部分,由于DWD清洗表的device_no没有设置允许非空,因此不能使用 t3.device_no is null 作为条件

2.3 Kettle任务

2.3.1 newtime

2.3.2 替换NULL值

2.3.3 clickhouse输入

2.3.4 字段选择

2.3.5 clickhouse输出

2.3.6 Kettle任务运行

搞定!


http://www.kler.cn/a/445075.html

相关文章:

  • 【真人模型】Stable Diffusion:人脸特美的人像摄影大模型
  • MySQL批量删除字段跑路?
  • Ubuntu 22.04永久保存路由
  • Vue3组件数据双向绑定
  • 09-C语言格式化字符串操作
  • React 工具和库面试题(一)
  • Vscode打开后闪退问题
  • 【leetcode100】随机链表的复制
  • Java游戏开发基础:从零开始制作一个简单的2D游戏
  • Linux下搭建和简单配置FTP服务器
  • (11)YOLOv9算法基本原理
  • Vue.js前端框架教程3:Vue setup语法糖和异步操作
  • Redis——缓存双写一致性问题
  • 预览和下载 (pc和微信小程序)
  • git bash中文显示问题
  • ubuntu history 存放 更多
  • 软件项目需求分析的实践探索(1)
  • How to run Flutter on an Embedded Device
  • 1_HTML5 Canvas 概述 --[HTML5 API 学习之旅]
  • 电商数据采集电商,行业数据分析,平台数据获取|稳定的API接口数据