当前位置: 首页 > article >正文

ClickHousez中如何定时清理过期数据库?

一、脚本清理

要在ClickHouse中自动删除过期的数据库,你可以使用ClickHouse的SQL命令结合外部脚本(如Shell脚本)和计划任务(如cron)来实现。下面是一个示例,展示如何创建一个Shell脚本来检查数据库的创建时间,并根据设定的时间阈值来删除过期的数据库。

步骤 1: 创建 Shell 脚本
首先,创建一个Shell脚本,用于检查ClickHouse中的数据库,并根据创建时间来删除过期的数据库。

示例脚本
创建一个名为 delete_expired_databases.sh 的文件,并添加以下内容:

#!/bin/bash

设置要检查的数据库前缀

DATABASE_PREFIX=my_database_

设置过期时间(天)

EXPIRATION_DAYS=30

获取当前时间戳

CURRENT_TIME=$(date +%s)

获取所有符合前缀的数据库

DATABASES= ( c l i c k h o u s e − c l i e n t − − q u e r y " S E L E C T n a m e F R O M s y s t e m . d a t a b a s e s W H E R E n a m e L I K E ′ (clickhouse-client --query "SELECT name FROM system.databases WHERE name LIKE ' (clickhouseclientquery"SELECTnameFROMsystem.databasesWHEREnameLIKEDATABASE_PREFIX%'")

遍历数据库

for DB in KaTeX parse error: Expected 'EOF', got '#' at position 19: …ABASES; do #̲ 获取数据库的创建时间 …(clickhouse-client --query “SELECT created_at FROM system.databases WHERE name = ‘$DB’”)

# 计算时间差
TIME_DIFF=$(( ($CURRENT_TIME - $(date -d "$CREATE_TIME" +%s)) / 86400 ))

# 检查是否过期
if [ $TIME_DIFF -gt $EXPIRATION_DAYS ]; then
    echo "Database $DB is expired. Deleting..."
    clickhouse-client --query "DROP DATABASE IF EXISTS $DB"
fi

done
步骤 2: 给脚本添加执行权限
确保脚本具有执行权限:

chmod +x delete_expired_databases.sh
步骤 3: 定期执行脚本
你可以使用Linux的cron来定期执行这个脚本。例如,如果你想每天凌晨2点执行这个脚本,可以将以下行添加到crontab:

用crontab -e 来编辑文件

检查是否安装了crontab命令
rpm -qa | grep crontab
如果提示未安装请自行安装,crontab安装包在系统光盘里面的pacekage文件夹crontabs安装包。执行命令,如下图所示,表示安装了crontab命令

第一次要选择linux编辑crontab方式,一般选择第二个

root@iZuf682dbngh2ck4cq9kluZ:/home/yulei# crontab -e
no crontab for root - using an empty one

Select an editor. To change later, run ‘select-editor’.

  1. /bin/nano <---- easiest
  2. /usr/bin/vim.basic
  3. /usr/bin/vim.tiny
  4. /bin/ed

Choose 1-4 [1]: 2
crontab: installing new crontab
添加cron定时任务
0 2 * * * /path/to/delete_expired_databases.sh

二、JAVA代码定时任务清理机制

1、查询过期的数据库

     Class.forName("ru.yandex.clickhouse.ClickHouseDriver");
        //一开始必须填一个已经存在的数据库
        String jdbcUrl = "jdbc:clickhouse://ip:8123/default";
        ClickHouseProperties properties = new ClickHouseProperties();
        properties.setUser("default");
        properties.setPassword("");
        properties.setSocketTimeout(30000);
        ClickHouseDataSource dataSou = new ClickHouseDataSource(jdbcUrl, properties);//这是官方给的创建方式
        ClickHouseConnection conn = dataSou.getConnection();
        ClickHouseStatement stat = conn.createStatement();
        ResultSet rs= stat.executeQuery("SELECT name FROM system.databases WHERE name LIKE 'webfunny_db_%'");
        while(rs.next()) {
            String dbName = rs.getString("name");
            if(dbName.contains("_")){
                String dbNameNew = dbName.substring((dbName.lastIndexOf("_") + 1), dbName.length());//20240222152127819
                String thirdDaysDate = DateUtil.getTimeStampByDays(30);
                if (FebsUtil.match("\\-?\\d+", dbNameNew) && Long.parseLong(dbNameNew) < Long.parseLong(thirdDaysDate)){
                    deleteCHDbNameList.add(dbName);
                }
            }
        }
        //打开创建的数据库
        stat.close();
        conn.close();

2、清理过期的数据库

     Class.forName("ru.yandex.clickhouse.ClickHouseDriver");
        //一开始必须填一个已经存在的数据库
        String jdbcUrl = "jdbc:clickhouse://ip:8123/default";
        ClickHouseProperties properties = new ClickHouseProperties();
        properties.setUser("default");
        properties.setPassword("");
        properties.setSocketTimeout(30000);
        ClickHouseDataSource dataSou = new ClickHouseDataSource(jdbcUrl, properties);//这是官方给的创建方式
        ClickHouseConnection conn = dataSou.getConnection();
        ClickHouseStatement stat = conn.createStatement();
        for (String dbName : deleteCHDbNameList) {
            stat.execute("DROP DATABASE IF EXISTS " + dbName);
        }
        //打开创建的数据库
        stat.close();
        conn.close();

注意事项
备份数据:在执行任何删除操作之前,请确保你已经备份了重要数据。
测试脚本:在生产环境中执行任何脚本之前,请务必在测试环境中彻底测试。
权限管理:确保执行脚本的用户有足够的权限来删除数据库。
监控和日志:设置适当的监控和日志记录,以便追踪删除操作的状态和结果。

好了感兴趣的同学可以直接访问webfunny进行实践操作
在这里插入图片描述


http://www.kler.cn/a/292033.html

相关文章:

  • 小程序19-微信小程序的样式和组件介绍
  • 《生成式 AI》课程 第3講 CODE TASK 任务3:自定义任务的机器人
  • 软件测试 —— 自动化基础
  • 37.超级简易的计算器 C语言
  • Redis实战案例(黑马点评)
  • ubuntu将firewall-config导出为.deb文件
  • 生信机器学习入门4 - scikit-learn训练逻辑回归(LR)模型和支持向量机(SVM)模型
  • Qt (13)【Qt窗口 —— 颜色对话框 QColorDialog】
  • spring cloud gateway 之删除请求头
  • 【CNN训练梯度裁剪】
  • HarmonyOS $r访问资源
  • MyPrint打印设计器(九)svg篇-圆
  • 【计算机视觉前沿研究 热点 顶会】ECCV 2024中Mamba有关的论文
  • C# NX二次开发-获取体全部面
  • Circuitjs 在线电路模拟器使用指南
  • tomcat日志显示中文乱码的方法解决
  • MySQL基础:索引
  • ESRI ArcGIS Pro 3.1.5新功能及安装教程和下载
  • python常用库学习-Matplotlib使用
  • Redis——BigKey
  • 【MySQL】主键优化原理篇——【数据组织方式&主键顺序插入&主键乱序插入&页分裂&页分裂】
  • 【Python机器学习】核心数、进程、线程、超线程、L1、L2、L3级缓存
  • 空气质量题数据处理与分析
  • 在元神操作系统中获取动态内存
  • HarmonyOS开发实战( Beta5版)AOT编译使用指南
  • 电脑知识:如何恢复 Word、媒体和存档文件?