怎么给DataX的Json配置文件传参
DataX使用的是Python的运行方式,加载了一个Json格式的作用配置,但是有的小伙伴就很迷茫,如果用它跑例行任务,怎么处理出想要的Json文件,其实你可以在运行DataX之前,跑一个Linux脚本,如下
#!/bin/bash
# 定义变量
MYSQL_USERNAME="your_mysql_username"
MYSQL_PASSWORD="your_mysql_password"
MYSQL_TABLE="your_mysql_table"
HIVE_DATABASE="your_hive_database"
HIVE_TABLE="your_hive_table"
# 使用echo和重定向来生成JSON配置文件
cat > datax.json <<EOF
{
"job": {
"content": [
{
"reader": {
"name": "mysqlreader",
"parameter": {
"username": "$MYSQL_USERNAME",
"password": "$MYSQL_PASSWORD",
"connection": [
{
"table": ["$MYSQL_TABLE"],
"jdbcUrl":["jdbc:mysql://your_mysql_host:3306/$MYSQL_TABLE"]
}
]
}
},
"writer": {
"name": "hdfswriter",
"parameter": {
"defaultFS": "hdfs://your_hdfs_namenode:8020",
"fileType": "text",
"path": "/user/hive/warehouse/$HIVE_DATABASE.db/$HIVE_TABLE",
"fileName": "part",
"column": [
// 列出你的列
],
// 其他hdfswriter参数
}
}
}
],
"setting": {
"speed": {
"channel": 3
}
}
}
}
EOF
用这个脚本生成一个Json文件就可以啦