当前位置: 首页 > article >正文

Kafka消息自定义序列化

文章目录

  • 1. 默认序列化
  • 2.自定义序列化
  • 3.示例
  • 4.自定义解序列化器


1. 默认序列化

在网络中发送数据都是以字节的方式,Kafka也不例外。Apache Kafka支持用户给broker发送各种类型的消息。它可以是一个字符串、一个整数、一个数组或是其他任意的对象类型。序列化器(serializer)负责在producer发送前将消息转换成字节数组;而与之相反,解序列化器(deserializer)则用于将consumer接收到的字节数组转换成相应的对象。
常见的serializer有:

  • ByteArraySerializer:本质上什么都不用做,因为已经是字节数组了。
  • ByteBufferSerializer:列化ByteBuffer。
  • BytesSerializer:序列化Kafka自定义的 Bytes 类。
  • DoubleSerializer:列化 Double 类型
  • IntegerSerializer:列化Integer 类型
  • LongSerializer:序列化Long类型。
  • StringSerializer:序列化 String 类型。

producer的序列化机制使用起来非常简单,只需要在构造producer时同时指定参数key.serializer 和 value.serializer的值即可,用户可以为消息的key和value 指定不同类型的 serializer,只要与解序列类型分别保持一致就可以。

2.自定义序列化

Kafka支持用户自定义消息序列化。若要编写一个自定义的serializer,需要完成以下3件事情。
1)定义数据对象格式。
2)创建自定义序列化类,实现 org.apache.kafka.common.serialization.Serializer 接口,在serializer方法中实现序列化逻辑。
3)在用于构造KafkaProducer 的Properties 对象中设置 key.serializer 或 value.serializer取决于是为消息key还是 value 做自定义序列化。

3.示例

下面结合一个实例来说明如何创建自定义的serializer。首先定义待序列化的数据对象。本例中使用一个简单的Java POJO对象,如下面的代码所示:

public class User {
    private String firstName;
    private String lastName;
    private int age;
    private String address;

    public User(String firstName, String lastName, int age, String address) {
        this.firstName = firstName;
        this.lastName = lastName;
        this.age = age;
        this.address = address;
    }
    @Override
    public String toString() {
        return "User{" +
                "firstName='" + firstName + '\'' +
                ", lastName='" + lastName + '\'' +
                ", age=" + age +
                ", address='" + address + '\'' +
                '}';
    }
}

接下来创建 serializer。本例中使用了jackson-mapper-asl包的 ObjectMapper 帮助我们直接把对象转成字节数组。为了使用该类,你需要在producer工程中增加依赖:

<dependency>
       <groupId>org.codehaus.jackson</groupId>
       <artifactId>jackson-mapper-asl</artifactId>
       <version>1.9.13</version>
</dependency>

UserSerializer代码如下:

import org.apache.kafka.common.serialization.Serializer;
import org.codehaus.jackson.map.ObjectMapper;
import java.io.IOException;
import java.util.Map;
public class UserSerializer implements Serializer<User> {
    private ObjectMapper objectMapper;
    @Override
    public void configure(Map configs, boolean isKey) {
        objectMapper=new ObjectMapper();
    }
    @Override
    public byte[] serialize(String topic, User data) {
        byte[] ret =null;
        try {
            if (data == null){
                System.out.println("Null received at serializing");
                return null;
            }
            ret=objectMapper.writeValueAsString(data).getBytes();
        } catch (IOException e) {
           e.printStackTrace();
        }
        return ret;
    }

    @Override
    public void close() {
    }
}

指定Serializer,然后构建消息发送:

import com.exm.collectcodenew.kafka.producer.customSerializer.User;
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.Producer;
import org.apache.kafka.clients.producer.ProducerRecord;
import java.util.Properties;
import java.util.concurrent.ExecutionException;
public class ProducerTest {
    public static void main(String[] args) throws ExecutionException, InterruptedException {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");//必须指定
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");//必须指定
        props.put("value.serializer", "com.exm.collectcodenew.kafka.producer.customSerializer.UserSerializer");//必须指定
        props.put("acks", "-1");
        props.put("retries", 3);
        props.put("batch.size", 323840);
        props.put("linger.ms", 10);
        props.put("buffer.memory", 33554432);
        props.put("max.block.ms", 3000);
        props.put("partitioner.class","com.exm.collectcodenew.kafka.producer.customPartitioner.AuditPartitioner");
        Producer<String, String> producer = new KafkaProducer<>(props);
        //构建User对象
        User user = new User("Z","tt",18,"Beijing,China");
        ProducerRecord record = new ProducerRecord("topic-test",user);
        producer.send(record);
        producer.close();
    }
}

4.自定义解序列化器

Kafka支持用户自定义消息的deserializer。成功编写一个自定义的deserializer需要完成以下3件事情。
1)定义或复用 serializer 的数据对象格式,
2) 创建自定义 deserializer 类,令其实现 org.apache.kafka.common.serialization.Deserializer接口。在deserializer方法中实现 deserialize 逻辑。
3)在构造KafkaConsumer的Properties对象中设置key.deserializer和(或)value.deserializer为上一步的实现类。
依然使用序列化中的User 例子来实现自定义的 deserializer。代码如下。

import org.apache.kafka.common.serialization.Deserializer;
import org.codehaus.jackson.map.ObjectMapper;
import java.io.IOException;
import java.util.Map;
public class UserDeserializer implements Deserializer {
    private ObjectMapper objectMapper;
    @Override
    public void configure(Map configs, boolean isKey) {
        objectMapper = new ObjectMapper();
    }
    @Override
    public Object deserialize(String topic, byte[] data) {
        User user =null;
        try {
            user=objectMapper.readValue(data,User.class);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }finally {
            return user;
        }
    }
    @Override
    public void close() {
    }
}

消费者代码:

import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import java.util.Arrays;
import java.util.Properties;
public class ConsumerTest {
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");//必须指定
        props.put("group.id","test-group");//必须指定
        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");//必须指定
        props.put("value.deserializer", "com.exm.collectcodenew.kafka.producer.customSerializer.UserDeserializer");//必须指定
        props.put("enable.auto.commit","true");
        props.put("auto.commit.interval.ms","1000");
        props.put("auto.offset.reset","earliest");//从最早的消息开始读取
        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
        //创建consumer实例
        consumer.subscribe(Arrays.asList("topic-test"));
        while(true){
            ConsumerRecords<String,String> records=consumer.poll(1000);
            for (ConsumerRecord<String, String> record: records){
                System.out.printf("offset=%d,key=%s,value=%s%n",record.offset(),record.key(),record.value());
            }
        }
    }
}

http://www.kler.cn/a/596101.html

相关文章:

  • golang接口用法-代码案例
  • vulhub靶场matrix-breakout-2-morpheus
  • java设计模式之工厂模式《铸剑风云录》
  • vue3:ref , reactive
  • 论华为 Pura X 折叠屏性能检测
  • S32K144外设实验(三):ADC单通道连续采样(中断)
  • AudioTrack
  • 树莓集团数字产业布局解读:战略+商业双驱动
  • 【数据挖掘】Python基础环境安装配置
  • 每日一题--C与C++的差别
  • Mac 上开发 Ragflow
  • PyCharm找不到包?一文解决 No module named报错~
  • 当DeepSeek走进生活:一场颠覆日常的智能革命
  • Trae AI 上新 SSHremote:服务器 Python 接口日志排查实战指南
  • ArkTS 基础语法介绍
  • 相机光学中一些疑难问题的解释
  • 【春招笔试】阿里云2025.03.20
  • 批量给 PPT 幻灯片页面添加文字和图片水印
  • 用ArcGIS做一张符合环评要求的植被类型图
  • 后端安全可靠性