当前位置：首页 > article >正文

⚙️ 如何调整重试策略以适应不同的业务需求？

article 2024/12/28 14:29:20

调整 Kafka 生产者和消费者的重试策略以适应不同的业务需求，需要根据业务的特性和容错要求来进行细致的配置。以下是一些关键的调整策略：

业务重要性：
- 对于关键业务消息，可以增加重试次数，并设置较长的重试间隔，以减少消息丢失的风险。
- 对于非关键业务消息，可以减少重试次数或不进行重试，以避免不必要的资源消耗。
消息幂等性：
- 如果业务逻辑是幂等的，即多次处理相同消息不会导致业务状态不一致，可以增加重试次数。
- 如果业务逻辑不是幂等的，需要谨慎设置重试策略，或者实现去重逻辑。
消息时效性：
- 对于时效性要求高的消息，可以减少重试间隔，以便快速尝试重新发送。
- 对于时效性要求不高的消息，可以增加重试间隔，减少对 Kafka 集群的压力。
系统容量和负载：
- 根据 Kafka 集群和下游系统的容量和负载情况调整重试策略，避免因重试导致的额外负载影响系统稳定性。
错误类型：
- 对于临时性错误（如网络问题），可以设置较高的重试次数和较短的重试间隔。
- 对于永久性错误（如消息格式错误），应减少重试次数，避免无意义的重试。
死信队列（DLQ）：
- 对于重试次数用尽后仍然发送失败的消息，可以配置死信队列进行存储，以便后续分析和处理。
监控和告警：
- 实施实时监控，对重试次数、失败率等关键指标进行监控，并设置告警阈值。
业务流程控制：
- 在业务流程中实现重试逻辑，例如在业务层捕获异常并根据业务规则进行重试。
自定义重试策略：
- 实现自定义的重试策略，例如指数退避策略，以适应特定的业务场景。
事务性消息：
- 如果业务要求消息发送的原子性，可以启用事务性消息发送，确保消息要么全部发送成功，要么全部不发送。
资源限制：
- 考虑到生产者和消费者的资源限制，如内存和网络带宽，合理设置重试策略，避免资源耗尽。
反馈机制：
- 建立反馈机制，根据业务运行情况和系统性能反馈调整重试策略。

通过综合考虑上述因素，可以为不同的业务需求定制合适的重试策略，以确保 Kafka 消息系统的高效性和可靠性。

在这里插入图片描述

以下是一些代码案例，展示了如何根据不同的业务需求调整 Kafka 生产者和消费者的重试策略

在这里插入图片描述

Kafka 生产者重试策略案例

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.Producer;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.common.serialization.StringSerializer;

import java.util.Properties;

public class CustomRetryProducerDemo {
    public static void main(String[] args) {
        // 配置生产者属性
        Properties props = new Properties();
        props.put("bootstrap.servers", "4.5.8.4:9092");
        props.put("key.serializer", StringSerializer.class.getName());
        props.put("value.serializer", StringSerializer.class.getName());
        props.put("retries", 5); // 设置重试次数
        props.put("retry.backoff.ms", 1000); // 设置重试间隔为1秒
        props.put("buffer.memory", 33554432); // 设置缓冲区大小
        props.put("batch.size", 16384); // 设置批次大小
        props.put("linger.ms", 10); // 设置等待时间为10毫秒
        props.put("max.in.flight.requests.per.connection", 1); // 设置最大在途请求数

        // 创建生产者实例
        Producer<String, String> producer = new KafkaProducer<>(props);

        // 发送消息
        for (int i = 0; i < 100; i++) {
            String key = "key-" + i;
            String value = "value-" + i;
            ProducerRecord<String, String> record = new ProducerRecord<>("test-topic", key, value);
            producer.send(record, (metadata, exception) -> {
                if (exception != null) {
                    // 处理消息发送失败的情况
                    System.err.println("发送消息失败：" + exception.getMessage());
                } else {
                    // 处理消息发送成功的情况
                    System.out.println("消息发送成功，偏移量：" + metadata.offset());
                }
            });
        }

        // 关闭生产者
        producer.close();
    }
}

Kafka 消费者重试策略案例

import org.apache.kafka.clients.consumer.Consumer;
import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.serialization.StringDeserializer;

import java.time.Duration;
import java.util.Collections;
import java.util.Properties;

public class CustomRetryConsumerDemo {
    public static void main(String[] args) {
        // 配置消费者属性
        Properties props = new Properties();
        props.put("bootstrap.servers", "4.5.8.4:9092");
        props.put("group.id", "test-group");
        props.put("enable.auto.commit", "true");
        props.put("auto.commit.interval.ms", "1000");
        props.put("key.deserializer", StringDeserializer.class.getName());
        props.put("value.deserializer", StringDeserializer.class.getName());
        props.put("max.poll.records", 500); // 设置每次拉取的最大记录数
        props.put("fetch.min.bytes", 1024); // 设置最小获取1KB的数据
        props.put("fetch.max.wait.ms", 500); // 设置最大等待500ms

        // 创建消费者实例
        Consumer<String, String> consumer = new KafkaConsumer<>(props);

        // 订阅主题
        consumer.subscribe(Collections.singletonList("test-topic"));

        // 消费消息
        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
            for (ConsumerRecord<String, String> record : records) {
                try {
                    // 处理消息
                    System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
                    // 假设处理消息可能会失败
                    if (record.value().contains("error")) {
                        throw new RuntimeException("模拟处理消息失败");
                    }
                } catch (Exception e) {
                    // 处理消息失败，记录日志或重试
                    System.err.println("处理消息失败：" + e.getMessage());
                    // 可以在这里实现重试逻辑，例如将消息发送到死信队列
                }
            }
            // 批量提交偏移量
            consumer.commitSync();
        }
    }
}

死信队列（DLQ）案例

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.Producer;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.common.serialization.StringSerializer;

import java.util.Properties;

public class DLQProducerDemo {
    public static void main(String[] args) {
        // 配置生产者属性
        Properties props = new Properties();
        props.put("bootstrap.servers", "4.5.8.4:9092");
        props.put("key.serializer", StringSerializer.class.getName());
        props.put("value.serializer", StringSerializer.class.getName());
        props.put("retries", 5); // 设置重试次数
        props.put("retry.backoff.ms", 1000); // 设置重试间隔为1秒

        // 创建生产者实例
        Producer<String, String> producer = new KafkaProducer<>(props);

        // 发送消息
        for (int i = 0; i < 100; i++) {
            String key = "key-" + i;
            String value = "value-" + i;
            ProducerRecord<String, String> record = new ProducerRecord<>("test-topic", key, value);
            producer.send(record, (metadata, exception) -> {
                if (exception != null) {
                    // 处理消息发送失败的情况
                    System.err.println("发送消息失败：" + exception.getMessage());
                    // 将失败的消息发送到死信队列
                    ProducerRecord<String, String> dlqRecord = new ProducerRecord<>("test-topic-DLQ", key, exception.getMessage());
                    producer.send(dlqRecord);
                } else {
                    // 处理消息发送成功的情况
                    System.out.println("消息发送成功，偏移量：" + metadata.offset());
                }
            });
        }

        // 关闭生产者
        producer.close();
    }
}