多读书多实践,勤思考善领悟

Flume整合Kafka

Flume整合Kafka

一、背景先说一下,为什么要使用 Flume + Kafka? 以实时流处理项目为例,由于采集的数据量可能存在峰值和峰谷,假设是一个电商项目,那么峰值通常出现在秒杀时,这时如果直接将Flume聚合后的数据输入到Storm等分布式计算框架...

Storm集成Kafka

Storm集成Kafka

一、整合说明Storm官方对Kafka的整合分为两个版本,官方说明文档分别如下: Storm Kafka Integration : 主要是针对0.8.x版本的Kafka提供整合支持; Storm Kafka Integration...

深入理解Kafka副本机制

深入理解Kafka副本机制

一、Kafka集群Kafka使用Zookeeper来维护集群成员(brokers)的信息。每个broker都有一个唯一标识broker.id,用于标识自己在集群中的身份,可以在配置文件server.properties中进行配置,或者...

Kafka消费者详解

Kafka消费者详解

一、消费者和消费者群组在Kafka中,消费者通常是消费者群组的一部分,多个消费者群组共同读取同一个主题时,彼此之间互不影响。Kafka之所以要引入消费者群组这个概念是因为Kafka消费者经常会做一些高延迟的操作,比如把数据写到数据库或...

Kafka生产者详解

Kafka生产者详解

一、生产者发送消息的过程首先介绍一下Kafka生产者发送消息的过程: Kafka会将发送消息包装为ProducerRecord对象, ProducerRecord对象包含了目标主题和要发送的内容,同时还可以指定键和分区。在发送Pro...

Kafka简介

Kafka简介

一、简介ApacheKafka是一个分布式的流处理平台。它具有以下特点: 支持消息的发布和订阅,类似于RabbtMQ、ActiveMQ等消息队列; 支持数据实时处理; 能保证消息的可靠性投递; 支持消息的持久化存储,并通过多副本分布...

Spark Streaming 整合 Kafka

Spark Streaming 整合 Kafka

一、版本说明Spark针对Kafka的不同版本,提供了两套整合方案:spark-streaming-kafka-0-8和spark-streaming-kafka-0-10,其主要区别如下: spark-streaming-k...

基于Zookeeper搭建Kafka高可用集群

基于Zookeeper搭建Kafka高可用集群

一、Zookeeper集群搭建为保证集群高可用,Zookeeper集群的节点数最好是奇数,最少有三个节点,所以这里搭建一个三个节点的集群。 1.1 下载 & 解压下载对应版本Zookeeper,这里我下载的版本3.4.14。官...