【第一篇】Kafka 概述
在大数据中,使用了大量的数据。 关于数据,我们有两个主要挑战。第一个挑战是如何收集大量的数据,第二个挑战是分析收集的数据。 为了克服这些挑战,您必须需要一个消息系统。 Kafka专为分布式高吞吐量系统而设计。 Kafka往往工作得很好,作为...
在大数据中,使用了大量的数据。 关于数据,我们有两个主要挑战。第一个挑战是如何收集大量的数据,第二个挑战是分析收集的数据。 为了克服这些挑战,您必须需要一个消息系统。 Kafka专为分布式高吞吐量系统而设计。 Kafka往往工作得很好,作为...
在深入了解Kafka之前,您必须了解主题,经纪人,生产者和消费者等主要术语。 下图说明了主要术语,表格详细描述了图表组件。 在上图中,主题配置为三个分区。 分区1具有两个偏移因子0和1.分区2具有四个偏移因子0,1,2和3.分区3具有一个偏...
看看下面的插图。 它显示Kafka的集群图。 下表描述了上图中显示的每个组件。 S.No 组件和说明 1 Broker(代理) Kafka集群通常由多个代理组成以保持负载平衡。 Kafka代理是无状态的,所以他们使用ZooKeeper来维护...
到目前为止,我们讨论了Kafka的核心概念。 让我们现在来看一下Kafka的工作流程。 Kafka只是分为一个或多个分区的主题的集合。 Kafka分区是消息的线性有序序列,其中每个消息由它们的索引(称为偏移)来标识。 Kafka集群中的所有...
以下是在机器上安装Java的步骤。 步骤1 – 验证Java安装 希望你已经在你的机器上安装了java,所以你只需使用下面的命令验证它。 $ java -version 如果java在您的机器上成功安装,您可以看到已安装的Java的版本。 ...
首先让我们开始实现单节点单代理配置,然后我们将我们的设置迁移到单节点多代理配置。 希望你现在可以在你的机器上安装Java,ZooKeeper和Kafka。 在迁移到Kafka Cluster Setup之前,首先需要启动ZooKeeper,...
让我们使用Java客户端创建一个用于发布和使用消息的应用程序。 Kafka生产者客户端包括以下API。 KafkaProducer API 让我们了解本节中最重要的一组Kafka生产者API。 KafkaProducer API的中心部分是...
消费群是多线程或多机器的Apache Kafka主题。 消费者群体 消费者可以使用相同的 group.id 加入群组 一个组的最大并行度是组中的消费者数量←不是分区。 Kafka将主题的分区分配给组中的使用者,以便每个分区仅由组中的一个使用...
在本章中,我们将学习如何将Kafka与Apache Storm集成。 关于Storm Storm最初由Nathan Marz和BackType的团队创建。 在短时间内,Apache Storm成为分布式实时处理系统的标准,允许您处理大量数据...
在本章中,我们将讨论如何将Apache Kafka与Spark Streaming API集成。 关于Spark Spark Streaming API支持实时数据流的可扩展,高吞吐量,容错流处理。 数据可以从诸如Kafka,Flume,T...