当前位置: 首页 > news >正文

kafka为什么分区不能那么多

1.生产者内存模型被分区数量击穿
生产者调用send方法发送消息时,不会立即发送,而是先进入一个内存缓冲区,其核心结构是一个concurrentmap,以消息的key为key,value是一个deque,也就是说每一个分区都占一个消息队列,消息发送的时机是达到一定时间或者分区满了才会发送,分区越多,数据越难达到满的状态,发送次数越多,网络io越严重,而且分区越多,而且多个分区竞争发送机会是靠reentrantlock+condition来实现的分区越多竞争越激烈,
2.kafka之所以因为顺序读写和pagecache,分区越多导致磁头不断寻址,顺序读写退化成随机写,pagecache需要在多个文件之间切换,命中率降低
3.Linux系统下,kafka的每一个分区在运行时至少需要打开很多文件的句柄,句柄耗尽后会导致系统文件异常
4.分区多了对消费者的影响也很大,消费者在组在消费者加入或离开时会触发重新分配,分区变化时也会触发重新分配,重新分配会根据分区分配算法,遍历所有分区进行分配,阻塞kafka正常活动,造成stw,分区越多意味着单消费者会分到更多的分区,容易超时被踢出消费者组,再次出发重分配,恶性循环,
5.分区计算公式,max(目标吞吐量/单分区生产者吞吐量,目标吞吐量/单分区消费者吞吐量),在高并发场景下6至12个分区即可满足,

http://www.zskr.cn/news/1395284.html

相关文章:

  • 2026年探秘!江苏这家高强度螺栓源头工厂究竟藏着什么生产秘诀?
  • 深圳除甲醛服务第三方调研报告:基于行业标准与实测数据的客观分析 - 环保除醛知识库
  • ThreadLocal 用了 WeakReference,为什么还会内存泄漏
  • lilac_paper_deep_dive_markdown_cn
  • 外卖系统小程序开发方案解析:直播、团购与外卖功能如何融合
  • 招聘律师与所业务范围
  • 免费CRM系统有哪些?一文分清真假免费,中小企业零成本选型攻略
  • 为内容创作平台集成Taotoken实现多模型文章辅助生成与润色
  • 独立开发者如何借助Taotoken构建多模型AI助手应用
  • GNN与强化学习融合:构建动态个性化推荐系统的核心技术解析
  • t-SNE非线性降维结合深度学习提升高光谱图像分类精度
  • 2026年5月北京钻石回收店推荐:正规靠谱商家指南与收的顶实测 - 奢侈品回收测评
  • H.264压缩域低码率鲁棒水印:原理、实现与工程实践
  • 用过才敢说!盘点2026年人气爆表的的AI论文工具
  • TAE-GAN:融合情感分析的文本到图像生成模型实践
  • 实测才敢推!2026年最值得信赖的专业降AI率网站
  • iPhone17首次降价就杀疯了!销量直逼3000万台
  • 利用taotoken为ubuntu上的claude code提供稳定可靠的api后备支持
  • Wireshark蓝牙抓包
  • 桌面全能N合一工具 一个软件搞定时钟 日历 天气 记事 屏保 任务栏全场景
  • 动态优化集成学习:解决中医文本命名实体识别中的类别不平衡与实体稀疏问题
  • 机器学习赋能硬件安全:从漏洞检测到侧信道分析的实践指南
  • Redis 有序集合(Zset / Sorted Set)
  • 1.4t4
  • 从理想模型到现实调度:WFQ算法的公平性保障与实现挑战
  • VMware9.1升级CSR报错修复+vSphere容器与Docker区别详解
  • 2026最危险的AI工具排名——不是垫底的,而是排第4、第6、第9的“高分伪强者”,它们正悄悄拖垮你的交付周期
  • 2026年PMP最佳报考时间已定!过来人建议:优先锁定9月
  • 基于图神经网络与社区检测的教育公平性分析:从数据洞察到精准干预
  • 2026 实测明星同款声音克隆 AI 工具 短视频批量创作合规高还原优选榜单 - 品牌企业推荐师(官方)