首页标签分类
03Flume
2024-06-03 · 更新 2026-03-03约 1 分钟 · 110 字
大数据杂文记
000

flume的数据一致性问题

  • put和take事务(数据可能重复,数据写入channel,但commit提交失败)
  • filechannel(数据不丢)
    flume选用原因
    flume的拦截器
    flume的组件
    KafkaChannel的使用
  • source,kafkachannel,sink
  • kafkachannel,sink
  • source,kafkachannel(选用原因) 选用kafkasource,filechannel,hdfsink;但不选用kafkachannel,hdfssink的原因
  • 需要使用拦截器解决数据采集时的零点漂移问题
  • 拦截器是在source端完成的

本文作者:hedeoer

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!