2023年09月02日10阅读AI/大数据Flink从入门到放弃⑥—调优与问题排查:从入门到不秃头🎯 **本文目标**:让你从"作业又挂了"进化到"我知道为什么挂以及怎么修",掌握 Flink 生产环境的调优技巧和问题排查方法。
2023年08月26日11阅读AI/大数据Flink从入门到放弃⑤—CDC实时数据集成:告别离线同步🎯 **本文目标**:让你从"CDC 是什么"进化到"我能用 Flink CDC 搭建实时数据管道",彻底告别 T+1 的离线同步模式。
2023年08月19日10阅读AI/大数据Flink从入门到放弃④:用SQL玩转流处理🎯 **本文目标**:让你从"还要写 Java?"进化到"SQL 真香!",掌握 Flink SQL 的核心用法,用最简单的方式开发流处理应用。
2023年08月12日13阅读AI/大数据Flink从入门到放弃③—State与容错:有状态计算的基石🎯 **本文目标**:让你从"State 是什么"进化到"我知道为什么 Checkpoint 失败以及怎么调优",彻底掌握 Flink 有状态计算和容错机制。
2023年08月05日13阅读AI/大数据Flink从入门到放弃②-时间语义与窗口:和时间赛跑的艺术🎯 **本文目标**:让你从"Watermark 是什么"进化到"我知道为什么数据会丢以及怎么解决",彻底搞懂流处理中最核心也最让人头秃的时间问题。
2023年07月29日10阅读AI/大数据Flink从入门到放弃①:流批一体的秘密🎯 **本文目标**:让你从"Flink 和 Spark Streaming 有什么区别"进化到"我理解 Flink 的核心设计哲学",为后续深入学习打下坚实基础。
2023年07月22日12阅读AI/大数据OOM 避坑指南:大数据开发中那些让人头秃的内存溢出案例🎯 **本文目标**:让你从"又OOM了,重启试试"进化到"我知道为什么OOM以及怎么解决",从此不再被凌晨三点的告警电话惊醒。
2023年07月15日14阅读AI/大数据湖仓一体选型从入门到放弃系列:Hudi vs Iceberg vs Delta Lake> 🎯 **本文目标**:让你从"这三个有什么区别"进化到"我知道该选哪个以及为什么",终结数据湖表格式选型纠结症。
2023年07月01日10阅读AI/大数据Iceberg 从入门到放弃:表格式演进与时间旅行🎯 **本文目标**:让你从"Iceberg 和 Hudi 有什么区别"进化到"我知道 Iceberg 的元数据设计为什么这么牛",深入理解这个 Netflix 开源的数据湖表格式。
2023年06月24日11阅读AI/大数据Hudi从入门到放弃:增量数据湖的实现原理🎯 **本文目标**:让你从"Hudi 是什么"进化到"我知道 COW 和 MOR 该怎么选",彻底理解增量数据湖的核心原理。
2023年06月17日15阅读AI/大数据实时数仓架构从入门到放弃:Lambda vs Kappa之争🎯 **本文目标**:让你从"Lambda 和 Kappa 傻傻分不清"进化到"我知道什么场景用什么架构",终结架构选型纠结症。
2023年06月03日15阅读AI/大数据调度器选型对比:Airflow vs DolphinScheduler vs XXL-Job🎯 **本文目标**:让你从"这么多调度器不知道选哪个"进化到"我知道为什么选它",终结选型纠结症。
2023年05月27日14阅读AI/大数据DolphinScheduler从入门到放弃系列:国产调度器的崛起🎯 **本文目标**:让你从"又一个调度器"进化到"原来国产开源也能这么强",理解 DolphinScheduler 为什么能在 Apache 顶级项目中占有一席之地。
2023年05月20日15阅读AI/大数据Airflow从入门到放弃系列:以代码定义工作流的魅力🎯 **本文目标**:让你从"DAG 是什么"进化到"这个 DAG 写得真优雅",顺便理解为什么 Airflow 能成为调度器界的扛把子。
2023年05月13日13阅读AI/大数据OLAP 选型指南:ClickHouse vs Doris vs Presto🎯 **本文目标**:让你从"这么多 OLAP 引擎不知道选哪个"进化到"我知道为什么选它,以及什么时候该换"。