2023年09月02日16阅读AI/大数据Flink从入门到放弃⑥—调优与问题排查:从入门到不秃头🎯 **本文目标**:让你从"作业又挂了"进化到"我知道为什么挂以及怎么修",掌握 Flink 生产环境的调优技巧和问题排查方法。
2023年08月26日15阅读AI/大数据Flink从入门到放弃⑤—CDC实时数据集成:告别离线同步🎯 **本文目标**:让你从"CDC 是什么"进化到"我能用 Flink CDC 搭建实时数据管道",彻底告别 T+1 的离线同步模式。
2023年08月19日13阅读AI/大数据Flink从入门到放弃④:用SQL玩转流处理🎯 **本文目标**:让你从"还要写 Java?"进化到"SQL 真香!",掌握 Flink SQL 的核心用法,用最简单的方式开发流处理应用。
2023年08月05日18阅读AI/大数据Flink从入门到放弃②-时间语义与窗口:和时间赛跑的艺术🎯 **本文目标**:让你从"Watermark 是什么"进化到"我知道为什么数据会丢以及怎么解决",彻底搞懂流处理中最核心也最让人头秃的时间问题。
2023年07月29日14阅读AI/大数据Flink从入门到放弃①:流批一体的秘密🎯 **本文目标**:让你从"Flink 和 Spark Streaming 有什么区别"进化到"我理解 Flink 的核心设计哲学",为后续深入学习打下坚实基础。
2023年07月22日17阅读AI/大数据OOM 避坑指南:大数据开发中那些让人头秃的内存溢出案例🎯 **本文目标**:让你从"又OOM了,重启试试"进化到"我知道为什么OOM以及怎么解决",从此不再被凌晨三点的告警电话惊醒。
2023年07月15日22阅读AI/大数据湖仓一体选型从入门到放弃系列:Hudi vs Iceberg vs Delta Lake> 🎯 **本文目标**:让你从"这三个有什么区别"进化到"我知道该选哪个以及为什么",终结数据湖表格式选型纠结症。
2023年07月01日14阅读AI/大数据Iceberg 从入门到放弃:表格式演进与时间旅行🎯 **本文目标**:让你从"Iceberg 和 Hudi 有什么区别"进化到"我知道 Iceberg 的元数据设计为什么这么牛",深入理解这个 Netflix 开源的数据湖表格式。
2023年06月24日15阅读AI/大数据Hudi从入门到放弃:增量数据湖的实现原理🎯 **本文目标**:让你从"Hudi 是什么"进化到"我知道 COW 和 MOR 该怎么选",彻底理解增量数据湖的核心原理。
2023年06月17日18阅读AI/大数据实时数仓架构从入门到放弃:Lambda vs Kappa之争🎯 **本文目标**:让你从"Lambda 和 Kappa 傻傻分不清"进化到"我知道什么场景用什么架构",终结架构选型纠结症。
2023年06月03日18阅读AI/大数据调度器选型对比:Airflow vs DolphinScheduler vs XXL-Job🎯 **本文目标**:让你从"这么多调度器不知道选哪个"进化到"我知道为什么选它",终结选型纠结症。
2023年05月20日17阅读AI/大数据Airflow从入门到放弃系列:以代码定义工作流的魅力🎯 **本文目标**:让你从"DAG 是什么"进化到"这个 DAG 写得真优雅",顺便理解为什么 Airflow 能成为调度器界的扛把子。
2023年05月13日16阅读AI/大数据OLAP 选型指南:ClickHouse vs Doris vs Presto🎯 **本文目标**:让你从"这么多 OLAP 引擎不知道选哪个"进化到"我知道为什么选它,以及什么时候该换"。
2023年05月06日20阅读AI/大数据Doris/StarRocks从入门到放弃:实时 OLAP 的新选择🎯 **本文目标**:让你从"又是一个 OLAP 引擎"进化到"原来它们解决了 ClickHouse 的这些痛点"。
2023年04月29日15阅读AI/大数据ClickHouse从入门到放弃 列存原理:为什么它这么快🎯 **本文目标**:让你从"ClickHouse 真快"进化到"我知道它为什么快",下次面试官问起来不再支支吾吾。