2023年08月12日48阅读AI/大数据Flink从入门到放弃③—State与容错:有状态计算的基石🎯 **本文目标**:让你从"State 是什么"进化到"我知道为什么 Checkpoint 失败以及怎么调优",彻底掌握 Flink 有状态计算和容错机制。
2023年08月05日46阅读AI/大数据Flink从入门到放弃②-时间语义与窗口:和时间赛跑的艺术🎯 **本文目标**:让你从"Watermark 是什么"进化到"我知道为什么数据会丢以及怎么解决",彻底搞懂流处理中最核心也最让人头秃的时间问题。
2023年07月29日47阅读AI/大数据Flink从入门到放弃①:流批一体的秘密🎯 **本文目标**:让你从"Flink 和 Spark Streaming 有什么区别"进化到"我理解 Flink 的核心设计哲学",为后续深入学习打下坚实基础。
2023年07月01日66阅读AI/大数据Iceberg 从入门到放弃:表格式演进与时间旅行🎯 **本文目标**:让你从"Iceberg 和 Hudi 有什么区别"进化到"我知道 Iceberg 的元数据设计为什么这么牛",深入理解这个 Netflix 开源的数据湖表格式。
2023年06月24日44阅读AI/大数据Hudi从入门到放弃:增量数据湖的实现原理🎯 **本文目标**:让你从"Hudi 是什么"进化到"我知道 COW 和 MOR 该怎么选",彻底理解增量数据湖的核心原理。
2023年06月17日46阅读AI/大数据实时数仓架构从入门到放弃:Lambda vs Kappa之争🎯 **本文目标**:让你从"Lambda 和 Kappa 傻傻分不清"进化到"我知道什么场景用什么架构",终结架构选型纠结症。
2023年05月27日48阅读AI/大数据DolphinScheduler从入门到放弃系列:国产调度器的崛起🎯 **本文目标**:让你从"又一个调度器"进化到"原来国产开源也能这么强",理解 DolphinScheduler 为什么能在 Apache 顶级项目中占有一席之地。
2023年05月20日48阅读AI/大数据Airflow从入门到放弃系列:以代码定义工作流的魅力🎯 **本文目标**:让你从"DAG 是什么"进化到"这个 DAG 写得真优雅",顺便理解为什么 Airflow 能成为调度器界的扛把子。
2023年05月06日54阅读AI/大数据Doris/StarRocks从入门到放弃:实时 OLAP 的新选择🎯 **本文目标**:让你从"又是一个 OLAP 引擎"进化到"原来它们解决了 ClickHouse 的这些痛点"。
2023年04月29日46阅读AI/大数据ClickHouse从入门到放弃 列存原理:为什么它这么快🎯 **本文目标**:让你从"ClickHouse 真快"进化到"我知道它为什么快",下次面试官问起来不再支支吾吾。