2025年04月12日13阅读AI/大数据RLHF/DPO:让大模型学会"讨好"人类SFT教会了模型说话的"格式",但它还不知道什么是"好"回答。RLHF 就是教模型"察言观色"——学会人类喜欢什么、讨厌什么。
2025年03月29日11阅读AI/大数据DeepSeek 本地部署与训练:穷人的 GPT-4 平替DeepSeek-V3 在各大榜单吊打一众模型,关键是——开源的。更关键的是——真的能在自己电脑上跑。
2025年02月22日18阅读AI/大数据GPT vs BERT:两条路的故事> 2018 年,NLP 领域发生了一场"路线之争"。 > > 七年后回头看,一条路通向了 ChatGPT,另一条路……还在做分类任务。
2025年02月08日58阅读AI/大数据Transformer架构:从入门到放弃2017 年,Google 发了一篇论文,标题很嚣张:《Attention Is All You Need》。 七年后回头看,他们确实有嚣张的资本。
2023年09月02日44阅读AI/大数据Flink从入门到放弃⑥—调优与问题排查:从入门到不秃头🎯 **本文目标**:让你从"作业又挂了"进化到"我知道为什么挂以及怎么修",掌握 Flink 生产环境的调优技巧和问题排查方法。