分类 AI/大数据下的文章 - 乔人尹

搜索

AI/大数据 • 共95篇

模型量化：大模型的减肥手册

模型量化：大模型的减肥手册

2025年04月26日

15

阅读

模型量化：大模型的减肥手册 LLaMA-70B 需要 140GB 显存，你有吗？没关系，量化一下，35GB 就够了。再狠一点，4-bit 量化，18GB 搞定。

LoRA/PEFT：穷人的微调指南

LoRA/PEFT：穷人的微调指南

2025年04月19日

15

阅读

LoRA/PEFT：穷人的微调指南全量微调一个 7B 模型需要 ~60GB 显存。我的显卡只有 8GB。LoRA：没关系，我来帮你。

RLHF/DPO：让大模型学会"讨好"人类

RLHF/DPO：让大模型学会"讨好"人类

2025年04月12日

13

阅读

RLHF/DPO：让大模型学会"讨好"人类 SFT教会了模型说话的"格式"，但它还不知道什么是"好"回答。RLHF 就是教模型"察言观色"——学会人类喜欢什么、讨厌什么。

MCP 从入门到放弃：给大模型装上"手和脚"

MCP 从入门到放弃：给大模型装上"手和脚"

2025年04月05日

22

阅读

MCP 从入门到放弃：给大模型装上"手和脚"大模型很聪明，但它被困在一个"玻璃罩子"里——能说会道，却不能真正"做事"。MCP就是那把打破玻璃罩的锤子。

DeepSeek 本地部署与训练：穷人的 GPT-4 平替

DeepSeek 本地部署与训练：穷人的 GPT-4 平替

2025年03月29日

11

阅读

DeepSeek 本地部署与训练：穷人的 GPT-4 平替 DeepSeek-V3 在各大榜单吊打一众模型，关键是——开源的。更关键的是——真的能在自己电脑上跑。

SFT：让大模型学会听话

SFT：让大模型学会听话

2025年03月15日

15

阅读

SFT：让大模型学会听话预训练完后，你还需要SFT调教大模型，让它听话。

预训练：如何喂出一个大模型

预训练：如何喂出一个大模型

2025年03月08日

13

阅读

预训练：如何喂出一个大模型预训练一个大模型，需要三样东西：数据、算力、还有钱。我一样都没有，但这不妨碍我讲清楚这件事。

Tokenization：大模型的碎碎念

Tokenization：大模型的碎碎念

2025年03月01日

17

阅读

Tokenization：大模型的碎碎念大模型不认识字，它只认识数字。把文字变成数字的过程，叫做 Tokenization。听起来简单，坑却多得离谱。

GPT vs BERT：两条路的故事

GPT vs BERT：两条路的故事

2025年02月22日

18

阅读

GPT vs BERT：两条路的故事 > 2018 年，NLP 领域发生了一场"路线之争"。 > > 七年后回头看，一条路通向了 ChatGPT，另一条路……还在做分类任务。

🐒Attention变体：注意力的七十二变

🐒Attention变体：注意力的七十二变

2025年02月15日

18

阅读

🐒Attention变体：注意力的七十二变上一篇我们学会了 Self-Attention，这一篇我们来学习如何把它玩坏。

Transformer架构：从入门到放弃

Transformer架构：从入门到放弃

2025年02月08日

58

阅读

Transformer架构：从入门到放弃 2017 年，Google 发了一篇论文，标题很嚣张：《Attention Is All You Need》。七年后回头看，他们确实有嚣张的资本。

DeepSeek的冲击：当奇点不再是书本上的预言

DeepSeek的冲击：当奇点不再是书本上的预言

2025年02月01日

39

阅读

DeepSeek的冲击：当奇点不再是书本上的预言 🖋这个大模型，从今天开始非学不可。

DeepSeek 从入门到放弃

DeepSeek 从入门到放弃

2025年01月25日

43

阅读

DeepSeek 从入门到放弃 🗓️ 2025年1月25日 | 📍 当全世界都在谈论 DeepSeek 的时候，我决定冷静地"放弃"一下

机器学习从入门到放弃

机器学习从入门到放弃

2023年11月04日

365

阅读

机器学习从入门到放弃从今天开始我们来学习机器学习是什么，有哪些特征，学习路径如何。

Flink从入门到放弃⑥—调优与问题排查：从入门到不秃头

Flink从入门到放弃⑥—调优与问题排查：从入门到不秃头

2023年09月02日

44

阅读

Flink从入门到放弃⑥—调优与问题排查：从入门到不秃头 🎯 **本文目标**：让你从"作业又挂了"进化到"我知道为什么挂以及怎么修"，掌握 Flink 生产环境的调优技巧和问题排查方法。