标签大模型下的文章 - 乔人尹

搜索

大模型 • 共21篇

RLHF/DPO：让大模型学会"讨好"人类

RLHF/DPO：让大模型学会"讨好"人类

2025年04月12日

106

阅读

RLHF/DPO：让大模型学会"讨好"人类 https://w.wallhaven.cc/full/3z/wallhaven-3z8eov.jpg

DeepSeek 本地部署与训练：穷人的 GPT-4 平替

DeepSeek 本地部署与训练：穷人的 GPT-4 平替

2025年03月29日

124

阅读

DeepSeek 本地部署与训练：穷人的 GPT-4 平替 DeepSeek-V3 在各大榜单吊打一众模型，关键是——开源的。更关键的是——真的能在自己电脑上跑。

SFT：让大模型学会听话

SFT：让大模型学会听话

2025年03月15日

113

阅读

SFT：让大模型学会听话 https://w.wallhaven.cc/full/yj/wallhaven-yjxp8k.jpg

预训练：如何喂出一个大模型

预训练：如何喂出一个大模型

2025年03月08日

111

阅读

预训练：如何喂出一个大模型 https://w.wallhaven.cc/full/4o/wallhaven-4ozpxl.jpg

Tokenization：大模型的碎碎念

Tokenization：大模型的碎碎念

2025年03月01日

135

阅读

Tokenization：大模型的碎碎念 https://w.wallhaven.cc/full/nr/wallhaven-nrly9m.jpg

🐒Attention变体：注意力的七十二变

🐒Attention变体：注意力的七十二变

2025年02月15日

105

阅读

🐒Attention变体：注意力的七十二变 https://w.wallhaven.cc/full/w5/wallhaven-w5m6yr.jpg