标签 AI 下的文章 - 乔人尹

搜索

AI • 共42篇

大模型的未来：我们正站在哪里？

大模型的未来：我们正站在哪里？

2025年08月30日

17

阅读

大模型的未来：我们正站在哪里？从 GPT-3 到 GPT-4，从 ChatGPT 到 Agent。大模型两年走完了其他技术十年的路。未来会怎样？没人知道，但我们可以猜一猜。

LLM 应用架构：从原型到生产

LLM 应用架构：从原型到生产

2025年08月23日

19

阅读

LLM 应用架构：从原型到生产本地跑 Demo 很简单，上生产就是另一回事了。这篇讲的是：如何把 LLM 应用做得又快又稳又省钱。

模型安全：让 AI 不作恶

模型安全：让 AI 不作恶

2025年08月16日

19

阅读

模型安全：让 AI 不作恶 AI 能力越强，风险越大。安全不是限制，是让 AI 走得更远的保障。

长上下文：让大模型读完一本书

长上下文：让大模型读完一本书

2025年08月09日

19

阅读

长上下文：让大模型读完一本书 GPT-3 只能处理 4K token，大约 3000 字。Claude 3 可以处理 200K token，一整本小说。这是怎么做到的？

MoE：用更少的计算训练更大的模型

MoE：用更少的计算训练更大的模型

2025年08月02日

17

阅读

MoE：用更少的计算训练更大的模型 GPT-4 据传有 1.8 万亿参数，但推理时只激活一部分。这就是 MoE——用"专家分工"实现四两拨千斤。

LLM 评估：如何知道模型有多强？

LLM 评估：如何知道模型有多强？

2025年07月05日

17

阅读

LLM 评估：如何知道模型有多强？"GPT-4 比 GPT-3.5 强多少？""LLaMA-70B 和 Claude 3 哪个好？"评估是唯一的答案。

Prompt Engineering：与大模型对话的艺术

Prompt Engineering：与大模型对话的艺术

2025年06月28日

18

阅读

Prompt Engineering：与大模型对话的艺术同样的模型，不同的提示词，效果天差地别。Prompt Engineering 不是玄学，是科学。

多模态：让大模型看懂世界

多模态：让大模型看懂世界

2025年06月21日

20

阅读

多模态：让大模型看懂世界人类理解世界不只靠文字，还有图像、声音、视频。大模型也该如此。

Agent：让大模型自己干活

Agent：让大模型自己干活

2025年06月14日

18

阅读

Agent：让大模型自己干活以前：你告诉 AI 做什么，AI 做什么。现在：你告诉 AI 目标，AI 自己想办法。这就是 Agent。

RAG：让大模型拥有外部记忆

RAG：让大模型拥有外部记忆

2025年06月07日

15

阅读

RAG：让大模型拥有外部记忆大模型知识有截止日期，还会胡说八道。RAG 说：没关系，我给你一个外挂知识库。

vLLM：大模型推理的速度与激情

vLLM：大模型推理的速度与激情

2025年05月03日

13

阅读

vLLM：大模型推理的速度与激情同样的模型，同样的 GPU，吞吐量差 10 倍。这不是玄学，这是 vLLM。

模型量化：大模型的减肥手册

模型量化：大模型的减肥手册

2025年04月26日

19

阅读

模型量化：大模型的减肥手册 LLaMA-70B 需要 140GB 显存，你有吗？没关系，量化一下，35GB 就够了。再狠一点，4-bit 量化，18GB 搞定。

LoRA/PEFT：穷人的微调指南

LoRA/PEFT：穷人的微调指南

2025年04月19日

18

阅读

LoRA/PEFT：穷人的微调指南全量微调一个 7B 模型需要 ~60GB 显存。我的显卡只有 8GB。LoRA：没关系，我来帮你。

RLHF/DPO：让大模型学会"讨好"人类

RLHF/DPO：让大模型学会"讨好"人类

2025年04月12日

17

阅读

RLHF/DPO：让大模型学会"讨好"人类 SFT教会了模型说话的"格式"，但它还不知道什么是"好"回答。RLHF 就是教模型"察言观色"——学会人类喜欢什么、讨厌什么。

MCP 从入门到放弃：给大模型装上"手和脚"

MCP 从入门到放弃：给大模型装上"手和脚"

2025年04月05日

29

阅读

MCP 从入门到放弃：给大模型装上"手和脚"大模型很聪明，但它被困在一个"玻璃罩子"里——能说会道，却不能真正"做事"。MCP就是那把打破玻璃罩的锤子。