2025年08月30日17阅读AI/大数据大模型的未来:我们正站在哪里?从 GPT-3 到 GPT-4,从 ChatGPT 到 Agent。大模型两年走完了其他技术十年的路。未来会怎样?没人知道,但我们可以猜一猜。
2025年08月09日19阅读AI/大数据长上下文:让大模型读完一本书GPT-3 只能处理 4K token,大约 3000 字。Claude 3 可以处理 200K token,一整本小说。这是怎么做到的?
2025年04月12日17阅读AI/大数据RLHF/DPO:让大模型学会"讨好"人类SFT教会了模型说话的"格式",但它还不知道什么是"好"回答。RLHF 就是教模型"察言观色"——学会人类喜欢什么、讨厌什么。