outlier
生命在于折腾。
Coding the world!
编程
Java/Go/Python
APP/前端
系统架构
效率/工具
其他
AI/大数据
爬虫/工具
数据处理
大数据
AI+
数据产品
杂谈
作品/创作
支付相关
读书笔记
猛男养成记
随笔
🎉产出
归档
关于
友链
闪念
搜 索
编程
Java/Go/Python
APP/前端
系统架构
效率/工具
其他
AI/大数据
爬虫/工具
数据处理
大数据
AI+
数据产品
杂谈
作品/创作
支付相关
读书笔记
猛男养成记
随笔
🎉产出
归档
关于
友链
闪念
RLHF • 共1篇
2025年04月12日
70
阅读
AI/大数据
RLHF/DPO:让大模型学会"讨好"人类
https://w.wallhaven.cc/full/3z/wallhaven-3z8eov.jpg
已经到底啦~