华娱2021：他不是搞科技的吗| 第394章化繁为简，尽在掌控|(十三是只猫)（3 / 7）|华娱2021：他不是搞科技的吗最新章节免费阅读无弹窗|笔趣阁小说大全

弟弟这该死的魅力啊！

刘皓存悄悄调整了一下坐姿，让自己在人群中显得更加优美一些。

毕竟在直播，万一让人拍到了呢。

赵妗麦乖巧地坐的笔直，小手放在膝盖上，像认真听课的小学生。

她努力想理解江倾的话，但很快就放弃了。

太难了，完全听不懂……

章若南笑容灿烂，要不是场合不对，她已经忍不住拿出手机来拍照了。

热芭裹在厚厚的伪装下，眼神却亮得惊人，只觉得台上的男人帅的无以复加！

至于景恬，她想去下洗手间……

台上，江倾已经开始了他的分享，语气随意的像在唠家常。

“大家可能都知道，训练一个大模型，就像教一个特别聪明但有点轴的学生。”

他打了个生动的比方，引来台下一阵会意的轻笑。

“按照传统的方法，可能恨不得把解题的每一步思路都掰开揉碎喂给它，告诉它这一步该这样，下一步该那样。”

江倾模仿着严师的样子，逗得大家又笑了起来。

“但我们无问的团队觉得，有时候管的太细，反而会扼杀创造力。所以呢……”

他话锋一转，眼神变得锐利。

“我们换了个思路。我们用了一种叫做GRPO，嗯，大家可以理解为小组相对策略优化的方法。”

江倾故意放慢了语速，确保即使是非专业人士也能跟上他的思路。

“简单说，我们不太关心它中间是怎么想的，是用了九九乘法表还是列了一堆方程式，我们只在乎最后答案对不对。答案对了，就给糖吃，答案错了，就没糖。”

他摊摊手，语气诙谐。

“就这么简单粗暴。”

台下许多技术专家露出了深思的表情。

这种只以最终结果为导向的强化学习方式，听起来简单，但实际操作起来难度极高，需要对奖励信号的设计与优化有极其深刻的理解。

“我们发现，当你只告诉它目标，而不限制路径时，这个学生为了吃到糖，反而会自己琢磨出各种各样，有时甚至我们都没想到的奇妙解题思路。”

江倾笑着指了指自己的脑袋。

“它自我演化出了更高级的推理