将本站设为首页
收藏词令官网,记住:www.ciliso.net
账号:
密码:

词令书屋:看啥都有、更新最快

词令书屋:www.ciliso.net

如果你觉得好,恳请收藏

您当前的位置:词令书屋 -> 裁员后,我成了科技教父 -> 第109章 OpenAI最近有点儿跳,得限制一下!

第109章 OpenAI最近有点儿跳,得限制一下!

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

  郝成请了一顿饭,何钢吃了满肚子的心事。

饭局刚刚一结束,他就立刻回到酒店,联系上了于东。

“老何,我咋发现你每次一去临州,都会变得这么慌慌张张的呢?”于东甚至调侃上了。

“你先别忙,听我说。”

何钢仔细的将郝成在车上的话简单跟于东复述了一遍,而后总结道:“可不要看这东西是郝成在扯闲篇,是在泛泛而谈大路的概念,是没有透露任何AI训练方法的。

“但实际上,他这个泛泛而谈,跟我们一大群人去聊天,他不一样!”

“我知道,他已经训练出小沙了,他的大路概念那是正确的概念。”于东长长的呼了口气:“从这泛泛而谈中或许能找到方向。

“但光听这些也没有用啊!”思索了很久,于东也是无奈道:“你说的所有的东西,我只能总结出三个字‘类似人’,而这种方向,团队早就考虑过了。

“但现在的问题不是方向,是方法,我们没有找到任何的方法。唯一的好消息是,我们以传统方式训练AI的成本也大大的降低了,效率却大大的提高了。”

于东说的这个倒是实情,不仅仅是华为、抖音、腾讯甚至OpenAI,训练AI的成本都降低了。

究其原因,也很简单,他们让小沙帮他们做数据清洗、标定和反馈。

数据清洗原本是一个非常复杂且繁琐的工作,也是训练AI非常关键的步骤,数据清洗的质量越高,AI训练的质量也就越高。

以往,这个工作都是由人工来实现的,也有用AI来做的,但是效果就会很差,往往会投喂一些垃圾数据,造成模型被污染,进而产生一些低级错误。

而现在有了小沙,这项工作可以更快速的进行,准确率甚至不比人工清洗差。

而更关键的一个问题,以往GPT类的模型,是RLHF,也就是基于人类反馈的强化学习。

怎么做的呢:就是先预训练一个语言模型,然后做微调。

微调怎么调呢:就是你问一个问题,语言模型给你回答,然后人工给这些回答进行排名,然后获得一个有质量排序的数据集,用这个数据集反过来再去微调相关的模型参数,一遍又一遍循环往复,然后答案就会越来越接近人想要的。

而现在,小沙代替了人工的这个步骤。

RLHF模型先前被认为不可能无限提高,其中最重要的一个原因就是,随着参数越来越多,数据量越来越大


  本章未完,请点击下一页继续阅读!
上一页 123下一页

看了《裁员后,我成了科技教父》的书友还喜欢看

天才小师姐她偏要当废物
作者:狗肠
简介: 【有cp,男主烬渊】白琳发现自己竟然是宗门团宠小师妹的对照组。

...
更新时间:2026-03-04 21:11:25
最新章节:云灵界番外24:我道侣不爱我了
一元首充:我竟是五百强幕后老板
作者:毛洋芋
简介: 【游戏成真】【养成类】【职场双向奔赴】\n下载《幕后玩家》这款游戏后,一元首充,我成...
更新时间:2026-03-04 21:17:50
最新章节:第187章 这是什么神仙公司
婴儿的我,获得大器晚成逆袭系统
作者:语成
简介: 大周太子杨承重生到一岁婴儿时期,大器晚成逆袭系统早到了五百年。

...
更新时间:2026-03-04 20:33:43
最新章节:第一卷 第930章 混乱污染
喀什的云朵
作者:乱世TICH
简介: 一场追逐诗和远方的

“逃离”,却让陈风邂逅了生命中最美丽的...
更新时间:2026-03-04 20:36:01
最新章节:第一百三十章 红色玫瑰
星际猎人
作者:太极阴阳鱼
简介: 母星毁于内战,少年从废墟走出,入万兽星球,闯上古遗弃之地,盗药都仙缘,窃未来文明科技...
更新时间:2026-03-04 21:38:29
最新章节:第952章、谈崩了
神魂丹帝
作者:浊酒一湖
简介: 少年十年坚持,却惨遭未婚妻夺取武魂而亡!穿越觉醒神秘武魂的秦朗,发誓绝不再让别人左右...
更新时间:2026-03-04 20:26:22
最新章节:第三千七百四十二章 邪异种族