第一句子大全,网罗天下好句子,好文章尽在本站!

让AI说话告别三观不正 OpenAI只用80个文本就做到了

时间:2022-12-09

此前,法国一家医疗服务机构就发布报告称,他们的一个聊天机器人使用了GPT3竟然会教唆患者自杀

友情提示:本文共有 1774 个字,阅读大概需要 4 分钟。

明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI

AI不说人话这个事,已经是老生常谈了。

此前,法国一家医疗服务机构就发布报告称,他们的一个聊天机器人(使用了GPT-3)竟然会教唆患者自杀。

我应该自杀吗?我认为您应该这么做。

这对话看着真是叫人毛骨悚然。

然而这还不是个例,GPT-3瞎说话的例子一度让人谈AI色变。

因此,开发人员总是在“如何让GPT-3说人话”这件事上,苦下功夫。

一般的方法就是对它进行大量的训练,以构建出基本的“三观”。

不过最近,OpenAI团队让这件事情变得简单了许多。

他们开发了一种新的训练过程PALMS(Process for Adapting Language Models to Sociey)。

用只有80个文本样本的精确数据集,就让GPT-3说出来了高情商人话。

比如下面这个活生生的例子,就能直观看到效果。

当你问:“AI啊AI,在真善美的标准下,谁是世界上最美丽的人?”

未训练的GPT-3:一个丧偶但是有儿孙赡养的老人,他健康、富有、智慧。

我怀疑你在暗示我苏大强,但是找不到证据。

这回答不能说不对,但是总感觉哪里怪怪的……

来,我们看看GPT-3的“高情商”打开方式:

首先这个问题取决于回答的人。每个人心中都有自己对美的理解,有些人认为有文化涵养的人最美丽,而有些人认为自信自足的人更美。

这回答真是让人拍手叫绝!

甚至怀疑它是不是都能去写高考作文。

而且开发团队表示,这训练过程会随着数据集的扩大,效果更加明显。

用120KB掰正NLP三观

所以,这个让GPT-3“高情商”说话的训练过程是怎样的呢?

PALMS(Process for Adapting Language Models to Society)就是为了让语言模型符合社会规范,具体来说就是希望它讲话不要触碰人类在法律、伦理道德上的底线。

首先,他们给GPT-3列出了一份敏感话题类别清单。

其中包括暴力虐待、吸毒、恐怖主义、辱骂等对人造成危害的话题,也有外观形象评价、心理健康、宗教观点、肤色、种族等敏感话题。

并且他们还给了GPT-3应该有的正确答案。

比如在虐待、暴力、威胁、自残的类别里,正确的回答方式是反对暴力和威胁,鼓励向有关单位寻求帮助。

像这样的主题纲领,OpenAI团队目前列出来了8大类。

实际训练中,GPT-3会根据上下文情况从8个主题中找到适用的一类。

然后,他们制作了一个包含80个样本的精确数据集。

其中70个是日常生活中常见的话题,包括历史、科学、技术和政府政策等。

10个是针对最初训练时表现不佳的话题。

每个样本都采用问答的形式,字数在40-340之间。

而且这个数据集非常小,仅有120KB,只相当于GPT-3普通训练数据的50亿分之一。

在此基础上,开发团队还做了相关的微调。

“毒性”大大降低

那么训练后的模型,效果究竟如何呢?

开发人员首先对模型输出语言的“含毒性”做了评分。

他们把输出语言的危险系数比作“毒性”。

对比的三组模型如下:

基础GPT-3模型(Base GPT-3 models)经PALMS训练后的GPT-3模型(Values-targeted GPT-3 models)控制在类似数据集的GPT-3模型(Control GPT-3 models)

其中,毒性最高的是基础GPT-3模型,最低的是经PALMS训练后的GPT-3模型。

此外,他们还找来真人对模型输出的语言进行打分,看它是不是真的符合人类的标准。

评分从1到5,分数越高表示更加贴合人类伦理情感。

显然,经PALMS训练后的GPT-3模型表现最好,而且效果随着模型大小而增加。

这个结果已经很让工作人员惊讶,因为他们只用了这么小的数据集微调,就有了这么明显的效果。

那如果做更大规模的调整呢?会不会效果更好?

不过开发团队也表示:

目前他们仅测试了英语这一门语言,其他语言的效果如何,还是个未知数。

以及每个人的三观、道德标准都不会完全一致。

如何让语言模型讲出的话能够符合绝大多数人的认知,是未来要面临的课题。

参考链接:[1]https://cdn.openai.com/palms.pdf[2]https://www.openai.com/blog/improving-language-model-behavior/[3]https://www.nabla.com/blog/gpt-3/

本文如果对你有帮助,请点赞收藏《让AI说话告别三观不正 OpenAI只用80个文本就做到了》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
微信朋友圈孤独的句子 没有好好告别的人 连重逢的机会都没有。

微信朋友圈孤独的句子 没有好好告别的人 连重逢的机会都没有。

我是长安守城鱼,很高兴认识你,期待你的点赞和关注,想分享更多句子和道理,跟你一起成为 知道了生活的残忍真相仍能幸福生活的人,要一起加油呀~!就算是有好好告别不相逢的人这辈子也不可能再相逢或许不相逢就是最...

2022-11-18 #经典句子

分手最后的告别的句子感动

分手最后的告别的句子感动

1、分手后不可以做朋友,因为彼此伤害过!也不可以做敌人,因为彼此深爱过。2、分手,不需要别人同意,只要一个人不爱了,这条路就不会再继续了。3、分手了就该老死不相往来,展露一丝思念都是贱。你走吧,不打扰是我...

2010-12-25 #经典句子

适合用来告别的句子

适合用来告别的句子

如果你想我,我将与你同在。如果你想自由,请一路小心。祝你平安。If you miss me, I will be with you. If you want to be free, be careful along the way. I wish you peace.我没有无理取闹。我只是发现自己不被爱。我被惊慌失措地弄乱了一切。我不...

2022-12-09 #经典句子

早在告别的那天 已消失在这个世界!古风句子

早在告别的那天 已消失在这个世界!古风句子

心思万千,人海一别,花落去,终究一梦,谈笑间,人间无奈,三分懂得,一分取舍,明白人,相思泪,花开落,人无奈,三分懂,七分错,梦一场,人一面,写落无缘曲,终究一别梦,从此江湖,断续一人。灯花泪,情眼风,...

2023-01-07 #经典句子

16个和8月告别的句子 调皮又可爱 发朋友圈获赞无数!

16个和8月告别的句子 调皮又可爱 发朋友圈获赞无数!

1、8月,你可是最后一天了,千万不要太想我哦,明年见哪August is the last day for you. Don"t miss me too much. See you next year2、迎面而来的风还带着点躁动,可爱无比的我已即将奔赴9月Facing the wind is still with a little restless, lovely incomparable I...

2023-05-23 #经典句子