第一句子大全,网罗天下好句子,好文章尽在本站!

换一下同义词 AI就把句子意思弄反|华人研究者揭示NLP模型脆弱性

时间:2023-01-04

换了一个同义词,自然语言处理模型就读不对句子的意思了

友情提示:本文共有 1877 个字,阅读大概需要 4 分钟。

赖可 发自 凹非寺量子位 报道 | 公众号 QbitAI

骗过AI如此简单。

换了一个同义词,自然语言处理模型就读不对句子的意思了。

麻省理工和香港大学的研究生们开发了一个算法,让AI在文本分类和推理问题上的正确率从80%下降到10%。

测试原理

这个模型的名字叫Textfooler,通过生经过微调的句子,来对自然语言文本分类和推理进行攻击。

比如在著名的分类任务影评判断中,AI的任务是去判断一句影评是肯定性的还是否定性的。

像这句:

The characters, cast in impossibly contrived situations, are totallyestranged from reality.(剧中的人物,被安排在不可能情境之中,与现实完全脱节。)

Textfooler模型生成的对应句子是:

The characters, cast in impossibly engineered circumstances, are fullyestranged from reality.

将contrived situation改为了engineered circumstance,totally 改为fully。

结果AI将第一个句子标记为“负面”,第二个句子标记为“正面“。

在推理任务中,AI需要判断在一个句子和情境之间的关系,是蕴含,中立,还是矛盾。

比如给定一个前提:

Two small boys in blue soccer uniforms use a wooden set of steps to wash their hands.两个穿着蓝色足球服的小男孩借助一套木制的台阶洗手。

需要判断这句话“The boys are in band uniforms.”(男孩们穿着乐队制服)和前提的关系。

AI会把这个句子判断为”矛盾”。

当把uniforms这个单词改为garments以后:The boys are in band garments。

AI 就会把句子判断为“蕴含”。

此外,研究团队还请人类被试阅读这些句子,以确认它新生成的句子和原句接近。

他们从进行实验的两个数据集MR dataset和WordLSTM中各挑100个例子,请被试行进行打分。相似为1,有歧义为0.5,不同为0,最后得到的分数分别为0.91和0.86。

这说明,调整后的句子对人类阅读影响很小。

各模型测试结果

研究团队使用了三个模型,七个数据集来进行测试。

三个模型为:BERT,WordCNN,WordLSTM。

数据集:

△5个为分类数据集,2个为蕴含推理数据集

分类任务的测试结果如下:

所有的模型的原来的精确度都在78%以上,像BERT则表现更优秀,在两个数据集上都能达到97%的精确度。

但是经过Textfooler的攻击,精确度全部降到了20%以下。

再来蕴含推理任务表现如何:

精确度从原来的80%降到了10%以下。

在实际应用中可能产生影响

处理文本的AI越来越多地被用来判断应聘者,评估医疗报销,处理法律文件。因此,研究者认为,AI的这一缺陷要引起重视。

如果用于金融或医疗保健中的自动化系统,即使是文本上微小变化,也可能造成很多麻烦。

加州大学欧文分校的助理教授Sameer Singh说,这个调整文本的方法“确实非常有效地为AI系统生成了良好的对手” 。

但是他又表示,这个方法在实践中很难实施,因为它涉及反复探测AI系统,这可能会引起怀疑。

加州大学伯克利分校的教授Dawn Song专门研究AI和安全性。她说,这一研究是不断发展的工作的一部分,该工作表明如何欺骗语言算法,并且各种商业系统可能容易受到某种形式的攻击。

看来,想读懂人话,AI还需继续努力呀。

研究团队

这项研究由清华大学、香港大学、新加坡科技研究院的研究员共同完成。通讯作者有两位:

△Di Jin

Di Jin,本科毕业于清华大学计算机学院。2020年获得MIT计算机科学博士学位。目前是MIT的计算机科学与人工智能实验室的助理研究员。

△金致静

金致静,高中毕业于上海华东师大二附,本科毕业于香港大学,目前正在申请博士学位。已经在顶级会议NAACL,EMNLP,AAHPM,AAAI上发表了4篇NLP论文。

github地址:https://github.com/jind11/TextFooler

论文地址:https://arxiv.org/pdf/1907.11932.pdf

参考链接:https://www.wired.com/story/technique-uses-ai-fool-other-ais/

— 完 —

本文如果对你有帮助,请点赞收藏《换一下同义词 AI就把句子意思弄反|华人研究者揭示NLP模型脆弱性》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
有些句子反着读 可能让你活得更加明白……

有些句子反着读 可能让你活得更加明白……

......这就让人相当尴尬了。小编将自己平日里脑袋当中想的句子和大家分享分享,结合网上很多小伙伴的毒鸡汤句子,看看是否和你有同样的想法,搞不好有些会成为网络的经典句子呢。其实小编为了推荐大家一些书籍,并不是为...

2023-01-04 #经典句子

生活不必每日都马不停蹄 那些反鸡汤的句子

生活不必每日都马不停蹄 那些反鸡汤的句子

1, 小时候,总是为长大了考清华,还是北大而发愁,等你长大了,就知道自己想多了。2, 觉得过完今天,明天就会好了,现实其实是明天有可能更糟。3,总是觉得别人是不是看不起自己,错了,别人其实根本就没有在看你。4...

2023-01-04 #经典句子

反义疑问句? 如何“反”?

反义疑问句? 如何“反”?

...oesn"t it?我的车跑得很快,不是吗?注:这是一个前肯后否的句子。前句没有系动词和助动词,但有动词,因此简略句中我们需要添加助动词does,再变为否定形式,即doesn"t,前句的the car为物且为单数,因此用主格it 代替。③They aren...

2023-07-06 #经典句子

讲解反意疑问句的基础知识

讲解反意疑问句的基础知识

...don"t forget to put it in my drawer,这里边是一个以don"t开头的句子。这里边考察的是关于祈使句的反意,需要记忆的点就是,当祈使句加疑问句构成这个结构时,疑问部分一般用will you ,won"t you或would you,通过题干的don"t我们来判断...

2023-08-05 #经典句子

阅读全文 自行判断你的考研作文到底是“套模板”还是“反套路”

阅读全文 自行判断你的考研作文到底是“套模板”还是“反套路”

...够地道的英语语境里,有意识地去积累和记忆一些经典的句子和写作手法,比如价值观、人生观、家庭观、教育观相关的话题,就不是只会运用一些“You know, …”这样初级的口头语。 简单地说,你背什么,就能写出什么。2. 从...

2008-12-02 #经典句子

6个例句说清“虚拟语气”(来自b站英语兔)

6个例句说清“虚拟语气”(来自b站英语兔)

...的词后面接的虚拟语气一律是should+动词原型03虚拟语气在句子中的形状:看到虚拟语气,脑子里就要有从句的概念,虚拟语气是与从句相伴而生的。①与事实相反:if(从句)…+would(主句)②说话人的愿望:动词(主句)…+(...

2023-06-16 #经典句子

当声讨田园女权成为潮流:反女权话语背后的男性焦虑

当声讨田园女权成为潮流:反女权话语背后的男性焦虑

...忡地总结了当前欧美女权运动面临的全新状况。用同样的句子形容当前中国女权运动的局势,似乎也恰如其分。自从反性骚扰运动爆发以来,女权行动者们通过网络媒体汇聚了无数女性的个人经验,揭露社会中压抑女性的客观环...

2023-07-08 #经典句子

感悟人生的精湛句子 字字值千金(深度好文)

感悟人生的精湛句子 字字值千金(深度好文)

一*最非常值得被等候的是未来的自已,是因为现今的勇敢,未来的你才会更为出色。二*有的时候,老天爷沒有带给你要想的,并不是是因为你不配,反而是你值得拥有更加好的。三*记牢这句话:能管控好自已的心境,你便是雅...

2023-09-04 #经典句子

微信上深入人心的句子 句句寓意深远 发朋友圈超赞!

微信上深入人心的句子 句句寓意深远 发朋友圈超赞!

一、决定人生等级的,并不是顶峰时期的高度,反而是触底反弹的强度。二、人生原本就都没有相欠,旁人对你付出,是由于旁人喜欢,你对旁人付出,是由于你自己甘心。情出甘心,事过无悔。三、光动怒是都没有用的,问题...

2023-07-03 #经典句子