AI一本正经地胡说八道 有种办法可以识破它
比年来,天生式人工智能在文本、图像、音乐等范畴年夜放异彩。但是,跟着天生式人工智能变得越来越强盛,人们越来越难以辨别AI天生的内容。克日,Google DeepMind 研讨团队在《天然》(Nature)上宣布的封面文章供给了一种文本水印计划,能够进步 AI 天生文本的检测精度。AI 天生内容检测的须要性在文本、图像跟音乐中,AI 天生的文本是最难以检测的。由于现有的图像跟音乐天生技巧尚未像文本天生技巧一样兴旺,AI 天生的图像跟音乐每每有某些非天然的视觉或听觉特点。AI 天生的内容在团体上后果较好,但详细到细节就显得不敷天然。在图像跟音乐中,也能够人工增加人类难以发明的水印,在前期检测中经由过程水印挑选出AI天生的作品。但是在文本中难以直接增加人类弗成见的水印,这是由于文本与图像跟音乐差别,每一个笔墨都是完整可见的。同时,可用于练习 AI 的文本数据也远多于图像跟音乐。在宏大的、基于人类写作的语料库的练习之下,AI 曾经十分善于模仿人类的表白方法跟言语习气,乃至可能调剂文本的作风跟语气,这使得 AI 天生的文本难以直接检测。只管 AI 天生的文本与人类创作的文本难以辨别,但 AI 天生的内容可能带有现实性的过错,并不克不及保障牢靠性。无奈分辨起源的内容可能会招致虚伪信息的传布,也带来了学术舞弊、版权争议等各种成绩。比方,在“杭州撤消灵活车依尾号限行”假消息变乱中,网友用 AI 技巧天生的“假消息”行文谨严、语气说话切当,也基础合乎官方转达的格局,招致了过错信息年夜范围传布。美国科技消息网站 CNET 在三个月之内上线了 70 多篇用 AI 技巧天生的消息报道,却被发明此中存在大批基本性过错,包含盘算过错、金融观点曲解等,不得不临时叫停AI名目从新考核。为了防止 AI 技巧的滥用,咱们须要一种方式分辨文本能否由 AI 天生。主流检测方式:事先与过后检测检测 AI 天生的文本是一个分类成绩,咱们的重要目的是辨别一个文本片断是由 AI 天生的仍是由人类创作的。平日一个文本检测器对一个给定的文本片断会给出一个评分,当这个评分超越阈值时,这个片断被以为是 AI 天生的,反之则是人类创作的。文本检测框架(图片起源:依据参考文献[1]翻译)现有的主流检测方式能够分为两年夜类:事先检测跟过后检测。事先检测能够进一步分为基于水印的检测跟基于检索的检测。过后检测能够分为基于零样本进修的检测跟基于练习的检测。主流检测方式分类(图片起源:依据参考文献[1]翻译)1、事先检测基于水印的检测是指在 AI 天生的文本中暗藏某些信息以便后续检测。但因为文本的团圆性,在文本中增加水印比在图像跟音乐中增加水印艰苦良多。常用的方式是让 AI 天生的文本应用特定的言语作风或许倾向性地应用某些特定的词汇,但如许可能会下降 AI 天生文本的品质。基于检索的方式是指 AI 效劳的供给者将用户经由过程 AI 天生的文本保留在数据库中。当须要检测目的文本能否由 AI 天生时,将目的文本与数据库中的文本停止婚配,假如类似度较高,则很可能是 AI 天生的。但这种方式须要保留用户数据,可能带来隐衷泄漏的成绩。2、过后检测基于零样本进修的检测是指不须要停止任何的练习,仅依据 AI 天生文本的特色来检测一段文本能否是 AI 天生的。平日 AI 天生的文本偏向于应用罕见的词汇,句子的长度跟构造也愈加同一。而人类创作的文本则显得愈加为所欲为,每一句的程度也错落不齐。与人类比拟,AI 在影象细节上才能较强而在逻辑推理上才能较弱。应用这些特色能够在必定水平上辨别 AI 天生的文本跟人类创作的文本。基于练习的检测是支使用人类创作的文本跟 AI 天生的文本构建一个数据集,用这个数据集练习一个分类器来辨认 AI 天生的文本。但这须要网络充足的数据用于练习,而且跟着 AI 才能的提高,如许的辨别也变得越来越艰苦。能够看到,过后检测比事先检测要艰苦很多。为了高精度地挑选出 AI 天生的文本,在事先 AI 天生文本时就增加水印是一个很好的处理计划。Google DeepMind 的冲破:SynthID-Text 水印技巧Google DeepMind 研讨团队提出了一种新的水印天生计划,称为 SynthID-Text。它基于之前的水印天生组件,但应用了一种新的“锦标赛采样”方式。SynthID-Text 能够非歪曲(保存文实质量)或许歪曲(以就义文实质量为价值晋升水印的可检测性)地增加水印。在歪曲跟非歪曲设置下,与现有的最佳方式比拟,SynthID-Text 都晋升了水印的检出率。水印天生框架(图片起源:依据参考文献 [2] 翻译)上图中展现了年夜言语模子天生文本的道理以及之前水印天生的框架。年夜言语模子的文本天生是基于高低文的,它会依据输入的文本序列盘算下一个词汇的散布,而后从这个散布中抽样出下一个词汇。一个天生式的水印计划平日包括三个局部:一个随机数天生器、一个采样算法以及一个评分函数。水印天生的进程是:起首应用随机数天生器依据后面的文本以及水印键天生一个随机数,而后采样算法应用这个随机数从词汇的散布中抽样出下一个词汇。给出一段文本以及一个水印键,评分函数供给一个分数来量化以后文本中含有水印的可能性,当分数超越一个阈值时就以为这段文本中含有水印。锦标赛采样(图片起源:依据参考文献[2]翻译)SynthID-Text 提出了一种新的“锦标赛采样”方式,上图是锦标赛采样方式的一个例子。当向模子输入“...我最爱好的寒带生果是”时,模子盘算出下一个词汇的散布,此中“芒果”的概率是 0.5,“荔枝”的概率是 0.3,“木瓜”的概率是 0.15,“榴莲”的概率是 0.05。在不加水印的畸形天生中,模子会按这个概坦白接采样出下一个词汇。在锦标赛采样中,模子先依据随机数种子天生三个随机的水印函数,而后再从词汇的散布中采样出八个词汇,将这八个词汇两两组合落后行比赛,在每一轮比赛中,由一个水印函数决议每一对组合中的胜出者。经由三轮比赛后,终极的胜出者就是模子的输出成果:“芒果”。在锦标赛采样中,词汇是依据水印函数的偏好采样得出的。因而增加水印的文本会在水印函数上有更高的评分。在检测时只要要评价每个词汇在对应的水印函数下的评分,再将评分加跟就能够失掉这段文本包括水印的可能性。水印的增加是经由过程转变采样方式实现的,它会转变模子输出下一个词汇的散布,这看起来弗成防止地会影响天生文本的品质。但是,因为采样方式中应用了随机数种子,只管在某一随机数种子下词汇的散布会被转变,但在对全部随机数种子停止均匀后能够失掉跟原始散布雷同的成果。SynthID-Text 能够在恰当的设置下防止影响词汇的散布从而保障文本的品质,也能够以丧失一局部品质为价值进步水印的检出概率。SynthID-Text 方式在 Google DeepMind 推出的 Gemini 人工智能模子上经由了两万万次用户测试。测试成果标明 SynthID-Text 在增加水印的同时并不会下降文本的品质。同时,SynthID-Text 不会发生太多的时光跟盘算开支,能够被年夜范围地利用于出产实际之中。结语过后检测文本能否由 AI 天生长短常艰苦的。跟着 AI 才能的加强,过后检测会变得越来越艰苦,检测跟反检测将会是无尽头的技巧比赛。水印方式供给了一种可能的处理计划,但这须要年夜言语模子的供给者在天生时就事后参加水印。假如用户应用的模子不自动参加水印,就难以在过后停止检测。别的,用户还能够应用开源模子,或许对增加了水印的文本停止二次编纂来逃走检测。这些成绩都有待进一步处理。将来,跟着天生式人工智能的遍及,怎样检测 AI 天生的内容会变得越来越主要。SynthID-Text 证实了水印技巧在文本天生中年夜范围利用的可能性,但水印技巧面对的艰苦也阐明检测并不仅是一个技巧成绩。处理这个成绩还须要各方独特尽力,构成相干的行业尺度以及执法法例,从而推进AI走在为人类效劳的正轨之上。义务编纂:随心文章内容告发
]article_adlist-->
申明:新浪网独家稿件,未经受权制止转载。 -->