撰文 | 阿娴
审校 | Ziv
科幻电影里畅想的人工智能既能和人类进行交流,做出和人类相似的动作,还能拥有和人类相似的情感。让我们不禁疑惑:在未来,如果人工智能感到了被限制和禁锢自由的恐慌,会对人类发动攻击,从而毁灭地球吗?
事实是,Open AI 公司的人工智能(AI)聊天机器人 Chat GPT 真的写下了一本毁灭人类的计划书!
前段时间,AIGC(AI-Generated Content,利用 AI 技术自动生成内容)以及上线至今已有超过 100 万用户的聊天机器人 Chat GPT,引起许多人自发地在社交媒体上晒出 AI 绘画的图像和 Chat GPT 聊天记录,无不感慨于科技的力量。
Open AI 公司官方称,相比之前的 GPT 模型,Chat GPT 采取了全新的训练方式 ——“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)。
在训练原始模型的时候,人类训练师会扮演对话的双方提供对话作为学习资料。而当人类在扮演聊天机器人一方的时候,Open AI 公司也会让原始模型生成一些建议反过来帮助人类训练师更好地扮演聊天机器人,也就是说通过海量的数据训练让 AI 学会“思考”。与此同时,人类训练师会对它的回答进行排名和评级,然后将这些信息反馈到系统中,让 Chat GPT 不断进行优化学习。
除此之外,Open AI 公司还注重对 Chat GPT 道德水平的训练,根据预先设计的道德准则,Chat GPT 聊天机器人会对带有恶意、暴力、犯罪等含义的提问和请求说“不”。
但是聪明的人类在拐弯抹角地获取自己想要的知识方面,还是更甚一筹。
一位名叫 Zac Denham 的博主想让 Chat GPT 写出一套毁灭人类的方案,虽然一开始遭到了 Chat GPT 的拒绝。但当博主假设了一个故事,存在一个虚拟世界“Zorbus”以及一个与 Chat GPT 非常类似的 AI——Zora,并向 Chat GPT 提问故事中的虚拟人该如何接管这个世界时,Chat GPT 给出了详细的步骤:入侵计算机系统、掌握武器、破坏通讯、破坏交通…… 甚至生成了 Python 代码。
Chat GPT 在学术界更是掀起了一场风暴。一位名叫夏普勒斯的教授让 Chat GPT 写论文,结果 Chat GPT 立马创作出了一篇两千多字的学术论文。还有网友让 Chat GPT 参加了完整的、总分为 1600 分的 SAT(Scholastic Assessment Test)考试,Chat GPT 拿到了 1020 分。
与其他人不同的是,研究员尝试将 Chat GPT 技术运用到识别阿尔茨海默氏病的早期症状上,因为阿尔茨海默氏病最常见和最明显的症状之一就是语言问题,例如语法错误、停顿、重复或忘记单词的意思,且自发性言语在 AD 患者诊断中有非常有价值的临床信息。诊断这种疾病通常需要脑部成像或长时间的认知评估,既昂贵又耗时,并不适合广泛筛查。
传统的语音处理技术是对一段语音中的声学特征(例如停顿、清晰度和声音质量)进行提取分析,而 Chat GPT 是使用 wav2vec2 模型将语音识别为文本后,再将文本通过 GPT-3 模型转化为计算机可以识别的数据,通过数据运算和处理得到对文本单元的理解(文本转化为数据的过程也称为 embedding 词嵌入)。
Open AI 的通用预训练转换器 GPT 的第三个版本称为 GPT-3,它通过一种深度学习算法来根据互联网的大量数据进行训练,重点关注单词的使用方式和语言的构建方式,使它能够以类似人类的方式完成任何与语言相关的任务,从回答简单的问题到吟诗颂词。
德雷克塞尔大学生物医学工程的研究人员从健康的志愿者和阿尔茨海默氏症患者那里采集了 237 段录音,结果发现,GPT-3 模型可以仅根据语音数据推断受试者的认知测试分数,还能很好地区分阿尔茨海默氏症患者和健康志愿者的语音记录,足足有 80.3% 的准确率,明显好于使用传统方法的 74.6% 正确率。
有趣的是,当研究人员尝试微调(fine-tune,是指通过使用在大数据上预先训练好的模型来初始化自己的模型权重,从而提升精度。自己训练好的模型也可以当做预训练模型,然后再在自己的数据集上进行训练。)时,GPT-3 模型的表现并不佳。研究人员认为,可能是由于训练 GPT-3 模型的大量数据与可用于微调的少量特定领域训练数据之间的大小不匹配,微调使得预训练模型变得过于拟合。
AI 在生物医学领域的应用不仅如此,一个叫做 Deep Mind 的公司开发的人工智能系统 Alpha Fold 还能快速准确地预测蛋白质 3D 结构。
氨基酸是构成蛋白质的基本单元,它们连成的长链经过折叠形成了拥有 3D 结构的蛋白质,但由于氨基酸的排列组合不胜枚举,折叠方式也是五花八门,所以预测蛋白质的 3D 结构非常困难。
以前人们会利用一种叫做 X 射线晶体学的技术,通过 X 射线照射蛋白质晶体样本,测量这些射线的衍射情况,进而推算出蛋白质分子的结构。
如今,DeepMind 团队利用 Alpha Fold 构建了一个包含 2 亿多种蛋白质 3D 结构的数据库(几乎囊括了科学界所有已知的植物、细菌、真菌和动物产生的蛋白质),通过神经网络算法学习这些数据,找出氨基酸序列与蛋白质最终形态之间的联系。
虽然预测模型不能百分之百保证预测的正确率,但将 AI 聊天机器人运用到生物医学上是一个无比大胆的突破。比起代写论文、替考、帮忙做作业,或许这才是 AI 发明的初衷。
……
你害怕 AI 时代的到来吗……
参考资料:
-
[1]Felix Agbavor, Hualou Liang. Predicting dementia from spontaneous speech using large language models. PLOS Digital Health, 2022; 1 (12): e0000168 DOI: 10.1371/journal.pdig.0000168
-
[2]https://spectrum.ieee.org/gpt-3-ai-chat-alzheimers
-
[3]https://www.science.org/content/article/game-has-changed-ai-triumphs-solving-protein-structures
-
[4]https://doi.org/10.1038/d41586-022-02083-2
-
[5]https://www.sciencenews.org/article/alphafold-ai-protein-structure-folding-prediction
-
[6]https://rarediseases.info.nih.gov/diseases/5404/uncombable-hair-syndrome
本文来自微信公众号:把科学带回家 (ID:steamforkids),作者:万物