每日报道：研究发现，人工智能语言模型在智商测试中明显胜过人类大学生

【资料图】

IT之家 1 月 9 日消息，2020 年 6 月，在训练约 2000 亿个单词、烧掉几千万美元后，史上最强大 AI 模型“生成型已训练变换模型 3”（GPT-3）一炮而红。

这个 OpenAI 打造的语言 AI 模型宛如万能选手，只有你想不到的画风，没有它输不出的文案，既能创作文学，能当翻译，还能编写自己的计算机代码。任何外行人都可以使用这一模型，几分钟内提供示例，就能获得想要的文本产出。

据新华社，美国加利福尼亚大学洛杉矶分校的研究人员发现，在衡量智力的一系列推理测试中，自回归语言模型 GPT-3 的成绩明显优于普通大学生。

该程序利用深度学习生成类似人类语言的文本。GPT-3 有很多用途，包括语言翻译和为聊天机器人生成文本等，其有 1750 亿个参数，是目前规模最大、功能最强的语言处理人工智能模型之一。

IT之家这里突然想到，OpenAI 的 ChatGPT 似乎也实现了类似效果，虽然它依然基于 GGPT-3，但这一模型被业内称为“GPT-4” ，这也是硅谷研究实验室推出的第四代语言模型，对全世界的搜索引擎、作家、编码人员、教授以及 Nickelback 构成了生存威胁。

当然，根据大多数专家的意见，与即将发布的 GPT-4 主版本相比，ChatGPT 现版本只能说是一个开胃小菜。

加州大学研究者认为，这类大型语言模型重新引发了关于在提供足够训练数据的情况下人类认知能力是否更强的争论。特别令人感兴趣的是这些模型能够零样本地推理新问题，而无需对这些问题进行任何直接训练。

研究人员指出，在人类认知中，这种能力与类比推理能力密切相关，而他们在一系列类比任务上对 GPT-3 进行了直接比较，包括与 Raven 的渐进矩阵密切相关的新型基于文本的矩阵推理任务，最终发现 GPT-3 表现出了惊人的抽象模式归纳能力，在大多数情况下匹配甚至超越人类的能力。

最终结果表明，诸如 GPT-3 之类的大型语言模型已经获得了一种“新兴能力”，可以为广泛的类比问题找到零样本解决方案。

参考资料：