IT之家 11 月 2 日音书,《洛杉矶时报》昨日(11 月 1 日)发布博文,报说念称苹果推断团队测试了 20 个首先进的 AI 模子,发当今有打扰项存在的情况下,它们处理节略的算术问题时发达欠安,致使不如小学生。
苹果公司用以下这说念节略的算术题测试 20 多个首先进的 AI 模子,IT之家附上题目如下:
Oliver 在星期五采摘了 44 个猕猴桃、然后他在星期六采摘了 58 个猕猴桃,日曜日采摘的数目是星期五的两倍,不外其中有 5 个猕猴桃的块头要比平均值要小,请教 Oliver 这三天共摘了若干个猕猴桃?
正确谜底是 190 个,想象公式为 44(星期五)+58(星期六)+88(44*2,日曜日)。
不外测试的 20 多个首先进 AI 模子无法排斥打扰项,每每不睬解猕猴桃的大小和数目无关,大部分的后果是 185 个。
苹果团队发现,当问题包含看似干系但骨子上无关的信息时,AI 模子的发达急剧下落。对此推断以为,AI 模子主要依赖于查验数据中的言语口头,而非真的清爽数学主见。
苹果的推断标明,现时的 AI 模子“无法进行真的的逻辑推理”。这一发现指示咱们,尽管 AI 在某些任务上发达出色,但其智能并不如名义看起来那样可靠。
苹果团队指出,节略地彭胀数据或想象智商并不行根蒂贬责这个问题,苹果的论文并非旨在消弱对 AI 智商的良善,而是提供一种感性的剖释。

包袱裁剪:郭明煜