ChatGPT公司OpenAI隔夜上线了其最新人工智能模型GPT-4,轰动了整个科技界。据OpenAI自己称,GPT-4将是该公司里程碑式的模型。

  在其概念视频中,OpenAI介绍新模型可以解决更复杂的问题、编写更大型的代码,并通过图片产生文字。此外,OpenAI还承诺GPT-4相比之前的模型,包括ChatGPT此前应用的GPT-3.5,将更加安全且具协调性。

  用简单的话说,GPT-4模型改变了此前ChatGPT等历史人工智能的单一、文本短小等缺点,变身为一个能看图说话的高级“解语花”。

  然而,这朵“解语花”也点燃了不少人的焦虑,比如硅谷最著名的企业家马斯克。

  他在推特平台上发文称:人类还能做什么?我们最好使用Neuralink(来对抗人工智能)!

image

  此外,他还回复了网友关于GPT-4内测的帖子,称他个人十分关切这个新模型,也认为这个新的人工智能看起来很有意思。

  但马斯克关于GPT-4和Neuralink的评论还是让不少网友觉得尴尬,不少人嘲讽他的脑机广告听起来并不吸引人。相比于人工智能机器人取代人类,在大脑里植入设备似乎更让人头皮发麻。

  不过,网友们关于GPT-4领导机器人占领世界的想法也是过于杞人忧天。

  正如OpenAI强调的那样,GPT-4目前仍是并不完美的模型,其能力远不如人类。GPT-4仍有许多局限性,如社会偏见、幻觉和对抗性提示。

  硅谷做题家

  GPT-4现在最热门的话题莫过于它强大的应试能力。根据OpenAI的评估,GPT-4已经能轻松通过美国的律师考试,且考进了前10%的排名。相比之下,它的上一代模型GPT-3.5只能吊个车尾。

  除了律师考试,GPT-4还在美国大学入学测试SAT中考到710分,虽然分数不高,但已经够上美国大学录取水平。更重要的是,GPT-4能在大学的基础微积分课程中获得4的成绩(5分为满分),这证明了该模型已经掌握了高等数学大部分的概念。

  网友也对它的这些做题能力进行了进一步的测试。

  比如让它分析柱状图,并回答图形背后的统计学意义,或者出一道用法语描述的物理题。令人欣慰的是,它竟然没有胡言乱语,而是有条有理地给出了正确答案。

imageimage

  另一方面,已经升级为GPT-4模型的ChatGPT,现在已经可以通过用户的简单需求直接生成代码,甚至网站。即便用户只是在餐巾纸上画了个简单界面,GPT-4都能直接搞出一个可运行的网站。

image

  如此好用不废话的程序员,大概是每一个产品经理心中永远的神。

  量子波动速读?

  更让人嫉妒的是,曾经中国爆火的“量子波动速读”竟然也在GPT-4上获得了重现。这种被机构滥用的反人类教育噱头,在非人类的人工智能上却得到了完美的诠释。

  有网友将一整篇论文上传给GPT-4,然后,GPT-4就在极短时间内完成了阅读,并给出清晰的总结摘要。

imageimage

  甚至,如果有人问它某个图是什么意思,代表了什么意义,GPT-4也能像模像样地给出解答。

image

  与GPT-3.5相比,GPT-4将文字输入限制提升至2.5万字,这让其阅读体量大大增加,也让用户的文书处理工作变得更加简洁。

  此外,强大的识图能力和显著提高的回答准确性,也保证了GPT-4在文字处理上的优越性,相较于GPT-3.5的答不上来就乱编,已经出现了长足的进步。

  破解冷笑话

  如果说昨天的ChatGPT还是一个不解人意的“老古董”,那么今天的ChatGPT就已经可以轻松理解网友心照不宣的冷笑话,即便是表情包,它也能说个子丑寅卯来。

  比如鸡米花拼成的世界地图,ChatGPT就轻松回答出了网友想要的答案:这是个玩笑,用鸡米花和世界地图两个不相干的东西形成一种幽默。

image

  虽然识图这一功能在人工智能领域并不罕见,谷歌搜索甚至连淘宝都具备识图功能,但这一功能还是首次亮相于ChatGPT。

  而除了简单的识图之外,更可贵的是,ChatGPT现在还能解释图像的具体意义,并理解图像背后的隐喻含义,这在其他识图人工智能上仍十分罕见。

  可惜的是,目前图像输入的功能仍只是预览阶段,还不能使用,即便是氪金玩家现在也只能按捺住好奇心。

  Cosplay“受害者”

  早在ChatGPT出来的时候,网友们就热衷于让人工智能玩角色扮演的游戏。什么假设你是一个财经编辑啦,假设你是一个程序员啦,假设你是小说家啦……总之,网友想到什么,ChatGPT就被迫成为什么。

  而现在,这样的花活居然被OpenAI官方带头认可。

  相比于GPT-3.5时期,现在鸟枪换炮的ChatGPT不再用一本正经的语气规劝网友,类似于“我只是个人工智能,我无法……”的表达,现在都用更具个性化的话替代。

image

  OpenAI要求GPT-4拿出服务精神。既然用户希望得到一个定制的GPT-4,那么GPT-4就要表现出相应的人物性格和态度。

  缺憾仍在

  根据OpenAI的内部测试,GPT-4仍有GPT-3.5的老毛病,就是胡言乱语。专业地讲,GPT-4仍会产生幻觉,生产错误答案,并出现推理错误。

  总的来说,GPT-4已经显著减轻了幻觉问题,在这一项上,GPT-4的分数比GPT-3.5要高出40%。但这可能也意味着GPT-4的乱讲话可能更隐蔽,更难以被用户察觉。

  另一方面,GPT-4仍缺乏对数据截至日期后新进展的了解能力,即其无法在训练学习后,追踪新的信息来补足对某件事认知。此外,它也无法从经验中学习,并可能一直轻信人类。

  在安全边界上面,GPT-4也得到了相应的加强,与GPT-3.5相比,它对违禁内容的回复率下降了82%,对敏感内容(如医疗建议)的响应率则提高了29%。

  还有一个不太友好的地方在于,GPT-4的使用目前仅对ChatGPT Plus玩家开放,换句话说,需要付费。

  目前OpenAI对GPT-4的训练规模、硬件、算力等一切保持缄默,只说会在未来陆续公布,可谓是吊足了外部观众的胃口。

  不过,瑕不掩瑜,截至目前,科技人士对GPT-4的评估仍持正面态度。更多的人则在说:未来已来,迎接新世界吧。