ChatGPT的大动作:或将于今年夏季发布GPT-5升级!
自去年三月GPT-4发布以来,对发布GPT-5和其潜在能力一直受到外界的不断猜测。而其创始团队OpenAI则对这一话题的评论闭口不谈。对于一个名字中带有“开放”一词的公司而言,OpenAI在新产品方面几乎像苹果一样保密,往往是当他们认为时机成熟时,则突然推出产品。
然而,据国外媒体《Business Insider》报道,我们可能会在今年夏天看到GPT-5的发布,将其接入到ChatGPT,并将与GPT-4有实质性的不同”。
夏季发布传言的基础似乎来自给予新OpenAI模型早期访问权限的第三方公司。这些OpenAI的企业客户是公司的重要收入来源,用于支付运行更大型模型的不断增长的成本。
今年夏天会推出GPT-5吗?
夏季发布的传言与OpenAI CEO Sam Altman(奥特曼)在接受Lex Fridman采访时暗示的内容相反。他表示,虽然今年会有新模型推出,但不一定是GPT-5。
“我们将在今年发布一款令人惊叹的模型,我还不知道我们会怎么称呼它,”他说。“我认为在我们谈论类似GPT-5的模型之前,我们有很多其他重要的事情要先发布。”
这可能包括最近火热的视频AI模型Sora,OpenAI CTO Mira Murati曾表示这将在年底前发布。
奥特曼首次透露,GPT-5在去年11月开始训练,如果它的规模不比前身(GPT-4)大得多,那么需要几个月的工作是有道理的。
《Business Insider》的报告表明,他们已经超越了训练阶段,转向了“红队测试”,特别是如果他们向第三方公司提供演示的话。
红队测试是将模型置于极限环境并测试其安全问题的过程。红队测试之后的下一阶段是对模型进行微调,修正测试中发现的问题,并添加防护措施,使其准备好进行公开发布。
这个阶段则可能单独需要几个月,就像GPT-4一样,所以所谓的今年夏天推出GPT-5的传言实际上可能是GPT-4.5。毕竟,今年早些时候OpenAI泄露了一篇有关GPT-4.5-Turbo的博客文章,后来则删掉了。
这与之前的一代发布有关,从GPT-3到GPT-3.5,然后是GPT-4。我们还看到了GPT-3.5-Turbo,然后是现在免费提供给Microsoft Copilot使用的GPT-4-Turbo。
对于GPT-5将有什么期待?
奥特曼先前表示,GPT-5将是对任何先前一代模型的巨大改进。这将包括视频功能——即理解视频内容的能力,以及显著改进的推理能力。在近期的采访中除了夸大其词的评论之外,却很少透露了具体细节。我们知道它可能会比GPT-4更大,并且具有更多的参数,但是具体增加了多少并不清楚。在报道中也只是刚刚获得其前任规模的细节。
另外,在刚刚举办的游戏开发者大会GDC期间,英伟达(Nvidia)首席执行官黄仁勋(Jensen Huang)透露,GPT-4有1.8万亿个参数,并且需要30个yottaflops的计算能力来训练,这就像是持续运行93,000年的10亿台PS5一样,这显然已经是一个庞大的工程了。然而,不知道的是他们是否利用了英伟达的新ExaFLOP级超算GPU平台来训练GPT-5。数据中心中的全新的AI芯片Blackwell芯片集群则可以在几天而不是几周或几个月内训练出一万亿参数模型。
早些时候有一些人猜测认为GPT-5的最大特点是它可能会实现人工通用智能(AGI),不过就目前看起尽管GPT-5一定在各方面都将优于和超越GPT-4,但并不会是太大的飞跃。所以对于大众来讲,让我们静静等待吧。