gpt-米乐网页

文/陈根

3月15日，gpt-4刷屏。

如果说，chatgpt的诞生是人工智能领域的一枚炸弹，那么，gpt-4的发布就是人工智能领域新一道惊雷。chatgpt走火后，所有人都在讨论，人工智能下一步会往哪个方向发展。显然，我们并没有等太久，现在，openai正式推出新品gpt-4，再次点燃了我们对人工智能的想象力。

那么，号称史上最先进的ai系统的gpt-4，和chatgpt有什么不同？会给我们带来什么？gpt-4的发布，究竟意味着什么？

从测试品到gpt-4

实际上，在大多数人都惊叹于chatgpt强悍的能力时，却少有人知道，chatgpt其实只是openai公司匆忙推出的测试品。

据美国媒体报道，2022年11月中旬，openai员工被要求快速上线一款聊天机器人。一位高管称，该聊天机器人将被称为“chat with gpt-3.5”，两周后将免费向公众开放。这与原本安排不符。近两年，openai一直在开发名为“gpt-4”的更强大语言模型，并计划于2023年发布。2022年，gpt-4都在进行内部测试和微调，做好上线前准备。但openai的高管改变了主意。

由于担心竞争对手可能会在gpt-4之前，抢先发布自己的ai聊天机器人超越他们，因此，openai拿出了2020年推出的旧语言模型gpt-3的强化版本gpt-3.5，在此基础上进行了微调。这才有了新款的聊天机器人chatgpt诞生。

不可否认，虽然chatgpt已经让我们窥见了通用ai 的雏形，但chatgpt依然面对许多客观的问题，在一些专业的领域，chatgpt还存在着一些低级错误的现象。当然，这种情况是必然存在的，毕竟chatgpt开放给公众的时间比较短，接受训练的领域与知识库也还相对有限，尤其是在有关数学、物理、医学等专业并带有一些公式与运算的方面。

与chatgpt的匆忙发布不同，gpt-4是有所准备的结果。根据网传的消息，gpt-4早在去年8月就训练完成了。之所以现在才面市，是openai需要花6个月时间，让它变得更安全。而图像识别、高级推理、庞大的单词掌握能力，是gpt-4 的三大特点。

就图像识别功能来说，gpt-4 可以分析图像并提供相关信息，例如它可以根据食材照片来推荐食谱，为图片生成图像描述和图注等。但是，出于对潜在滥用的担忧，openai 推迟了图像描述功能的发布。也就是说，gpt-4 的图像输入功能还处于尚未公开的预览阶段，目前仅能在 openai 的直播中观看效果。

就高级推理功能来说，gpt-4能够针对3个人的不同情况做出一个会议的时间安排，回答存在上下文关联性的复杂问题。再比如你问，图片里的绳子剪断会发生什么。它答，气球会飞走。gpt-4甚至可以讲出一些质量不咋地、模式化的冷笑话。虽然并不好笑，但至少，它已经开始理解“幽默”这一人类特质，要知道，ai的推理能力，正是ai向人类思维慢慢进化的标志。

就词汇量来说，gpt-4 能够处理 2.5万个单词的能力，gpt-4在单词处理能力上是 chatgpt 的八倍，并可以用所有流行的编程语言写代码。其实，在随意谈话中，chatgpt和gpt-4之间的区别是很微妙的。但在当任务的复杂性达到足够的阈值时，差异就出现了，gpt-4比chatgpt更可靠、更有创意，并且能够处理更细微的指令。

并且，gpt-4还能以高分通过各种标准化考试：gpt-4 在模拟律师考试中的成绩超出 90% 的人类考生，在俗称“美国高考”的sa阅读考试中超出 93% 的人类考生，在 sat 数学考试中超出 89% 的人类考生。

而同样面对律师资格考试，chatgpt背后的gpt-3.5排名在倒数10%左右，而gpt-4考到了前10%左右。在现场演示中，gpt-4 还生成了关于复杂税务查询的答案，尽管无法验证其答案。在美国，每个州的律师考试都不一样，但一般包括选择题和作文两部分，涉及合同、刑法、家庭法等知识。gpt-4 参加的律师考试，对于人类来说即艰苦又漫长，而 gpt-4 却能在专业律师考试中脱颖而出。

gpt-4 和chatgpt有哪些区别？

除了具有优于chatgpt的性能，gpt-4 和chatgpt还有哪些区别？

openai 声称，他们花费了六个月的时间，来让 gpt-4 比上一代更安全。该公司通过改进监控框架，并与医学、地缘政治等敏感领域的专家进行合作，以确保 gpt-4 所给答案的准确性和安全性。gpt-4 的参数量更多，这意味着它将比上一版更接近人类的认知表现。

根据openai米乐体育官网app入口官网描述，相较于chatgpt，gpt-4最大的进化在于：“多模态”和长内容生成。其中的关键，就是多模态这个词，顾名思义，就是不同类型数据的融合。使用过 chatgpt的人们会发现，它的输入类型是纯文本，输出则是语言文本和代码。而 gpt-4 的多模态，意味着用户可以输入不同类型的信息，例如视频、声音、图像和文本。同样的，具备多模态能力的 gpt-4 可以根据用户提供的信息，来生成视频、音频、图片和文本。哪怕同时将文本和图片发给 gpt-4，它也能根据这两种不同类型的信息生出文本。

gpt-4模型的另一大重点是建立了一个可预测扩展的深度学习栈。因为对于像gpt-4这样的大型训练，进行广泛的特定模型调整是不可行的。因此，openai团队开发了基础设施和优化，在多种规模下都有可预测的行为。为了验证这种可扩展性，研究人员提前准确地预测了gpt-4在内部代码库上的最终损失，方法是通过使用相同的方法训练的模型进行推断，但使用的计算量为1/10000。

尽管gpt-4功能已经更加强大，但gpt-4与早期的gpt模型具有相似的局限性：它仍然不是完全可靠的，存在事实性“幻觉”并出现推理错误。在使用语言模型输出时应格外小心，特别是在高风险上下文中，使用符合特定用例需求的确切协议。不过，gpt-4相对于以前的模型显著减少了幻觉。对于不被允许的内容请求，gpt-4 的响应可能性降低了 82%。在 openai 的内部对抗性真实性评估中，gpt-4 得分比 gpt-3.5 高 40%。

在 openai 推出 gpt-4 之后，其米乐网页的合作伙伴兼投资股东微软也立马有所回应。微软表示：“新的 bing 正在 gpt-4 上运行，这是我们为搜索定制的。”显然，随着 openai 对 gpt-4 以及更高版本进行更新，bing 也从这些改进中受益。

另外，openai 还宣布与语言学习应用程序 duolingo、以及专为视障人士设计的应用程序 be my eyes 的背后公司建立合作，以便为残障人士提供支持。美国非营利教育机构可汗学院，将使用 gpt-4 为学生创建人工智能导师；冰岛政府将用其帮助维护冰岛本土语言；金融公司摩根士丹利，则使用 gpt-4 来管理、搜索和组织其庞大的内容库。

再进一步来看，在具体应用上，gpt-4 的高级推理技能，可以为用户提供更准确、更详细的回答；鉴于 gpt-4 具备更强大的语言能力和图像识别能力，因此可以简化市场营销、新闻和社交媒体内容的创建过程；在教育领域，gpt-4 可以通过生成内容、以及以类似人类的方式来回答问题，故能在一定程度上帮助学生和教育工作者。

gpt-4的发布意味着什么？

实际上，如果只按照是否能够执行多项任务的标准来看，此前发布的chatgpt已经具备了通用ai的特性——chatgpt被训练来回答各种类型的问题，并且能够适用于多种应用场景，可以同时完成多个任务，比如问答、对话生成、文本生成等。这说明，chatgpt不仅仅是针对某一特定任务进行训练的，而是具有通用的语言处理能力。

更重要的是，chatgpt的成功证明了大模型路线的有效性。在openai的gpt模型之前，人们在处理自然语言模型 nlp 时，都用的是循环神经网络（rnn），然后再加入注意力机制（attention）。所谓注意力机制，就是就是想将人的感知方式、注意力的行为应用在机器上，让机器学会去感知数据中的重要和不重要的部分。但 rnn attention，会让整个模型的处理速度变得非常非常慢，因为 rnn 是一个词一个词处理的。

所以后来，谷歌团队才提出来“不要rnn，只要attention”。而这个没有 rnn 只有 attention 的自然语言模型就是 transformer ，也就是今天chatgpt能够成功的技术基础。这个只有 attention 的transformer模型不再是一个词一个词的处理，而是一个序列一个序列的处理，可以并行计算，所以计算速度大大加快，一下子让训练大模型，超大模型，巨大模型，超巨大模型成为了可能。

在这样的模型下，加以时日，或者开放端口给专业领域的组织合作，以chatgpt的学习能力，再结合参数与模型的优化，将很快在一些专业领域成为专家级水平。而gpt-4 其实就是chatgpt进一步训练和优化的更强大版本。

就像我们人类的思考和学习一样，比如，我们能够通过阅读一本书来产生新颖的想法和见解，人类发展到今天，已经从世界上吸收了大量数据，这些数据以不可估量、无数的方式改变了我们大脑中的神经连接。人工智能研究的大型语言模型也能够做类似的事情，并有效地引导它们自己的智能。

在这次开放给大众使用，并且数以亿计的人涌入与chatgpt进行互动中，chatgpt将获得庞大又宝贵的数据，于是，chatgpt凭借着比人类更为强大的学习能力，其学习与进化速度正在超越我们的想象。

而现在，更强大的gpt-4甚至未来gpt-4的再下一代的推出，再结合openai将其技术打造成通用的底层ai技术开放给各行各业使用之后，ai就能快速的掌握人类各个专业领域的专业知识。

在数学中，“奇点（singularity）”被用于描述正常的规则不再适用的类似渐近线的情况。在物理学中，奇点则被用来描述一种现象，比如一个无限小、致密的黑洞，或者我们在大爆炸之前都被挤压到的那个临界点，同样是通常的规则不再适用的情况。1993年，弗诺·文格（vernor vinge）写了一篇著名的文章，他将这个词用于未来我们的智能技术超过我们自己的那一刻——对他来说，在那一刻之后，我们所有的生活将被永远改变，正常规则将不再适用。

现在，gpt-4的诞生，把我们进一步推向了技术奇点，如何适应gpt-4的存在和同用人工智能的到来，已经成为当前无可回避的现实问题。

免责声明：该自媒体文章由实名作者自行发布（文字、图片、视频等米乐体育官网app入口的版权内容由作者自行担责），且仅为作者个人观点，不代表米乐网页-米乐体育官网app入口（米乐网页-米乐体育官网app入口）立场，未经作者书面授权，禁止转载。［投诉 · 举报作者与内容］

gpt-米乐网页

相关阅读

中国“人造太阳”再创世界新纪录

fbi：您的新型智能电视可能会被黑客用来监视您

发表回复