科技巨头鏖战chatgpt,百度能胜出吗? -米乐网页

文/陈根

本质上来看,chatgpt就是一种基于 instructgpt算法架构开发的大型预训练语言模型,都是基于大模型、大数据的不断训练。chatgpt的背后,除了常规的万亿级别语料投喂之外,还依托于其强大的算力。据数据披露,chatgpt的总算力消耗约为3640pf-days。

简单来说,chatgpt就是高质量的人工标注数据再加上强化学习结合的产物,chatgpt在经过万亿级别的语料投喂后不断进行学习和迭代,最后依托于强大的算力为产品的学习和输入输出进行支撑。

因此,对于中国的互联网科技公司来说,谁更有积累可以去做这件事,谁就越能抢到chatgpt的先机

实际上,国内这样的大模型非常多,百度、阿里巴巴、腾讯、华为等都有大模型。百度文心模型参数量已经达到2600亿,不逊于gpt3.0。百度宣称今年3、4月份推出类似于chatgpt的模型,可能首期的应用场景会跟搜索结合,会形成chatgpt、搜索的双引擎结合模式,发布会的demo出来,整体模型的参数量级甚至比gpt3.0大了50%。华为对于“华为在类似 chatgpt 方向的布局”也回应称,公司2020年开始在大模型有布局,2021年发布鹏城盘古大模型,是业界首个千亿级生成和理解中文自然语言处理大模型。

在国内头部科技企业中,相较而言,百度在“类chatgpt”项目中会有比较大的优势:首先,在国内互联网企业中,百度对人工智能的布局最多;其次,百度的中文语料库最全;第三,chatgpt所使用的人工智能聊天技术对百度来说是“生命线”,百度必然也会在这方面投入最大,正如谷歌搜索一不小心就会被微软投资的chatgpt超车,因此,百度在这方面也是最在意的。

不过,相较于chatgpt的母公司openai来说,openai还具有所有互联网科技大厂都不具有的优势,那就是专注。就训练大模型来说,几百亿的参数或者几千亿的参数,甚至几万亿的参数,都需要面对复杂的工程化的问题,需要不断地谨慎地细致地耐心地去调模型,去优化模型,这个工作是很漫长的。

打个比方,如果我们要去生产训练这样的一个大模型,可能只需要一个月的时间来生产,却需要一年的时间去优化它,这个过程会大量耗费算力和时间,这种调参也被行业人士戏称为“炼丹”并且,调整和优化的过程,还需要耗费高昂成本。这对于互联网科技巨头来说,也是十分困难的事情,以百度为例,这些年,从人工智能、自动驾驶、新能源汽车、元宇宙,到现在的chatgpt,百度的布局一个概率都没落下,但却也没有一个真正的产品或事情干出来。

因此,想要抢到chatgpt的先机,必然需要多方面因素的叠加下,除此之外,还要摒弃杂念,专注于类chatgpt的研发,精工出成果。

免责声明:该自媒体文章由实名作者自行发布(文字、图片、视频等米乐体育官网app入口的版权内容由作者自行担责),且仅为作者个人观点,不代表 米乐网页-米乐体育官网app入口米乐网页-米乐体育官网app入口立场,未经作者书面授权,禁止转载。[投诉 · 举报作者与内容]

「作者 · 档案」
预见未来科技与商业,洞察前沿趋势新变化。

  
(0)

相关阅读

  • 文|陈根 固体、液体、气体是我们已经十分熟悉的几种物质状态,但是,它们远不是整个物质宇宙的全貌。迄今为止,科学家们已经发现或创造了数十种更为奇特的物质状态。时间晶体,就是过去几年新…

    2022年1月7日
    630
  • 微芯片无处不在,很容易忽略它们的真正杰出之处。像温控器或唱歌贺卡一样平凡的东西包含数百万个微观结构,这些微观结构是有史以来开发的最杰出的制造工艺之一。自1977年左右以来,当前的流…

    2020年1月2日
    4.4k
  • 以牙还牙,以眼还眼

    2019年4月20日
    9.8k
  • 最后一个视频“iphone上有两个电话号码”显示了如何在拨号器应用中切换主要和次要线路。目前这一代iphone能够在esim旁边使用传统的sim卡,从而可以通过单个设备使用两条线路。

    科技 2019年3月13日
    5.6k
  • 文/观察未来科技 如今,量子科技正在蓬勃发展,其中,量子精密测量则是量子科技的一个重要领域。 往前回溯到1927年。在这一年,海森堡提出了量子不确定性原理:粒子的位置与动量不可同时…

    科技 2022年8月15日
    454

发表回复

登录后才能评论
发布
网站地图