十年磨一剑,百度“文心”表现如何? -米乐网页

文/陈根

chatgpt的爆火点燃了人工智能万亿赛道,互联网科技巨头纷纷入局。其中,百度作为中国领先ai技术公司,同时也是最大的中文搜索引擎,成为了第一个冲刺国产版chatgpt的公司。蓄势了一个多月,承载着万众的期盼或好奇,“国产版chatgpt——文心一言”终于在3月16日正式亮相

百度同时公布了文心一言的邀请测试方案。3月16日起,首批用户即可通过邀请测试码,在文心一言米乐体育官网app入口官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言api接口调用服务。

那么,承载万众期待的“文心一言”满足了众人的期待吗?百度推出“文心一言”后,国产版chatgpt局面又将发生怎样的变化?

百度文心,十年磨一剑

在中国众多科技大厂中,百度是最早针对chatgpt做出明确表态的公司之一,也是中国最早布局人工智能的公司之一。

2022年9月的世界人工智能大会,百度创始人、董事长李彦宏就在开幕式上发表视频演讲,表示百度已在人工智能领域摸爬滚打10年,10年累计研发投入超1000亿元,2021年核心研发占比23%,研发投入强度持续位于全球大型科技公司前列。相较而言,去年前三季度,阿里、腾讯、美团的研发投入占比分别约为15%、10%和8%。

持续的研发投入让百度在人工智能领域愈发沉淀。2023年百度create大会暨百度ai开发者大会上,李彦宏提到,百度是如今少有的同时具备人工智能四层能力的公司,这包括芯片层的昆仑ai芯片、框架层的飞桨深度学习框架、模型层的文心大模型和应用层的搜索、自动驾驶、智能家居等产品。

芯片层方面,百度是中国第一批自研ai芯片的互联网公司。百度的昆仑ai芯片研发始于2011年,正式发布于2018年。对外发布时,昆仑已支持百度业务多年。到2020年秋天之前,已有超2万片昆仑芯片每天为百度搜索引擎、广告推荐和智能语音助手小度提供ai计算能力。

框架层方面,百度飞桨是国内最早启动研发的自研深度学习框架。2016年百度推出的飞桨在2021年成为中国开发者使用最多的深度学习框架,在全球排名第三,开源至今,飞桨已凝聚406万开发者,服务过15.7万企事业单位,开发模型达47.6万个。飞桨能帮开发者快速创建、部署模型,它现在已拥有535万开发者,服务了20万家企事业单位,创建了67万个模型。

模型层方面,百度在2019年发布文心大模型,它可以根据用户的描述生成文章、画作、视频等多种内容,这就是去年至今大热的“生成式ai。目前,百度的文心大模型已更新迭代至文心ernie 3.0,参数规模高达2600亿,是全球最大的中文单体模型。与此同时,文心ernie 3.0还支持生成式ai,具备强大的跨模态、跨语言的深度语义理解与生成能力。

基于文心大模型,百度目前已发布11个行业大模型,大模型总量达36个,已构成业界规模最大的产业大模型体系。目前已大规模应用于搜索、信息流等互联网产品,并在工业、能源、金融、汽车、通信、媒体、教育等各行业落地应用。

百度的“文心一言”也正是基于文心大模型而开发的国产版chatgpt2月7日,百度公布其类chatgpt项目名为“文心一言”,预计将于3月完成内测并向公众开放。当时,百度宣布这一消息后,百度港股股价跳涨15%以上。

实际上,百度这些技术布局,也往往始于技术微末之时,甚至被冠以“烧钱”的字眼。但也正是十年饮冰的坚持投入,使得百度ai大底座成为了行业内首个全栈自研的智算基础设施。又正是长期技术积累带来的全栈自研能力,给行业和百度本身,都带来了更深远的影响。

文心一言,水平如何?

3月16日下午2点,百度的邀请测试展示正式召开。现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作方向,问题主要围绕《三体》进行询问,包括作品信息、核心内容、续写创作。当然,文心一言也准确、详细地介绍了《三体》作者刘慈欣。紧接着,文心一言总结了《三体》核心内容,条理分明地列出了3大点,并且还给出了5个续写的角度。

在商业文案创作中,文心一言则顺利完成了给公司起名、写slogan、写新闻稿的创作任务。在连续3次内容创作生成中,文心一言既能准确理解人类意图,又能清晰地表达。并且,在回答之余,文心一言会自动增加冗余的额外解释——尽管整体内容更倾向于正确的废话。李彦宏称:“这些训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。”

除了基本的文学方向,文心一言还可以尝试解决含逻辑思维的数学推演题目,现场演示中,鸡兔同笼经典题型,文心一言的确表现出能理解题意,还给出了正确的解题思路,就像学生做题一样,按正确的步骤,一步步算出正确答案。当然,解答本质上和当下的小猿搜题、作业帮等第三方解题软件并无区别。

此外,在中文理解方面,文心一言还表现出先进的自然语言处理能力。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。

在多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。比如,让文心一言为2023世界智能交通大会创作一张海报。几秒之后,一张赛博风格的图片就生成了。有意思的是,文心一言还能根据内容生成四川话等方言的语音。

但遗憾的是,这些都不是实时演示——李彦宏表示,为了保证演示效果,文心一言现场问答测试为提前录好的视频

这也不难理解为什么发布会召开后,百度股价不涨反跌,港股百度集团跌幅近10%。不少梗图频现,消费者对产品预期之低可见一斑。实际上,就连李彦宏也直言,文心一言对标chatgpt,但不能叫完美。尤其是从其回答表现来看,问题准确性与上下文的逻辑联系性表现尚可,以搜索引擎论已属优异,但类人性不足,可明显感知信息多从语料资料库中集成而来,并无直接对话之感。

而反观gpt-4,其在各种专业测试和学术基准上的表现与人类水平相当,不仅以前10%的超强能力通过了模拟律师考试,sat成绩达到710,且具备解决高难度数理逻辑,拆解多语言复杂题型,以及速读看论文总结摘要的能力。两相对比,确实高下立现。

未来之路漫长

当然,虽然市场用脚投票,表示了对百度文心一言的态度,但需要指出的是,文心一言也并未一无是处,至少在国内,其仍代表着第一梯队的水平。

从技术角度而言,文心一言核心引擎为百度自主推出的nlp模型ernie,整体框架基于bert模型改进。chatgpt和文心一言都是基于transformer模型架构,但gpt采用单向语言模型,而文心一言则采用双向语言模型。因此,在实际操作时,gpt对于文本生成更为敏感,比如聊天、写作等语言生成方向表现优异,而文心一言对于文本理解更为敏感,在问答、语义关系抽取更有优势。

也就是说,文心ernie类人性稍差,回答以精准理解为主,同时更多聚焦于本土化,在语义复杂的中文npl处理中有显著优势,毕竟由于各种限制,即使是最新版本gpt-4测试的26种语言中也并未涵盖中文。实际问答题体验中,当涉及中文语义理解时,ernie表现突出,甚至部分胜于gpt3.5比如,在关于洛阳纸贵的回答中,文心一言可正确理解其的经济现象,古诗词的可读性和观赏性也更高,更符合国人的审美与品味。

当然,作为首发的国产版chatgpt,文心一言的发布也进一步暴露出国产化chatgpt的困境。虽然百度已经在ai的各个层面都有较为全面的布局,并且具有中文世界里最大的数据库,但百度同时面临的一个更大的困境,就是数据的质量问题,因为没有高质量的数据就难以训练出高质量的类chatgpt产品。

如果百度训练chatgpt的数据优质,那么输出的结果也相对客观。如果训练的数据都是百度中文世界的网络信息,那么可能就要慎重,以免曾经的魏则西事件重演。因为如果训练的数据质量,以及产品背后的规则不够清晰,结果可能就不会有那么理性。实际上,这也是中文互联网的问题。

当然,就百度来说,其在人工智能领域还面临着另外一个重要并现实的挑战,那就是推行类chatgpt的业务可能会对其传统的搜索业务带来影响。而传统的搜索业务中,广告收入是百度当前最主要,也是大部分的利润来源。如果百度的传统搜索业务中的广告业务受到了类chatgpt技术的影响,必然会影响到百度的研发投入。

此外,在落地场景方面,chatgpt能否适应中国各行各业的碎片化转型需求,尚有待验证。李彦宏也坦言,“chatgpt是ai技术发展到一定地步后产生的新机会。但怎么把这么酷的技术,变成人人都需要的好产品,这一步其实才是最难的,最伟大的,也是最能产生影响力的。”

对于人工智能而言,比拼的不单单是人工智能领域的技术研发,而是集人工智能研发、算力、芯片、数据等多方面的集成综合实力。而百度和文心一言才刚刚出发,未来还有很长的路要走。

免责声明:该自媒体文章由实名作者自行发布(文字、图片、视频等米乐体育官网app入口的版权内容由作者自行担责),且仅为作者个人观点,不代表 米乐网页-米乐体育官网app入口米乐网页-米乐体育官网app入口立场,未经作者书面授权,禁止转载。[投诉 · 举报作者与内容]

「作者 · 档案」
预见未来科技与商业,洞察前沿趋势新变化。

  
(0)

相关阅读

  • 文/陈根 智能时代下,从传统机械硬件定义汽车转向软件定义汽车,新能源汽车是未来汽车智能化、网联化的重要载体。汽车行业变局已然开启,新能源汽车替代传统燃油车趋势不可逆转。 在这样的背…

    2020年12月24日
    474
  • 文/观察未来科技 当前,虚拟现实技术(vr)的蓬勃发展,正在改写过去的规则,虚拟现实技术让人们体验数字化生活,并把人们的感官传送到一个计算机生成的世界中。不过,目前,虚拟现实最为热…

    科技 2022年8月16日
    334
  • 秒送号(miaosong.cn)自媒体平台12月6日消息,如果我们真的想防止自动武器的崛起(杀手机器人可以在不需要人类批准的情况下拉动扳机),那么工程师实际上将需要停止朝着它们努力…

    科技 2019年12月6日
    5.4k
  • 文/陈根 历经了20多年的快速发展,互联网已经深刻融入到人们生活的各个环节中,改变了人们的生活、思维方式。互联网诞生了很多区别于传统的伟大的商业模式,基于社交网络的各种应用就是其中…

    2021年11月2日
    510
  • 文/陈根 工业的发展让人类有更大的能力去改造自然并获取资源,其生产的产品被直接或间接地运用于人们的消费当中,极大地提升了人们的生活水平。可以说,自第一次工业革命以来,工业就在一定意…

    2021年8月9日
    384

发表回复

登录后才能评论
发布
网站地图