huggingface chatgpt=hugginggpt -米乐网页

文/陈根

强强联手:当huggingface遇上了chatgpt,hugginggpt来了!

日前,由浙江大学与微软亚研院联合提出的hugginggpt是一个利用llm连接机器学习社区中各种ai模型以解决复杂ai任务的系统。例如,你给ai下达了一个任务“图片里有几种动物,每种有几只”,它就能帮你自动分析需要哪些ai模型,然后直接去调用huggingface上的相应模型,来帮你执行并完成。整个过程,你只需要用自然语言将你的需求输出。

大型语言模型llm

作为一种大型语言模型,llm是指包含数千亿(或更多)参数的语言模型,这些参数是在大量文本数据上训练的。llm是建立在transformer架构之上的,其中多头注意力层堆叠在一个非常深的神经网络中。而llm的涌现能力则被定义为“在小型模型中不存在但在大型模型中出现的能力”,这是llm与以前的plm区分开来的最显著特征之一。

现有的llm主要采用与小语言模型类似的模型架构(即transformer)和预训练目标(即语言建模)。作为主要区别,llm 在很大程度上扩展了模型大小、预训练数据和总计算量(扩大倍数)。他们可以更好地理解自然语言,并根据给定的上下文生成高质量的文本。这种容量改进可以用标度律进行部分地描述,其中性能大致遵循模型大小的大幅增加而增加。

llm在语言理解、生成、交互和推理方面表现出的非凡能力,引起了学界和业界的极大关注,也让人们看到了llm在构建agi系统方面的潜力。

协作系统hugginggpt

hugginggpt是一个协作系统,由llm充当控制器、众多专家模型作为协同执行器。其工作流程分为四个阶段:任务规划、模型选择、任务执行和响应生成。

任务规划:chatgpt 等 llm 首先对用户请求进行解析,进行任务分解,并根据其知识规划任务顺序和依赖关系;

模型选择:llm 将解析后的任务分配给专家模型;

任务执行:专家模型在推理端点上执行分配到的任务,并将执行信息和推理结果记录到 llm

响应生成:llm 对执行过程日志和推理结果进行汇总,并将汇总结果返回给用户。

归结起来:当hugginggpt收到用户请求时,使用chatgpt进行任务规划,根据huggingface中可用的功能描述选择模型,用选定的ai模型执行每个子任务,并根据执行结果汇总响应。借助chatgpt强大的语言能力和huggingface丰富的ai模型,hugginggpt能够完成覆盖不同模态和领域的复杂ai任务,并在语言、视觉、语音等具有挑战性的任务中取得令人满意的结果。实验充分证明了hugginggpt在处理多模态信息和复杂ai任务方面的强大能力,并且hugginggpt 将继续添加面向特定任务的ai模型,从而实现可增长和可扩展的 ai功能。hugginggpt 为走向通用人工智能开辟了一条新的道路。

已开源的“贾维斯”

目前,关于hugginggpt的论文已经发布,项目在建设中,代码已开源了一部分,并揽获1.4k标星。该项目没被叫作hugginggpt,而是取名于《钢铁侠》里的ai管家贾维斯(jarvis)。

同时,它和3月份发布的visual chatgpt的思想非常像,这并不奇怪,因为它们都有一个共同的作者,叫作微软亚研院。而它们的区别在于hugginggpt可调用的模型范围扩展了许多。

对于这个强大新工具的诞生,科学界纷纷表示:chatgpt已经成为人类创建的所有ai的总指挥官了;而agi可能不是一个llm,而是由一个“中间人”llm连接的多个相互关联的模型。

那么,我们是否已经开启了“半agi”时代?

免责声明:该自媒体文章由实名作者自行发布(文字、图片、视频等米乐体育官网app入口的版权内容由作者自行担责),且仅为作者个人观点,不代表 米乐网页-米乐体育官网app入口米乐网页-米乐体育官网app入口立场,未经作者书面授权,禁止转载。[投诉 · 举报作者与内容]

「作者 · 档案」
预见未来科技与商业,洞察前沿趋势新变化。

  
(0)

相关阅读

  • 文|陈根 在人们日常的生产生活中,调节到舒适的环境温度往往需要消耗大量的能量,而降低能源消耗是可持续发展的关键。目前,大量的工作都在致力于开发被动的个人热管理技术,即在不消耗任何能…

    2021年11月15日
    443
  • 文|陈根 在 1977 年的科幻大片《星球大战》里,莱娅公主利用全息投影技术,向卢克天行者和欧比旺发出求救信息。其它几部续集里,机器人 r2-d2 提供的全息影像也没太大改变,本质…

    2021年9月5日
    419
  • 文/陈根 皮肤病并不少见,对于皮肤特征的分析诊断就显得非常重要。 近日,新加坡南洋理工大学的一个研究小组称,他们开发了一种便携式设备,可以在10分钟内产生高分辨率的人体皮肤3d图像…

    2021年2月4日
    570
  • 文|陈根 疫情期间大量消费行为从线下转到线上,促进了消费领域的商业模式变革,加速推动了数字消费新业态、新模式蓬勃兴起。 数字消费的兴起符合一般的经济学逻辑,消费者先是在疫情期间增强…

    2021年12月2日
    487
  • 文|陈根 电子皮肤是一类重要的生物医学传感器,与人体皮肤一样能够感知外界不同的压力,也可畅通传导触觉信号的最基本功能。早在2003年,日本东京大学的研究团队就利用低分子有机物并五苯…

    2021年9月25日
    217

发表回复

登录后才能评论
发布
网站地图