Learn Prompt-Prompt 高级技巧:HuggingGPT

48 篇文章 6 订阅
订阅专栏
本文介绍了HuggingGPT系统,一个利用ChatGPT进行任务规划的AI框架,通过在HuggingFace平台选择和执行模型,解决复杂任务。系统涉及任务解析、模型选择和多模态处理,以提高效率和稳定性。HuggingFace是AI模型共享的平台,ChatGPT扮演关键角色。
摘要由CSDN通过智能技术生成

HuggingGPT是一个 Agent 框架,利用 ChatGPT 作为任务规划器,根据每个模型的描述来选择 HuggingFace 平台上可用的模型,最后根据模型的执行结果生成总结性的响应。这个项目目前已在 Github 上开源,并且有一个非常酷的名字叫做 JARVIS(钢铁侠的助手)。这项研究主要涉及到两个主体,一个是众所周知的 ChatGPT,另一个是 AI 社区中的 Hugging Face。

🎉开始阅读前,如果你对其他文章感兴趣,可以到欢迎页关注我们!「卡尔的AI沃茨」开源中文社区实时获得后续的更新和最新的教程🎉

hugging-gpt

这个系统包含四个阶段:

  1. 任务规划:使用LLM作为大脑,将用户的请求解析为多个任务。每个任务都有任务类型、ID、依赖关系和参数四个属性。系统会使用一些示例来指导LLM进行任务解析和规划。

具体指令如下:

[{"task": task, "id", task_id, "dep": dependency_task_ids, "args": {"text": text, "image": URL, "audio": URL, "video": URL}}]

  • "dep"字段表示前一个任务的ID,该任务生成了当前任务所依赖的新资源。
  • “-task_id”字段指的是具有任务ID为task_id的依赖任务中生成的文本图像、音频和视频。

用户和HuggingGPT之间的聊天日志被记录下来,并显示在显示资源历史记录的屏幕上。

  1. 模型选择:LLM将任务分配给专门的模型,这些请求被构建成了一道多项选择题。LLM为用户提供了一个模型列表供选择。由于上下文长度的限制,需要根据任务类型进行过滤。

具体指令如下:

根据用户请求和调用命令,Agent 帮助用户从模型列表中选择一个合适的模型来处理用户请求。Agent 仅输出最合适模型的模型ID。输出必须采用严格的JSON格式:{“id”: “模型ID”, “reason”: “您选择该模型的详细原因”}。

之后,HuggingGPT根据下载次数对模型进行排名,因为下载次数被认为是反映模型质量的可靠指标。选择的模型是根据这个排名中的“Top-K”模型来进行的。K在这里只是一个表示模型数量的常数,例如,如果设置为3,那么它将选择下载次数最多的3个模型。

  1. 任务执行:专家模型在特定任务上执行并记录结果。

具体指令如下:

根据输入和推理结果,Agent 需要描述过程和结果。前面的阶段可以形成下方的输入

用户输入:{{用户输入}},任务规划:{{任务}},模型选择:{{模型分配}},任务执行:{{预测结果}}。

为了提高此过程的效率,HuggingGPT 可以同时运行不同的模型,只要它们不需要相同的资源。例如,如果我提示生成猫和狗的图片,那么单独的模型可以并行运行来执行此任务。但是,有时模型可能需要相同的资源,这就是为什么HuggingGPT维护一个属性来跟踪资源的原因。它确保资源得到有效利用。

  1. 响应生成:LLM 接收执行结果,并向用户提供总结结果。

然而,要将HuggingGPT应用于实际场景中,我们需要应对一些挑战:

  • 提高效率:因为LLM的推理轮次和与其他模型的交互都会减缓处理速度
  • 依赖长上下文窗口:LLM需要使用长篇的上下文信息来传递复杂的任务内容
  • 提高稳定性:需要改进LLM的输出质量以及外部模型服务的稳定性。

现在,让我们假设您希望模型根据图像生成一个音频。HuggingGPT会以最适合的方式连续执行这个任务。您可以在下面的图中查看更详细的响应信息

hugginggpt_secret

Hugging Face是什么?

简单来说,Hugging Face是一个专注于人工智能的开源社区平台,用户可以在该平台上发布和共享预训练模型、数据集和展示文件等。目前在Hugging Face上已经共享了超过10万个预训练模型和1万多个数据集。包括微软、谷歌、彭博社、英特尔等众多行业的1万家机构都在使用Hugging Face的产品。

在HuggingGPT中,ChatGPT充当了”操作大脑”的角色,能够自动解析用户提出的需求,并在Hugging Face的AI模型库中进行自动模型选择、执行和报告,为我们开发更复杂的人工智能程序提供了极大的便利。

快速体验 ​

体验HuggingGPT非常简单,只需要输入openai apikey和HuggingGPT token即可:

HuggingGPT

https://huggingface.co/spaces/microsoft/HuggingGPT

下一节我们学习 MetaGPT,用SOP的思路让Agent更上一步,欢迎关注「卡尔的AI沃茨」

Reference

  • HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face
  • HuggingGPT: The Secret Weapon to Solve Complex AI Tasks
从众中取优:开源Agent市场深度调研,近20款主流开源Agent框架的技术亮点与适用场景深度剖析[Multi-Agent 框架详解]
丨汀、的博客
07-15 716
从众中取优:开源Agent市场深度调研,近20款主流开源Agent框架的技术亮点与适用场景深度剖析
setPrompt-设置命令窗口提示:将命令窗口提示设置为指定的字符串-matlab开发
05-30
setPrompt(newPrompt) 将命令行窗口提示设置为指定的 NEWPROMPT。 NEWPROMPT 可以是以下之一: - 静态字符串:setPrompt('>> ') => 这是默认的提示字符串 ('>> ') - 一个可评估的字符串:setPrompt&...
HuggingFace学习笔记--Prompt-Tuning、P-Tuning和Prefix-Tuning高效微调
牵一只蜗牛去散步
12-03 5429
Soft prompt 通常指的是一种较为宽泛或模糊的提示,允许模型在生成结果时有更大的自由度,通常用于启发模型进行创造性的生成;P-Tuning 是在 Prompt-Tuning的基础上,通过新增 LSTM 或 MLP 编码模块来加速模型的收敛;Prompt-Tuning 高效微调只会训练新增的Prompt的表示层,模型的其余参数全部固定;1-1--Prompt-Tuning介绍。3-1--Prefix-Tuning介绍。2-1--P-Tuning介绍。
【2023年12月17日】DALL·E的WEB系统提示词
提笔忘字的帝国
12-17 360
【代码】【2023年12月17日】DALL·E的WEB系统提示词。
最新Prompt预设词分享,DALL-E3文生图+文档分析
CodeRunning的博客
06-18 2151
请你充当一名论文编辑专家,在论文评审的角度去修改论文摘要部分,使其更加流畅,优美。能让读者快速获得文章的要点或精髓,让文章引人入胜;能让读者了解全文中的重要信息、分析和论点;帮助读者记住论文的要点字数限制在300字以下请你在摘要中明确指出您的模型和方法的创新点,强调您的贡献。用简洁、明了的语言描述您的方法和结果,以便评审更容易理解论文请你充当一名论文编辑专家,在论文评审的角度去修改论文摘要部分,使其更加流畅,优美。能让读者快速获得文章的要点或精髓,让文章引人入胜;
AGI之MFM:《Multimodal Foundation Models: From Specialists to General-Purpose Assistants多模态基础模型:从专家到通用助
近期请国内外头部出版社可尽快私信博主!——心比天高,仗剑走天涯,保持热爱,奔赴向梦想!低调,谦虚,自律,反思,成长,还算是比较正能量的博主,公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然,有点小情怀,也有点使命感呀)…
10-06 4069
​ AGI之MFM:《Multimodal Foundation Models: From Specialists to General-Purpose Assistants多模态基础模型:从专家到通用助手》翻译与解读之简介/视觉理解 目录 相关文章 《Multimodal Foundation Models: From Specialists to General-Purpose Assistants多模态基础模型:从专家到通用助手》翻译与解读 Abstract 1 Int
AI之MLM:《MM-LLMs: Recent Advances in MultiModal Large Language Models多模态大语言模型的最新进展》翻译与解读
近期请国内外头部出版社可尽快私信博主!——心比天高,仗剑走天涯,保持热爱,奔赴向梦想!低调,谦虚,自律,反思,成长,还算是比较正能量的博主,公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然,有点小情怀,也有点使命感呀)…
01-27 3780
​ AI之MLM:《MM-LLMs: Recent Advances in MultiModal Large Language Models多模态大语言模型的最新进展》翻译与解读 目录 《MM-LLMs: Recent Advances in MultiModal Large Language Models》翻译与解读 Abstract摘要 1、Lntroduction引言 2、Model Architecture模型架构,五个组件 3、Tra
论文理解【LLM-agent】—— 【Reflexion】Language Agents with Verbal Reinforcement Learning
佚失的诗篇
09-02 1305
本文介绍 LLM agent 领域的经典方法 Reflexion,它通过引入 episodic memory 为 agent 提供长期记忆,在不微调模型的参数的同时实现了基于上下文的试错学习,性能提升显著
AI绘画原理解析:从CLIP、BLIP到DALLE、DALLE 2、DALLE 3、Stable Diffusion
热门推荐
结构之法 算法之道
06-22 2万+
终于开写本CV多模态系列的核心主题:stable diffusion相关的了,为何执着于想写这个stable diffusion呢,源于三点确实非常非常多的朋友都看过我那篇SVM笔记,影响力巨大,但SVM笔记之后,也还是写了很多新的博客/文章滴,包括但不限于:xgboost、CNN、RNN、LSTM、BERT等今后基本每季度都有更新的计划,欢迎常来关于Stable Diffusion,可以先看下这篇的文章”(此篇文章也是本文的重要参考之一)
Agent调研--19类Agent框架对比
python1234_的博客
08-06 1140
代理(Agent)指能自主感知环境并采取行动实现目标的智能体,即AI作为一个人或一个组织的代表,进行某种特定行为和交易,降低一个人或组织的工作复杂程度,减少工作量和沟通成本。背景目前,我们在探索Agent的应用方向,借此机会调研学习了一下现在主流的Agent框架,这篇文章也是我们调研过程的记录。
react-native-prompt-android:一个在Android平台上用于Alert.prompt的polyfill库,可在Android和iOS平台上使用
05-27
react-native-prompt-android 一个适用于Android平台上Alert.prompt的polyfill库,可同时在Android和iOS平台上运行(iOS使用 ) 安装 从npm安装 npm i react-native-prompt-android --save 链接本机库 您可以使用...
prompt-to-prompt-main
03-29
"prompt-to-prompt-main"项目概述 在IT领域,"prompt-to-prompt"通常指的是一个交互式编程或自然语言处理的概念,它涉及到一种基于提示到提示的系统设计。这种系统的核心在于,它允许用户通过一系列的提示(prompts...
git-prompt-useremail:zsh插件为git user.email添加了提示提醒
02-05
Git-prompt-useremail 是一个专为ZSH shell设计的插件,它的主要功能是在命令行中为用户提供了关于当前git工作目录中`user.email`设置的实时提示。这个插件对于那些经常在多个项目间切换,并且每个项目可能需要不同...
xontrib-prompt-starship:Xonsh Shell中的星际飞船提示
03-07
xonsh外壳中的。...xpip install xontrib-prompt-starship # or: xpip install -U git+https://github.com/anki-code/xontrib-prompt-starship 用法 xontrib load prompt_starship 学分 该软件包是使用创建的。
Datawhale 组队学习 文生图 Prompt攻防 task02随笔
MrBlackmzq的博客
10-14 750
在赛题如果想要得到类似的文本安全性检测模型,可以有如下方法:方法GPU成本优缺点直接加载ShieldLM预训练权重,进行推理。较高现成的代码,精度高,与赛题保持一致但权重大小总共20GB,使用繁琐调用大模型对文本进行判断。较低成本较低,速度较快精度较低加载ShieldLM公开的训练数据集,构建分类模型适中可以定制,且精度较高需要单独训练模型,对于方法1,同学们可以参考官方Github给出的使用教程。接下来我们将介绍方法2和方法3的基础使用。
DEPT_ DECOMPOSED PROMPT TUNING FOR PARAMETER-EFFICIENT FINE-TUNING
最新发布
weixin_50917576的博客
10-21 734
提示调整(PT)是将少量可训练的软(连续)提示向量附加到模型输入上的方法,在参数有效微调(PEFT)的各种任务和模型架构中显示出有希望的结果。PT从其他PEFT方法中脱颖而出,因为它使用较少的可训练参数保持有竞争力的性能,并且不会随着模型大小的扩展而急剧扩展其参数。然而,PT引入了额外的软提示令牌,导致更长的输入序列,由于Transformer的二次复杂度,这极大地影响了训练/推理时间和内存使用。特别是对于面临大量日常查询的大型语言模型(LLM)。
用这条Prompt构建CoT+PoT验证器评估LLM输出,显著提高LLM推理准确性和一致性
python1234_的博客
10-15 926
即便是最先进的LLM,在复杂的多步推理问题上仍然面临挑战。如何提高LLM的推理准确性和一致性,成为了AI研究者们关注的焦点。尽管LLM在各种自然语言任务中表现出色,但在数学和代码推理等复杂任务中仍然存在明显的短板。研究者们发现,即使是最先进的LLM,在生成单一解决方案时的准确率往往不尽如人意。然而,有趣的是,当允许模型生成多个解决方案时,正确答案通常能够在这些样本中被找到,召回率甚至超过85%。
【大模型】3分钟了解提示(Prompt)工程、检索增强(RAG)和微调
追求自由的码砖人
10-18 392
模型虽通过海量数据训练,能力强大,但有时会给出错误回答。产生错误的原因可能包括:1) 提问方式不当,可通过提示工程提升其处理复杂任务的能力;2) 训练数据虽多但缺乏某些垂直领域或实时性的知识,可通过检索增强(RAG)先检索相关知识再生成答案;3) 在特定领域如医学、金融等可能能力不足,可通过微调训练让模型记住特定领域知识,减少幻觉。
预训练模型通过 prompt(提示)生成的“软标签”是什么
qq_45809323的博客
10-18 274
软标签(Soft Label)通常指的是模型预测结果中输出的概率分布。例如,如果一个分类任务中有3个类别,模型的输出可能是:这意味着模型认为输入数据属于类别1的概率是70%,类别2是20%,类别3是10%。这与硬标签(Hard Label)不同,硬标签只会给出一个确定的类别,如[1, 0, 0],即模型认为输入属于类别1,没有其他可能性。预训练模型通过 prompt 生成的软标签是模型输出的概率分布,而不是一个确定的分类结果。
深度解析Prompt-Tuning:微调新范式与应用探索
在本文中,我们将深度探讨Prompt-Tuning,这是一种全新的微调范式,尤其在深度学习领域,如大型语言模型(LLM)、自动创意生成内容(AIGC)以及如何利用这些模型构建特定领域的应用。作者王嘉宁通过NewBeeNLP公众号...
写文章

热门文章

  • 撸毛笔记-饿了么 v3.10(青龙脚本) 6194
  • 万字拆解!月活2亿的小红书产品设计全方位深度解析 5017
  • 【好玩的 Docker 项目】10 分钟搭建你专属的下载神器 ——qbittorrent 4817
  • 吐血整理!如何从零开始准备大学生数学建模比赛? 4649
  • 机器学习实际案例-量化交易案例 3035

分类专栏

  • 副业 付费 99篇
  • Python 付费 260篇
  • 青龙脚本 付费 55篇
  • ChatGPT 48篇
  • 编程 9篇
  • 好玩的项目 4篇
  • 产品拆解 2篇
  • Python数据结构与算法 22篇
  • 零基础学算法 81篇
  • serverless 5篇
  • 闲话 2篇
  • Python入门教程 18篇
  • 翻译 22篇
  • 转载 34篇
  • chrome插件 1篇
  • 小程序 2篇
  • 低代码 2篇
  • 电子设计大赛 49篇
  • 机器学习 71篇
  • 美赛 6篇

最新评论

  • Scriptable脚本合集

    ʀᴏᴋɪ: 第一个怎么弄的,是哪个公众号啊

  • 吐血整理!如何从零开始准备大学生数学建模比赛?

    yanxiansen04: 感觉Python泛用性更好啊,而且有很多方便的深度学习的算法

  • 吐血整理!如何从零开始准备大学生数学建模比赛?

    Yunni_root: spsspro博主用过吗,觉得如何呢

  • Scriptable脚本合集

    shyuu_: 不错,但是很多都过时了

  • 撸毛笔记-中国联通 v1.09 更新(修复立减金打卡和联通支付日打卡)

    w229382095: 脚本地址打不开了,老大

大家在看

  • flask服务通过gunicorn启动 117
  • PTA7-16幸运彩票
  • 网络安全热门证书介绍及备考指南 1
  • PTA 7-1星期几 114
  • java基于springboot的个性化课程推荐系统(源码+vue+部署文档+前后端分离等)

最新文章

  • 100+基于电子和通信的重要且有用的项目-DTMF,GSM,RF,RFID,智能卡等
  • 50+最新电子创意案例-基于Arduino的电机、Android、Zigbee传感器网络和ARM控制器等程序案例
  • 50+EIE项目列表-学生发布的各种项目创意,包含各种类别,如微控制器,电气,GSM,机器人,DTMF等
2024
04月 8篇
03月 57篇
02月 182篇
01月 139篇
2023年439篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xiaoshun007~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家济南唐韵玻璃钢马雕塑哈尔滨玻璃钢瓜果雕塑吉林卡通玻璃钢雕塑定做广东玻璃钢雕塑报价深圳 玻璃钢雕塑四川大型玻璃钢雕塑优势水景校园玻璃钢雕塑制造济南户内玻璃钢雕塑生产厂家东阳玻璃钢雕塑公司临沂卡通玻璃钢雕塑普陀区玻璃钢雕塑销售电话昆明景观玻璃钢雕塑市场扬州设计玻璃钢雕塑方案玻璃钢雕塑模具是怎么制造的广州玻璃钢动物雕塑按需定制常州玻璃钢雕塑设计价位临潼玻璃钢雕塑批发南京透明玻璃钢雕塑一般多少钱聊城公园玻璃钢雕塑生产厂家玻璃钢雕塑设计感裙子昭通市玻璃钢雕塑供应商宁夏小区玻璃钢雕塑安装外贸玻璃钢花盆厂家直销长沙玻璃钢雕塑出租辽宁玻璃钢雕塑供应河北玻璃钢雕塑售价南京定制玻璃钢雕塑厂家直供吉林卡通玻璃钢雕塑定制玻璃钢纪念雕塑枣庄小品系列玻璃钢雕塑香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化