搜索
  • 首页
  • 快讯
  • 资讯
    • 推荐
    • 财经
    • AI
    • 创新
    • 城市
    • 最新
    • 创投
    • 汽车
    • 科技
    • 专精特新
  • 直播
  • 视频
  • 专题
  • 活动
搜索
寻求报道
我要入驻
城市合作
首页> 人工智能>正文

生成式AI:充满创造力的新世界

红杉汇·2022-09-28 09:42
说出来你可能不信,这篇文章可是AI写的

人类擅长分析,但机器做得更好。机器可以分析数据,并针对不同用例需求找到相应的规律——不管是诈骗信息识别、垃圾邮件检测、预测快递送达时间还是为你推荐可能感兴趣的短视频——而且它们还在不断迭代,变得越来越聪明。这种机器被称为“分析式人工智能”(Analytical AI),或者传统AI。

但人类不仅擅长分析,还擅长创造——比如写诗、设计产品、制作游戏与编写程序代码。以前,机器在这些方面无法与人类抗衡,它们只能做些分析型或机械式的认知计算。但现在不一样了,AI发展到了新的阶段,机器已经开始可以创造有意义并具备美感的东西了。这一新型的AI被称为“生成式人工智能”(Generative AI),也就是说,机器并非如之前那样仅分析已有的数据,而是生成了全新的东西。

生成式AI不仅正在变得更快、更便宜,而且在某些情况下,其生成的结果比人类手工创造的还要好。从社交媒体到游戏,从广告到建筑,从编程到平面设计,从产品设计到法律,从市场营销到销售,每一个需要人类原创力的行业都将有可能会被颠覆。某些岗位将完全被生成式AI取代,有些则会在生成式AI的帮助下更好地促进人机协作——但总体来说,生成式AI将有非常广泛的终端应用市场,帮助人们更好、更快并以成本更低的方式去创作。最理想的情况是,生成式AI将会把创作与知识类劳动的边际成本降为零,极大提升生产力并创造巨大的经济价值——当然还有相应的市场价值。

本文由红杉合伙人Sonya Huang、Pat Grady与生成式AI预训练模型 GPT-3共同创作完成,正文中的两幅插图是由Midjourney生成的,希望这篇人机合作的文章能为你打开一个充满创造力的新世界。

每期监测和精编中文视野之外的全球高价值情报,为你提供先人一步洞察机会的新鲜资讯,为你提供升级思维方式的深度内容,是为[ 红杉汇内参 ]

为什么是现在?

和更广泛意义上的AI一样,生成式AI也需要思考“为什么是现在”这样的问题——因为现在有了更好的模型、更多数据、可以做更多的计算。这一方向的发展变化远比我们想象的要快,为了更好理解它当下的发展进程,我们不妨先梳理一下它最近的发展历史。

第一波发展浪潮:小模型至上阶段(2015年以前)

2015年以前,小模型被认为是理解语言的“最先进的技术”。这些小模型更擅长分析型任务,因此被用于从“预测送达时间”到“欺诈信息分类”等各类任务中。然而,对于通用的生成任务来说,它们的表达能力还不够,生成人类水平的文章或代码仍然是白日做梦。

第二波发展浪潮:规模化竞赛阶段(2015年-今天)

谷歌研究院的一篇里程碑式的论文《只要注意力机制就够了》( 《Attention is All You Need》),向人们描述了一种用于自然语言理解的新型神经网络架构——Transformers模型(有时翻译为“变换器”模型),它不但能生成质量上乘的语言模型,同时具有更高的可并行性,大大降低了所需的训练时间。这些小样本学习模型,可以相对更容易地针对特定领域做定制修改。

随着AI模型逐渐发展壮大,它们已经开始超越人类的基准水平。

当然,随着模型越来越大,它们开始匹敌人类,然后超越人类。从2015年到2020年,用于训练这些模型的计算量增加了6个数量级,其表现在手写、语音和图像识别、阅读理解和语言理解方面超过了人类的基准水平。其中OpenAI的GPT-3模型的表现尤为突出:不仅性能相较上一代的GPT-2有了巨大的飞跃,从他们发布的示例也能看到,不管是生成编程代码还是写冷笑话,其表现都让人吃惊。

尽管所有的基础研究都取得了进展,但这些模型在应用方面却都没有铺得太开。它们庞大且难以运行(需要GPU编排)、缺乏广泛应用(没有公开可用的版本,或仅有封闭测试版),而且作为云服务的使用成本极高。尽管如此,最早期的生成式AI已经开始进入公众视野。

第三波发展浪潮:更好、更快、更便宜阶段(2022年之后)

首先是计算成本开始下降。新的技术,如扩散模型,缩减了训练和运行推理所需的成本。与此同时,研究学界也在持续开发更好的算法与规模更大的模型。而开发者的权限也有了变化,从封闭测试版扩大到开放测试版,甚至有些模型还开放了源代码供开发人员调用。

对于那些一直渴望使用大型语言模型(LLM)的开发人员来说,探索和应用开发的大门已经打开,基于这些技术的应用开始大量涌现。

用Midjourney生成的插图。

第四波发展浪潮:杀手级应用涌现阶段(现在)

随着各大平台发展成熟,AI模型继续变得更好、更快、更便宜,越来越多的模型免费、开源,应用层面将出现大爆发。

正如当初移动通信技术在结合了GPS定位、相机及随身连接等新功能与特点后,催生了一系列新型的应用程序,我们预计当下AI模型的发展也将推动新一轮生成式AI应用的爆发。正如十年前移动通信的拐点为少数几个杀手级应用创造了市场机会一样,我们预计杀手级应用也将出现在生成式AI领域中。大家争相发力,前景让人期待。

市场格局

下图为不同细分方向应用的格局分布图,可以看到各个细分方向的应用平台与应用模型。

模型

● 文本领域。文本是发展最完备的领域。然而,想要语言表达自然流畅是个十分高的标准。如今,这些模型在通用的中、短篇写作方面表现还算不错(但即便如此,它们通常也只是被用来生成初稿或对初稿做迭代完善)。随着时间的推移,模型越来越好,我们有望可以看到更高质量及更长篇的内容,并且针对各垂直领域有特定的优化。

● 代码生成。正如GitHub CoPilot所显示出的效果,很快,代码生成就会变得十分普遍,它能极大提高程序开发者的生产力。而对于非专业人员,借由这些工具,编写代码也将不是难事。

● 图像领域。图像领域的应用爆发是新近之事,但也可谓势不可挡:毕竟,在社交媒体上分享生成的图像比文字要有趣得多。而且我们也看到,市面上出现了非常多不同审美风格的图像模型,以及编辑和修改生成图像的不同技术。

● 语音合成。语音合成的应用已经有段时间了(比如苹果设备上的语音助手Siri),但消费与企业级的应用才刚刚起步。对于像电影和播客这样的高端应用来说,要想一次性生成与配音演员或主播录音一样不机械、有自然质感的作品,还有很长的路要走。但就像图像领域一样,现在的模型也将成为将来更优秀模型的发展基础。

● 视频和3D模型领域。这一领域的进步则要缓慢不少,人们期待AI模型在这些创意领域(如电影、游戏、VR、建筑和实体产品设计)的进一步应用潜力。预计在未来1-2年内,我们将能看到一些基础的3D和视频生成模型。

● 其它领域。其它许多领域还处于基础模型的研发阶段,如音频、音乐到生物与化学领域。

下图是这些基本模型的进展与相关应用的发展进程时间表,2025年之后的时间为预估时间。

应用

接下来为你介绍的是一些让我们感觉十分兴奋的应用场景。但实际上,可应用范围将远比本文所描述的多,创始人和开发人员对于各路应用场景的奇思妙想让我们连连赞叹。

● 文案写作。日益增长的个性化网页、电子邮件等网络空间,用以支持销售和营销战略,甚至提供更好的售后服务,都将催生大量的文案写作需求。这些短小精悍、格式相对固定的宣传式话语,再加上相关从业人员工作压力大、预算不高等特点,这一领域将是文案写作型AI实现自动化与写作增强方案的最佳用武之地。

● 特定垂直领域的写作助手。如今大部分写作都是横向的;但我们相信,对于特定的终端市场,从拟定法律合同到剧本创作,都有可能借助生成式AI的力量获得更长足的发展。在这一领域,产品差异化的主要发力点将是对特定工作流程模型和用户体验模式的细节打磨。

● 代码生成。如今在该领域,生成式AI的应用已经带来了质的提升,程序开发人员的生产力和创造力都被极大增强:如今使用GitHub Copilot生成的程序中,有近40%的代码是由AI生成的。但如果打开想象,我们甚至可以设想,将来借助更好的生成式AI,普通消费者(非专业程序开发人员)也将有能力自行创作程序代码。基于提示的学习(Learning to prompt,译注:一种新的AI训练方式)将有可能成为最终的高级编程语言。

● 艺术作品生成。如今,不少大型的AI已经将整个艺术史和流行文化的作品数据编码进了模型当中,任何人都可以随意生成——以前可能需要人花一辈子才能掌握的——想要的艺术风格的作品。

● 游戏。最理想的应用状态是人们可以使用自然语言来创建复杂的场景或可操纵的模型;我们离这样的梦想还有很遥远的距离,但在短期范围内,还是有不少可实现的场景应用,比如生成游戏场景的纹理或Skybox VR场景的图像等。

● 媒体/广告。我们大可畅想自动化广告代理的潜力——它将能针对不同的消费者来优化广告文案与创意。而多模态生成的应用将能更好地针对不同的销售信息生成互补性视觉效果广告。

● 设计。数字和实体产品的原型设计是一个劳动密集且往往需要不断反复修改的过程。现在的生成性AI已经实现了根据粗略的草图与文字描述生成高保真渲染图。随着这一技术往3D模型的方向发展,生成设计过程将打通从文字到具体产品实物的全流程。你的下一款手机应用程序,或将来的某双运动鞋,说不定都将是AI设计生成的。

● 社交媒体与数字社区。会不会有人借助AI生成的方式来自我表达呢?当然,现在像Midjourney这样的新应用便正在创造新的社交体验——消费者可以学着生成独具个性的作品来做公共表达。

用Midjourney生成的插图。

生成式AI应用解剖

生成式AI应用会是什么样子呢?这里有一些预测可供参考。

智能化与模型微调

生成式AI应用的底层技术其实都是GPT-3或Stable Diffusion等大型AI模型。而随着应用程序不断获得更多用户数据,这些数据便可用来对模型做更精细的改进,以实现针对特定问题空间改进模型质量和表现、缩小模型尺寸或降低成本。

我们可以把生成式AI应用程序看作UI层(用户交互界面层)或“小脑”,支撑它运行的底层大型通用AI模型才是“大脑”。

实现形式方面

如今,生成式AI应用在很大程度上是以插件的形式存在于现有软件生态系统中,通过IDE(集成开发环境)运行代码,而通过Figma或Photoshop之类的应用程序来生成图像;我们甚至可以设想,将来Discord机器人也将能通过生成式AI的技术实现更广泛的用途。

此外还有数量较少的独立的生成式AI网络应用,比如用于文案写作的Jasper和Copy.ai,用于视频编辑的Runway,以及用于记笔记的Mem。

插件可能会是个非常有效的切入口,一方面不需要引入新的应用程序,另一方面也以非常聪明的方式避开了“先要有鸡还是先要有蛋”的问题(改善模型需要大量的用户使用数据,但另一方面,要有好的模型才能吸引到足够多的用户使用)。而目前我们已经在消费者/社交领域看到了这种推广策略带来的非常好的效果。

交互模式范例

如今,我们看到的大多数生成式AI的演示都是“一次性作品”:提供一个输入量,机器会生成一个输出,然后你再决定是否保存结果或者弃掉重来。随着越来越多的模型不断迭代而变得更强,将来我们能实现对输出作品的修改、完善、升级或生成不同版本等操作。

现在的生成式AI通常被用来生成产品原型或初稿。生成式AI通常都很擅长生成多个不同版本的作品,人们可以在此基础上进一步创作(如生成多个不同的图标或建筑设计模型);此外,它们也很擅长为初稿提修改建议,从而帮助用户更好地完善作品(如博客文章或代码自动补全)。随着模型变得越来越智能(当然离不开大量的用户使用数据),我们有理由期待它们将来能生成越来越好的初稿,甚至可以直接生成可作为终稿使用的作品来。

持续的细分类目引领者

通过不懈加速“更多用户参与/更多数据—更好的模型”这一发展飞轮,生成式AI公司可以获得持续的竞争优势并最终成长为行业最佳。当然要注意维护这一良性循环:①获得极高的用户参与度→②获得更多用户数据以训练出更好的模型(提示改进、模型微调、将用户行为作为标记的训练数据等)→③优秀的模型吸引更多的用户并提升参与度。此外,这些AI公司还可以往特定的问题空间发展(如代码领域、设计领域或游戏领域等),而不是非要做得大而全。还可以如前所述,通过插件的形式整合进当下目标用户的生产流程中,以此实现用户增长和产品分发,之后再尝试打造AI原生的工作流程来替代现有的应用程序。找到正确的方式来打造这些应用,积累用户与数据,这些都需要时间,但我们相信,好的产品必然持久,也终将发展壮大。

困难与风险

尽管生成式AI具有巨大潜力,但在商业模式和技术方面仍有许多问题需要解决。如版权、信任与安全以及成本等重要问题还远未解决。

打开想象的边界

生成式AI仍然处于非常早期的阶段。平台层面刚刚有些起色,真正的应用程序其实还处于萌芽阶段。

但也要知道,我们并不需要大型语言模型写出一部托尔斯泰小说,才说生成式AI获得了非常好的应用。当下这些模型已经足够好了,足以用来生成博客文章的初稿,或商标与产品界面原型。而在不远的中短期未来,它们也有望创造更大的价值。

生成式AI应用的第一波浪潮有点类似于iPhone刚出现时的移动应用格局,多少偏于噱头,显得单薄,竞争差异化与商业模式也不明确。然而,其中一些应用的确为我们提供了有趣的视角,让我们可以一窥未来的可能。一旦你看到过AI可以生成复杂的代码或精彩的图像,你就很难回到没看过的状态,因为你知道这些技术将来一定会成为我们工作与创造的基础,发挥更重要的作用。

假如尽情畅想几十年后的未来,我们不难想象彼时的生成式AI已经深刻融入我们的工作、创造与游戏中:自动生成的备忘录;3D打印任何你想象出来的东西;文字直接生成皮克斯电影;靠想象来实时生成世界场景的游戏体验等等。这些事情如今看来像是科幻小说一般,但我们还是要对技术进步的速度有信心。要知道,短短几年时间,我们便从狭窄的语言模型发展到了代码自动补全,沿着这样的发展思路,如果大型模型也有所谓“摩尔定律”,那么天马行空般的未来想象也并非没有实现的可 能。

本文来自微信公众号 “红杉汇”(ID:Sequoiacap),作者:Sonya Huang、Pat Grady、GPT-3 ,编译:洪杉,36氪经授权发布。

人工智能 新世界 创造力
+1
4

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
登录后参与讨论
提交评论0/1000
你可能也喜欢这些文章
如何成为硅谷最佳VC?答:办活动
字节跳动实习生投毒自家大模型细节曝光,影响到底有多大?
商汤十周年新战略公布:将无缝集成算力、模型及应用|最前线
和 AI 恋爱,我输给了赛博小三
谷歌人事巨震!Gemini团队并入DeepMind,搜索管理层换血,原主管升级CTO
2024年,每一个大模型都躲不过容嬷嬷和紫薇 | 焦点分析
60亿美元高估值难逃卖身?这78家创企今年或被出售,大模型独角兽在列
大模型顶流CP由甜转虐:互相不满,都找备胎,因为钱闹不愉快
AI搜索,正在成为新战场?

最新文章推荐

启迪环境10月20日缩量下跌1.42%;启迪环境参编国家标准获批发布 敦煌种业10月20日放量上涨0.96% 银轮股份10月20日放量上涨4.01%;银轮股份深耕汽车热管理领域 千金药业10月20日放量上涨0.91%;千金药业9月融资金额创新高 厦门国贸10月20日放量上涨1.15%;2024国际工程供应链发展大会在厦门开幕 格力地产10月20日缩量上涨0.64% 平安银行10月20日放量上涨0.75% 兴业银行10月20日放量上涨0.15%;兴业银行强化养老金融人才培养 中国平安10月20日放量上涨1.96%;中国平安获摩根大通增持股份 中国电信10月20日放量上涨1.87%;中国电信卫星通信公司经营异常
红杉汇
特邀作者

红杉中国,是创业者背后的创业者。在这里,红杉与你同行!

最近内容

奈飞:从DVD租赁到“爆款制造机”,如何实现颠覆式创新?
查理·芒格的成功宝典:反过来想,永远反过来想
掌握人才主动权,打造“继任者计划”

提及的项目

查看项目库

Need

图为技术

下一篇

游戏出海加速度,腾讯、网易“快吃慢咽”

需要警醒的是,出海并不件易事,海外市场所存在的挑战仍有很多。

2022-09-28

热门标签

pp助手 手机助手 无聊经济 铁血联盟 幽浮 魔眼杀机 央行公开市场操作 山姆大叔 核武器 gfk 红外热像仪 黑体 刺猬索尼克 网格化 小型团队 盛虹集团 缪汉根 整体浴室 宜丰 利得 血液制品 环球主题公园 奥兰多环球影城 电致变色 变色眼镜 事故调查报告 隔离墩 酒店预定 绿城百合 夏添
意见反馈
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

玻璃钢生产厂家葫芦岛商场美陈户外园林景观玻璃钢雕塑庆阳玻璃钢景观雕塑制作北京商场美陈生产厂家淮安玻璃钢人物雕塑定制价格么商场中庭美陈找什么公司做福建节庆商场美陈现价郑州玻璃钢动物雕塑价格报价湖北玻璃钢景观雕塑甘肃动物玻璃钢雕塑无锡玻璃钢仿铜雕塑价格福建玻璃钢人物雕塑价格梅花鹿雕塑玻璃钢仿铜西式玻璃钢雕塑厂家价格玻璃钢花盆价目表玻璃钢闻鸡起舞雕塑好的玻璃钢雕塑卡通玻璃钢雕塑在广联达哪里湖北个性化玻璃钢雕塑图片温暖商场美陈湛江农业迎丰收玻璃钢雕塑无机玻璃钢雕塑艺术佛山楼盘玻璃钢人物雕塑温州学校玻璃钢雕塑玻璃钢蜜蜂雕塑图片玻璃钢口红雕塑模型河北玻璃钢雕塑加工厂劣质玻璃钢雕塑五华区玻璃钢雕塑设计玻璃钢海豚顶球雕塑香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化