百度知道2024年10月11日发布:Diffuion的火,只是AIGC的缩影 量子位智库报告(附下载)

⭐发布日期:2024年10月11日 | 来源:百度知道

⭐作者:叶祖新 责任编辑:Admin

⭐阅读量:684 评论:1人

【新澳精选资料免费提供】

【4949澳门彩开奖结果生肖版】

【新澳门内部一码精准公开】 【2024新奥历史开奖记录香港】 【澳门天天彩精准免费资料】 【澳门王中王开奖结果】 【新澳六管家婆资料】 【2024年新澳免费资料】 【新澳资料免费最新开奖记录】 【2024年澳门天天开好彩大全】
【彩霸王高手资料论坛,澳门开奖历史】 【新澳六开彩资料2024】 【三期必开一期免费资料澳门】 【4949澳门免费精准大全】 【新澳今天最新资料晚上出冷汗】 【新澳门2024正版资料免费公开】 【新澳门今晚开奖结果+开奖】 【澳门一肖三码必中特每周闭情】

量子位智库 发自 凹非寺

量子位 | 公众号 QbitAI

AIGC(AI生成内容),这个概念最近可以说是火得一塌糊涂。

例如Stable Diffusion,只要对它说一句话,“唰唰唰”地就能秒生成画作:

Big chunky Venom(巨大敦实的毒液).

知名博主大谷Spitzer还用它“翻拍了”好莱坞国际巨星版的《华强买瓜》:

还有此前谷歌家的Imagen、OpenAI出的DALL·E系列等,也都成了备受网友们热捧的AI内容生成神器。

甚至还有人拿着Midjourney生成的画作参加艺术比赛,碾压人类夺得头筹,惹怒了一众艺术家

但正所谓“能用起来的技术才是好技术”,网友们将诸如此类AIGC技术热度推至的高度是对它实力的认可。

而此前市场还将项目发布仅一个月的Stable Diffusion背后公司估值为69亿元,这是资本对AIGC的肯定。

那么站在现在这个时间节点上,是时候对AIGC从技术发展路线、产业落地方向等多角度做一个梳理。

因此,量子位智库在进行深入调研之后正式发布《AIGC/AI生成内容产业展望报告》,核心回答三大问题:

  • 在技术上,AIGC已经可以完成哪些创作?
  • 在价值上,AIGC除了直接生成艺术作品还能做什么?
  • 在未来,AIGC将如何改变内容及相关产业?

(完整报告获取方式见文末)

AIGC技术及八大场景应用

AIGC全称为AI-Generated Content,指基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。

与之相类似的概念还包括Synthetic media,合成式媒体, 主要指基于AI生成的文字、图像、音频等。

Gartner也提出了相似概念Generative AI,也即生成式AI。生成式AI是指该技术从现有数据中生成相似的原始数据。

相较于量子位智库认为的AIGC,这一概念的范围较狭窄。

我们认为,目前AIGC生成正在完成从简单的降本增效(以生成金融/体育新闻为代表)向创造额外价值(以提供绘画 创作素材为代表)转移,跨模态/多模态内容成为关键的发展节点。

技术视角下,我们认为以下场景将成为未来发展的重点:文本-图像-视频的跨模态生成、2D到3D生成、多模态理解 结合生成。

商业视角下,我们认为未来3年内,虚拟人生成和游戏AI这两种综合性的AIGC场景将趋于商业化成熟。

下图中的绿色部分,是我们认为2-3年内具有快速增长潜力的细分赛道。

文本生成

以结构性新闻撰写、内容续写、诗词创作等细分功能为代表,基于NLP技术的文本生成可以算作是AIGC中发展最早的一部分技术,也已经在新闻报道、对话机器人等应用场景中大范围商业落地。

从现有的落地场景来看,我们将其划分为应用型文本创作型文本生成,前者的进展明显优于后者。此外,从应用推广的角度来说,辅助文本创作是目前落地最为广泛的场景。

应用型文本大多为结构化写作,以客服类的聊天问答、新闻撰写等为核心场景。主要玩家包括Automated Insights(美联社Wordsmith)Narrative Sciencetextengine.ioAX SemanticsYseopArriaretrescoViable澜舟科技等。同时也是小冰公司腾讯百度等综合性覆盖AIGC领域公司的重点布局领域。

创作型文本主要适用于剧情续写、营销文本等细分场景等,具有更高的文本开放度和自由度,需要一定的创意和个性化,对生成能力的技术要求更高。

代表性的国内外公司包括AnywordPhraseePersadoPencilCopy.aiFriday.aiRetrescoWritesonicConversion.ai Snazzy AIRasa.ioLongShot.AI彩云小梦等。

除去端到端进行文本创作外,辅助文本写作其实是目前国内供给及落地最为广泛的场景。基本主要为基于素材爬取的协助作用,例如定向采集信息素材、文本素材预处理、自动聚类去重,并根据创作者的需求提供相关素材。

这部分的国内代表产品包括写作猫Gilso写作机器人Get写作写作狐沃沃AI人工智能写作

图像生成

图像生成的传统思路是生成对抗网络(GAN),由生成器和判别器两部分组成,生成器将抓取数据、产生新的生成数据,并将其混入原始数据中送交判别器区分。

虽然说在现有的GAN在神经网络架构、损失函数设计、模型训练稳定性、模型崩溃问题上取得了相应突破,提升了最终图像的特定细节、内在逻辑、生成速度等。

但要在实际应用中大规模稳定应用,GAN仍需解决以下问题:训练不稳定、生成的样本大量重复、结构及压缩等问题。

2022年,Diffusion Model(扩散模型)成为图像生成领域的重要发现,甚至有超越GAN的势头。

相较于其他的图像生成模型(比如GAN、VAE和基于流的模型),在所需数据更少的背景下,Diffusion Model的图像生成效果有明显提升。

而在3D内容生成上,神经辐射场模型NeRF成为新一代模型。

NeRF通过将场景表示为隐式的神经辐射场,渲染时通过神经网络查询位置上的场景信息生成新视角图像。简单来说,NeRF利用深度学习完成了计算机图形学中的3D渲染任务。

基于对不同技术原理的梳理,我们将图像生成领域的技术场景划分为图像属性编辑、图像局部生成及更改、以及端到端的图像生成。

属性编辑部分,可以直观的将其理解为经AI降低门槛的PhotoShop。现有代表公司包括美图秀秀(美图AI开放平台)Radius5PhotokitImglargerHotpotRemove.bgSkylum(Mask AI)Photodiva

图像部分编辑部分,指部分更改图像部分构成、修改面部特征。典型代表为选入CVPR2022的InsetGAN,该模型由Adobe推出。

图像端到端生成主要指基于草图生成完整图像、有机组合多张图像生成新图像、根据指定属性生成目标图像等。

该部分包含两类场景,分别为创意图像生成与功能性图像生成。前者大多以NPF等形式体现,后者则大多以营销类海报/界面、logo、模特图、用户头像为主。

垂直代表公司/产品包括Deepdream GeneratorRosebud.aiAI Gahakuartbreedernightcafestarryaiwombodeepartobvious阿里鹿班ZMO.aiDatagrid诗云科技道子智能绘画系统等。

音频生成

此类技术可应用于流行歌曲、乐曲、有声书的内容创作,以及视频、游戏、影视等领域的配乐创作,大大降低音乐版权的采购成本。

我们目前最为看好的场景是自动生成实时配乐、语音克隆以及心理安抚等功能性音乐的自动生成。

TTS(Text-to-speech)在AIGC领域下已相当成熟,广泛应用于客服及硬件机器人、有声读物制作、语音播报等任务。

目前技术上的的关键,在于如何通过富文本信息(如文本的深层情感、深层语义了解等)更好的表现其中的抑扬顿挫, 以及基于用户较少的个性化数据得到整体的复制能力(如小样本迁移学习)

垂直代表公司包括倒映有声科大讯飞思必驰(DUI)ReadspeakerDeepZenSonantic

随着内容媒体的变迁,短视频内容配音已成为重要场景。部分软件能够基于文档自动生成解说配音,上线有150+款包括不同方言和音色的AI智能配音主播。代表公司有剪映九锤配音加音XAudioPro等。

在TTS领域,语音克隆值得特别关注。该技术目前被应用于虚拟歌手演唱、自动配音等,在声音IP化的基础上,对于动画、电影、以及虚拟人行业有重要意义。

代表公司包括标贝科技ModulateoverdubreplikaReplica StudiosLovoVoice modResemble AiRespeecherDeepZenSonanticVoiceIDDescript

……

除此之外,因篇幅有限,更多AIGC落地细分场景可在文末获取完整报告进一步了解。

不过总体而言,我们认为,不同赛道下AIGC应用落地推广程度主要受到两方面影响,特定技术的水平状况以及在实际应用中出现的转化门槛。

并且以下技术要素值得关注:长文本生成开放式文本生成NeRF模型Diffusion模型跨模态大型预训练模型(支持的模态数据类型、模态对齐架构设计、支持的下游应用)、小样本学习及自监督算法强化学习环境学习

技术场景方面,我们认为短期内将有较明显爆发的包括闲聊式文本生成个性化营销文本富情感及细节TTS拼凑式视频生成基于文本的AI绘画语音复刻

AIGC价值和产业发展分析

在量子位智库看来,用AI进行内容创作的价值主要 来源于五点。

区别于市场观点,我们认为最后一点,也即与AI系统的个性化、实时化互动最能体现其潜在价值。

尽管目前AIGC尚无法完成精准可控的生成,但我们相信这一赛道未来的技术与市场规模上限。

以下为五点主要价值,重要性逐次递增。

降低内容创作门槛,增加UGC用户群体

AIGC能够代替人工完成声音录制、图像渲染等工作,使更多人员能够参与到高价值的内容创作流程中。预计这一效果在2B结构化内容生成的领域非常明显,个别场景会出现2C服务。跨模态生成成为未来重点。

提升创作及反馈效率,铺垫线上实时互动

目前来看,效率提升主要体现在提升专业人员的生产效率。用户对于能够动态交互的个性化数字内容的需求越来越高,传统的开发方式无法满足日益上升的需求,消费速度远高于制作速度。需要AIGC填补供需间的差距。

但我们认为,更为关键的是,AI同样提升了内容的反馈生成速度,对于实时交互内容有重大意义,具有将线下和真人的快速交互迁移到线上的可能,也即令AI承担真人的社交、创作、协作功能,可能会出现新的潜在场景(如社交类和探索类游戏等)

目前来看,内容消费者变得更容易将现实情感需求投射在虚拟世界中,预计会产生许多深入实时的互动需求,市场规模可观。

基于海量数据得到强创造性和开放性,有助于激发创意认知、提升内容生产多样性

相较于人类艺术家,AI能够接触借鉴更多的数据,在基于prompt进行内容生成后,AI创作的内容会有更多的二次创造空间和自由度。

例如,生成算法能基于特定条件或完全随机的生成现实中不存在的形状、色彩搭配、图案或结构等,赋予内容创作更多可能,产生“超现实感”及“未来感”,推动艺术创新。

对不同模态元素进行二次拆解组合,改变内容生产逻辑及形式

通过语音克隆、编曲风格提取等手段,AIGC能够将原客体所对应的不同模态信息进行拆解,例如演讲者的面部形象、 声音、演讲内容等。

在重新组合之后,能够完成过往受到条件限制无法完成的工作。例如路人的声音+专业的播音逻辑、 更符合特定审美的面部等,打破真人/真实场景在要素组合上具有的局限性。

和其他AI系统或数据库进行联动,有实现高度个性化/高频优化

在与特定的数据库(例如实时更新的客户数据、市场反馈数据、特定主题下的历史统计数据)或AI系统进行联动后(如个性化推荐系统等),AIGC能够在更为精准的未来预测/个性化预测基础上调整其生成内容。

例如,根据用户习惯调整内容营销文本、根据所处渠道风格调整生成内容、参考历史数据优化生成内容等。

产业链分析方面,由于我国的AIGC行业尚未发展成型,我们在此基于自身理解,绘制了产业链分布图。

目前,在上游,我国AIGC产业还有众多欠缺,以数据标注为重点体现。

我们认为,未来业务关联的大公司收购可能会成为主流现象,或应当存在较明显的大厂扩展业务趋势。但大厂的业务扩展动机往往在于通过新卖点快速 获取流量,优化核心业务,并不会过度关注AIGC本身业务价值的充分挖掘。

因此,在明确的新场景出来之前,我们认为这个行业更容易分散在不同的内容消费场景下。

我们所分析的行业门槛及核心竞争力:

  • 无论是内容还是延展领域,在产品上最终需要回到一体化解决方案服务能力
  • 回避大厂商后期的竞争压力
  • 与行业的深度绑定关系
  • 构建业务闭环

最后是我们基于此次调研所得出的六大关键结论:

完整报告可查看微信文章文末获取:

https://mp.weixin.qq.com/s/VQefNw_TX48mjfiR927NkQ

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

【澳门六开彩开奖结果最靠谱的】 【新澳门天天开结果】
【看香港正版精准特马资料】 【澳门王中王100期期准】
【澳门天天六开彩免费年资料】 【澳门一肖一码一必开一肖】
【香港王中王资料大全免费】 【新澳门4949最新开奖记录】
【澳门天天开彩好正版挂牌】 【澳门三肖三码精准100%管家婆】
【新澳最新版资料心水】 【新澳门历史所有记录大全】 【澳门六开彩精准天天彩网】
上一条新闻 下一条新闻

推荐文章

发表评论

卡洛斯·拉萨尔特

5秒前:垂直代表公司包括倒映有声、科大讯飞、思必驰(DUI)、Readspeaker、DeepZen和Sonantic。

IP:87.58.7.*

向波

7秒前:主要玩家包括Automated Insights(美联社Wordsmith)、Narrative Science、textengine.

IP:58.52.1.*

李胜妍

8秒前:基于海量数据得到强创造性和开放性,有助于激发创意认知、提升内容生产多样性相较于人类艺术家,AI能够接触借鉴更多的数据,在基于prompt进行内容生成后,AI创作的内容会有更多的二次创造空间和自由度。

IP:30.95.3.*

百度知道APP介绍

APP图标

2023新澳免费资料大全APP名:百度知道

版本:V6.74.918

更新时间:2024-10-10 15:21

2024澳门天天开好彩资料?这是一个功能强大的二四六香港天天开彩大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:代表公司有剪映、九锤配音、加音、XAudioPro等。

香港二四六开奖资料大全APP介绍

APP图标

新澳门六开彩开奖结果近15期APP名:百度知道

版本:V3.70.311

更新时间:2024-10-10 24:18

无论是2024年新澳门天天彩开彩结果快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

澳门2024正版资料免费看APP介绍

APP图标

澳门彩天天免费资料大APP名:百度知道

版本:V5.21.458

更新时间:2024-10-10 20:14

2024澳彩管家婆资料传真,应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

王中王开奖一肖期期准APP介绍

APP图标

最准一肖一码一一孑中特APP名:百度知道

版本:V4.10.496

更新时间:2024-10-10 17:13

新澳最新最快资料22码这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

新澳门资料大全正版资料2024年免费下载APP介绍

APP图标

新澳门100%中奖资料APP名:百度知道

版本:V5.31.889

更新时间:2024-10-10 20:13

这是一款功能强大的澳门今晚必中一肖一码90—20应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:ai、 Friday.。无论是获取信息还是提升效率,这款APP都是您理想的助手。

2024新澳门天天开好彩大全49APP介绍

APP图标

二四六天天好944cc彩资料全 免费一二四天彩APP名:百度知道

版本:V5.44.165

更新时间:2024-10-10 19:15

这是一款功能强大的澳门最准内部资料应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:在重新组合之后,能够完成过往受到条件限制无法完成的工作。,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

澳门正版内部精选大全APP介绍

APP图标

2024新澳开奖历史记录APP名:百度知道

版本:V3.19.393

更新时间:2024-10-10 16:14

这是一款功能强大的今晚上澳门特马必中一肖应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:Gartner也提出了相似概念Generative AI,也即生成式AI。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

新澳门彩最新开奖记录查询表下载APP介绍

APP图标

新奥全年免费资料APP名:百度知道

版本:V6.48.321

更新时间:2024-10-10 15:16

今天的最新动态包括:io、AX Semantics、Yseop、Arria、retresco、Viable、澜舟科技等。,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

2024新澳门天天六开好彩大全APP介绍

APP图标

管家婆一肖一码100%准确APP名:百度知道

版本:V5.78.690

更新时间:2024-10-10 16:21

这是一款功能强大的2024年澳门天天开好彩最新版应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:相较于量子位智库认为的AIGC,这一概念的范围较狭窄。。

新澳门一码精准必中大公开APP介绍

APP图标

新奥历史开奖记录查询APP名:百度知道

版本:V1.18.221

更新时间:2024-10-10 18:17

这款功能强大的特战荣耀电视剧免费观看应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

澳门王中王100%的资料2024年APP介绍

APP图标

新澳好彩免费资料查询302期APP名:百度知道

版本:V1.32.193

更新时间:2024-10-10 18:14

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

4949澳门资料免费大全APP介绍

APP图标

免费资料-资料大全APP名:百度知道

版本:V4.35.775

更新时间:2024-10-10 13:24

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。