共计 2519 个字符,预计需要花费 7 分钟才能阅读完成。
ChatGPT 正在以颠覆性的使用体验,从科技领域破圈,重建了全球用户对人工智能的认知。
作为一款生成式人工智能模型,ChatGPT 兼具理解力、创造力和记忆力,主要功能是与用户进行自然语言的交互,即与用户对话。
上周 《聊聊你知道和不知道的 ChatGPT》 中,我们详细介绍了 ChatGPT 是什么,商业模式及国内相关公司发展现状。ChatGPT 能理解并生成文字,属于 AIGC(AI-Generated Content,人工智能生产内容)技术应用中的文本生成模态应用模型。
本文,报告酱就来聊聊 ChatGPT 背后的概念 AIGC,看它的上下游,算力、算法和下游应用和发展前景。
对此,报告酱梳理了多篇报告,精选其中 10 篇文末查看,本文将与大家一起分享上述问题。(公众号私信回复【AIGC】免费领取相关报告合集)
AIGC 是什么,与 ChatGPT 的关系?
AIGC 的全称是 AI-Generated Content,人工智能生产内容。
也就是 利用人工智能技术自动生成内容,包括文字、图片、音频、视频、代码等。AI 绘画、AI 写作、AI 对话、AI 播客、AI 搜索引擎等都属于 AIGC 的分支。
在 AIGC 技术应用的模态中,有一种模态是文本生成,而 ChatGPT 就是文本生成的代表产品之一。
过去传统人工智能偏向分析能力,而现在人工智能正在生成新内容,通过大量的训练数据和生成算法模型,自动生成文本、视频等各种形式的内容。
AIGC 代表 AI 技术发展的新趋势,也会带来内容创作的新变革。例如,智能数字内容孪生能力、智能数字内容编辑能力、智能数字内容创作能力。
AIGC 的核心命门
从 ChatGPT 的模型演变看,它经历了 3 次——收集反馈数据→训练奖励模型→PPO(一种算法)强化学习,综合看,成功的关键原因有四点:
-
强大的基座模型能力(Instruct GPT);
-
大参数语言模型(GPT 3);
-
高质量的真实数据(精标的多轮对话数据和比较排序数据);
-
性能稳定的强化学习算法(PPO 算法)。
可以发现,ChatGPT 依赖于 GPT 大模型,而 GPT 大模型则需要依靠微软 Azure 超算中心提供算力训练。同样的,我们也可以认为 ChatGPT 等AIGC 产业依然离不开算力、算法模型、应用的基本框架。
AIGC 模型有大量参数及数据参与训练,因此 对算力基础设施有较高要求,这使得头部大厂的规模优势更加突出。例如 ChatGPT 选择微软 Azure 云服务,Stability AI 选择了亚马逊 AWS 云服务。当下国内主要算力提供商包括阿里、腾讯、百度、商汤。
模型的构成除了以上,还需要 强大的 AI 团队和资金支持。AI 团队,不仅是构建模型,还需要能够根据行业趋势对模型做持续优化和架构升级;大模型的算力要求高,模型训练超过千万美金需求量。
据 Open AI 测算,自 2012 年起,全球头部 AI 模型训练算力需求每 3 - 4 个月翻一番,每年头部训练模型所需算力增长幅度高达 10 倍,而 ChatGPT 训练阶段总算力消耗约为 3640PF-days(即 1 PetaFLOP/s 效率跑 3640 天)。据测算,GPT- 3 训练成本预计在 500 万美元 / 次。
华西证券判断 AIGC 领域头部企业将逐渐构建自身壁垒,剩下的初创公司将依附于头部企业去做应用,例如游戏公司可以利用大模型去生成 NPC 里面自然式对话。
从而,也可以看出 AIGC 产业链将会分为技术提供方和应用开发者两种。
AIGC 多场景快速落地
目前 AIGC 很典型的应用是:利用自然语言描述作为输入,生成各种模态的数据。包括:文本、代码、图像、语音、视频、3D 模型、场景、音乐等。
文本生成方面,AIGC 目前可以较好地完成新闻播报等结构化写作、推荐相关内容、帮助润色等非结构化内容,同时 在虚拟男 / 女友、心理咨询等闲聊机器人中应用较为广泛。剧情续写、营销文本、文本交互游戏等应用还没实现规模化应用,期待未来某一天,AIGC 的终稿能媲美甚至超越人类。
图像生成方面,随着算法模型的不断迭代,AI 作画水平不断提高。在图像编辑工具上,去除水印、提高分辨率、特点滤镜等已较广泛应用。根据要求生成画作、海报、模特图等功能性图像生成发展也接近成熟。但与专职艺术家、设计师和摄影师的产品设计作品存在一定差距。
音频生成的发展较为成熟,消费与企业级的应用正在铺开。当前,AIGC 在语音克隆、生成虚拟人的特定歌声 / 播报等的文本生成特定语言、包含作曲与编曲的乐曲 / 歌曲生成上得到广泛应用,代表企业和应用的有倒映有声、Deepmusic、网易 - 有灵智能创作平台等。AI 降噪去除压缩和采样中的噪音仍需改善,AI 作曲不再机械化与人类创作音乐水平相仿,在未来值得期待。
视频生成方面,AIGC 对于删除特定主体、生成特效、跟踪剪辑等的视频属性编辑已较广泛应用,视频换脸等的视频部分剪辑预计不久将规模化应用。当前,全自动生成长视频作品还不能实现,距离依个人梦想定制电影和剧集还较为遥远。
其他应用领域还有游戏、代码、3D 等。代码补全生成已较为成熟,大量应用早已落地;游戏中游戏操作策略生成和 NPC 逻辑及剧情生成尚需进一步完善;3D 生成尚处于早期阶段,还没实现规模化应用。相关领域的更加智能将成为未来增长方向。
由这些基本模式的生成任务,可以衍生出各种各样的应用场景。随着 AIGC 技术的发展和人们想象力边界的扩展,这些场景还将继续增加。
AIGC 使得 C 端以较低的门槛使用,但 B 端仍然是 AIGC 目前主要商业模式。 C 端的付费逻辑在于高效获取信息,替代表达以及扩大用户创造力;B 端主要原因是它能为企业节省大量成本,使企业可以节省大量人力成本。
近期微软、谷歌等全球软件互联网大厂大力投入 AIGC,并开始探索应用层面的突破,AIGC 已经来到 2 年前自动驾驶的应用突破拐点,2023 年有望成为 AIGC 大年。
传统商业时代,驱动力是产品本身,互联网商业时代,驱动力是用户流量,数字商业时代,消费升级(场景要素、体验要素、服务要素)和数字技术同步驱动,以互联网、物联网、大数据和人工智能等数字技术为核心,加速商品、营销、服务、供应链数字化改造,以更高的效率、更好的体验为用户提供商品和服务。
AIGC 作为 AI 数字商业的探路者,有望开启下一场数字商业模式的新篇章!
# 你用过哪些 AIGC 产品,感觉如何?