共计 4033 个字符,预计需要花费 11 分钟才能阅读完成。
如今打开互联网一看,会看到铺天盖地的 “GPT-4 好厉害 “” 太牛了 “” 科技革命到来了 “” 人类都要失业了 ” ……
但这么伟大的变革到底是怎么到来呢? 答案好像比较含糊。只有 ChatGPT 基础的问答、代写能力,以及微软已经开始做的搜索、办公是目前比较清楚的大语言模型落地方案。如果仅仅有这些东西,似乎也还达不到科技革命的效果。
为什么会这样?
答案在于,任何技术想要最终发挥效应,都要经历一个 ” 技术 – 产品 – 经济效益 ” 的三阶段发展。这其中,产品化是承上启下不可或缺的一步,很多优秀的技术就是因为无法产品化,最终只能停留在特殊或小众领域,也有很多变革并不需要明确的技术指向,仅仅是因为产品出色,就可以引发变革。就像 iPhone 集成了很多新技术,但本身是产品创新。
在如今这个节骨眼上,每个人都能感觉到 GPT 蕴藏的变革能量。但我们对他如何产品化还知之甚少,能看见的应用方案,主要还是以 API 的形式完成,更多属于极客和开发者。
那么,这轮 AI 热潮下,到底有可能产生哪些 ” 杀手级 ” 产品呢? 我们以 GPT-4 的一些关键特性作为线索,来和大家分享几个大语言模型的产品可能性。
先别提颠覆世界,那太虚,也别仅仅盯着已有的技术能力,那又太实。只有中程的产品化阶段,才是绝大多数人在这轮 AI 爆发中的机会所在。
信息时代 3.0. 主线是 ” 命令 ”
信息时代有两条颠扑不破的主线:信息获取与个人娱乐。搜索、信息流、门户网站、直播、短视频等,这些互联网产品样态都离不开信息获取效率的升级,以及个人娱乐体验的加强。GPT-4 代表的大语言模型,可以在短时间内生成大量内容,甚至生成 PPT、网站、视频,这些传统意义上 AIGC 难以做到的内容。
这个能力推演下去,最大的产品价值在于,大语言模型带来人与信息交互方式的彻底改变。
英伟达 GTC 2023 大会上,黄仁勋说:” 生成式 AI 就是一种新型的计算机,我们可以用人类语言进行编程,任何人都可以命令计算机来解决问题。”
” 命令 ” 这个词非常关键。当 GPT-4 以及未来更多大语言模型成为产品基底,用户与信息产品、娱乐产品之间的互动方式,最大可能性就是命令。
在信息 1.0 时代,你的需求可以被查询到,这是搜索机制,代表产品就是搜索引擎。
信息 2.0 时代,你的需求可以被迎合,这是推荐机制,代表产品是信息流和短视频。
当 AI 能力进一步提升,你的需求可以被短时间内订制且满足,GPT-4 乃至 5、6、7 带来的新机制,就是命令机制。
在这个阶段,信息不是已经成型,然后根据用户需求进行查找,而是信息本身不存在,当用户发出指令后再进行 AIGC。比如说,我在搜索引擎时代,想要写一篇关于芯片的文章,就需要依靠关键词、关键信息去搜索、查询各种数据报告,需要用户有耐心和信息查找能力。而在信息流时代,AI 推荐机制会根据我查找、浏览了芯片相关信息,自动推送相关内容,这些内容有的有益,有的没用,需要用户来辨别。
当 ” 命令 ” 成为主要的信息交互方式,我可以直接命令 AI 找到近期关于芯片的所有数据,并生成一份专属报告给我。如果不满意,我还可以命令它修改。
如果说,这种命令式信息收集,改变的生产、学习效率,以及信息获取方式。那么类似技术驱动的 AI 生成视频则可以极大改变娱乐模式。今天我们会觉得很多短视频的模式化、快餐化,简直像 AI 做的,未来这个担心或许就没有了,因为视频就是 AI 做的。
电影解说、明星八卦、劲歌热舞,AIGC 未来将会随时订制大量视频内容,里面的电影信息是 GPT 抓取的,明星八卦是 AI 搜罗的,跳舞的男孩女孩形象都是 AI 生成的,不用再去寻找内容,不用再让 AI 推荐,也不需要大量短视频创作者、UP 主费时费力制作剪辑,只需要一个命令,轻轻松松几个小时的娱乐时间就打发掉了。
如果说,信息时代 1.0 是人找信息,2.0 是信息找人,那么 AIGC 带来的信息 3.0 时代,就是谁也不用找谁,AI 自己可以生成。
这个产品化机会的核心是继搜索引擎、信息流之后,打造 ” 命令引擎 ” 这种新的产品形态。我猜 ” 阿拉丁神灯 ” 应该是个好名字。
游戏 NPC 正盯着你
GPT-4 发布的那个晚上,我看到群里很多开发者都在讨论,而第一条蹦出来关于 GPT-4 应用的消息,是有人说可以把他放在游戏里当 NPC。
让 NPC 使用大语言模型作为底座,来跟玩家进行内容丰富、高自由度的多轮对话,应该是一件很容易想到的事情,但这位朋友说的却不是这个意思。
GPT-4 的一个关键创新特性,是让 AI 来识别图片,并且理解图片中的细节、内涵等,比如可以理解一张搞笑梗图中的幽默点到底在哪。
这种能力如果用到游戏里,将赋予游戏和游戏 NPC 一个前所未有的能力:看见玩家。
从电子游戏诞生之日起,玩家要做的就是去看到、听到一个虚拟世界,并沉浸其中。这个过程中,玩家要尽可能脱离自己周遭的现实,游戏感始终是单向的。虽然 AR 游戏、体感游戏的出现,一定程度上改变了这种情况,让玩家的体态、运动、力量以及游玩环境进入到游戏当中,但游戏本身对玩家是缺乏理解的。
如果让 GPT-4 成为游戏 NPC,或者作为游戏本身机制的一部分,那或许我们距离游戏能够理解玩家,并做出对应反应已经不远了。你在观察游戏 NPC 的时候,他们可能也在观察着你,尝试理解你的表情、你的体态,解读你在游戏中的困惑、激动,或者卡关之后想摔手柄的暴怒。
如果这种机制被放置在一些游戏大师手中,最终作品一定是震撼人心的。事实上,AI 生成关卡、环境,完成自动渲染等技术,已经极大改变了游戏开发,而 GPT-4 与游戏的深度融合,未来也是极大概率事件。
这种融合在两个领域最有可能性,一个是强调互动的 AR、VR 游戏,另一个是注重 NPC 自由互动的开放世界与多结局角色扮演游戏。
除了游戏之外,” 看懂 ” 这个能力还可以被用到数字人,甚至机器人身上。也可以带来相当有分量的产品机会。
” 一嘴通办 ”
说了 toC 的,让我们再聊聊 toB。今天很多人都知道一个词,叫做 ” 一网通办 “。就是说在政务系统中打通各个部门的信息系统界限,从而避免办事人要在不同部门之间来回奔波,产生办不完的手续、盖不完的章、跑不完的路。
在全球很多地方,一网通办都是城市服务、政务、金融、财税等领域的数字化核心发展方向,在中国的东部沿海地区和一线城市,” 一网通办 ” 也正在高速发展。
但是 ” 一网通办 ” 这种模式,其实依旧有痛点存在:
一是 ” 通办 ” 仅仅是数据打通了,但办理逻辑和办理方式依旧与之前无异,用户该不会的还是不会,该卡住的还是卡住,可能需要花费大量时间在反复询问、填写材料、咨询上。
另一个是 ” 一网通办 ” 的效率高度依赖操作人员能力。由于操作人员精力和专业能力有限,必然不了解各个业务领域,因此一旦出现复杂的情况,就会出现操作员虽然能处理,但不知道如何处理的问题,需要层层请示领导或者跨部门沟通,这样反而降低了效率。
大语言模型与这些领域的融合,必然能够解决一些问题。办事人可以直接咨询 AI,了解复杂的部门、业务之间的内在逻辑、办事方法,从而尽量一次性完成办事需求; 而操作人员也可以依靠 AI 来获取跨部门的操作方法、操作样例,从而能够完成较复杂情况的高效率处理。最关键的是,类似能力可以更多用 AI 替代人工。
这种依靠大语言模型知识抓取、逻辑分析能力的服务平台,可以把 ” 一网通办 ” 升级成 ” 一嘴通办 “,办事人说清楚诉求就全面搞定。当然这个名字纯属开玩笑,但城市服务的核心,一定要从 ” 网 ” 转变为 ” 人 “,这一点是毫无疑问的,也是大模型时代的 toB 产品核心机遇。
类似的能力,最具有落地需求的就是政务与金融方面,这两个领域涉及事项多、专业性强,并且与民众需求紧密相连,从更远一点考虑,可能也包括财税、法律、医疗。GPT 代表的大语言模型,可以打破公众服务的边界,让 AI 连接起专业知识与用户需求。
集成了咨询、数据汇总、事项办理、文书认证等功能的新型 AI 服务平台,将是接下来 toB 市场 AI 技术的核心机遇。
超级无代码开发
移动互联网创业热潮的时候,经常有人开玩笑说,” 我创意、机会、方法论都有了,距离拿到融资就差一个程序员 “。
这当然是一个笑谈,但笑着笑着我们可能会发现,连那个程序员都不差了。
ChatGPT 让人惊艳的一点,就在于代码的自动生成和修改。其实很多程序员朋友都说,类似 AI 模型的能力还主要是辅助工作,根本代替不了一个懂业务、懂产品逻辑与实现方式的程序员。
但复杂的开发可能做不了,简单的难道不行吗?GPT-4 发布时演示的创新点之一,就是让模型根据需求自动生成一个网站,虽然生成结果比较粗糙,但已经实现了基本的开发需求。
在云计算与软件业,低代码开发,甚至无代码开发是近两年流行的热门概念。核心逻辑是利用代码库,将已有开发样例进行快速复写,但 GPT-4 的逻辑显然更加先进,他甚至不需要用户懂架构,而是直接根据需求生成开发程序。
这种能力,在短时间内生成复杂的软件应用或许不行,但对于很多没有编程与开发能力的人来说,通过 AI 来获取一个小程序、一个电商平台、一个简单的 APP 还是非常有意义的。
用一些模板搭配 GPT-4. 可以形成 ” 超级无代码 ” 的产品形式。用户只需要下达需求并支付费用,就可以获得属于自己的软件应用,整个开发过程中的人工成本趋近于 0.
为人提供这种 AI 主导,模板 + 微调的软件开发,或许也将变成一个全新风口。其实想想,现在随手就能拉个群聊,这在早期的互联网聊天室时代简直难以想象,那么未来人手几个 APP,一堆网站,一群数字人,可能也不是什么难事。
从预训练大模型崛起,再到今天的 ChatGPT、GPT-4. 最值得关注的是智能涌现效应驱动下,一些作为信息化常识的东西被改变了。换句话说,GPT-4 是条件,而不是结果。
只有运用好这些新条件,得出新方法,创造新产品的人才能获得 AI 时代最好的结果。
有人会担心,这么大的变化之下,我的工作、生活会不会被颠覆?
其实吧,这种焦虑什么时候都有,但从没有真正变成灾难。
1999 年,朴树有首歌叫做《New Day》,里面有句歌词是这么写的,” 快来吧奔腾电脑,就让它们代替我来思考 “。
20 多年过去了,人类还在思考,奔腾电脑在哪里?