共计 2662 个字符,预计需要花费 7 分钟才能阅读完成。
“什么叫生成式? 比如说,给我画一幅车水马龙的图片。这种东西,过去人们不觉得是人工智能应该做的事,现在可以做了。”5 月 18 日,百度 CEO 李彦宏在天津举办的第七届世界智能大会上演讲时,说了这么一句话。
不了解这个梗的朋友,可能 Get 不到这句话里的笑点,以及背后的更多意思。
在 3 月份,文心一言刚刚发布的时候,有网友发现让文心一言画一张“车水马龙”的图片,它真的会画出来有车、有水,有马、有龙的一张图。
有网友戏称,这是逐字逐句的新艺术流派,也有人以此质疑文心一言的技术实力,甚至说读不懂中文成语的 AI,怕不会是套壳外国模型吧?
3 个月过去,这个 Bug 早已不复存在,而当时的热议似乎也悄无声息。在越来越多的生成式 AI 上线后,大家发现无论中外哪个模型,大多是有长处也有短板,而率先发布的文心一言,反而越用越好,渐渐有了独树一帜的意思。
这时候,李彦宏重新笑提“车水马龙”,似乎也就有了更多含义。首先这不是一种自证和洗白,因为文心一言已经完成了自技术和应用上的自我证明,李彦宏在表达的,更多是一种云淡风轻与坦然、诚恳。
这是百度面对 AI 的技术观,也是中国 AI 面对未来的发展观。
技术的诞生,往往迎着冷眼与嘲笑
事实上,任何一门能够引起关注的技术,在诞生时往往伴随着的都不是欢迎,而是挑刺与嘲讽。这或许是人性使然,因为破坏比肯定更容易,也更能引发关注,又或许是创新必然会突破某些人、某些事的舒适圈,从而也必然会得到负面评价。
早一点的例子,是工业革命的著名笑话:汽车在发明时曾经用来跟马车比赛,结果输了,当时无数马车夫都在嘲笑这种笨重的铁疙瘩,结果后来,就没有后来了。
上世纪中叶,在晶体管刚刚诞生时,全球各界普遍不看好这种脆弱、良品率低的半导体材质,反而认为优雅坚固的电子管才是王道,随后晶体管带来了信息革命与计算时代,电子管被尘封在了历史深处供人凭吊。
说个更近的例子,去年 ChatGPT 刚刚诞生时,就有人嘲笑它会把李煜、纳兰性德都说成明朝人,连林黛玉是《红楼梦》人物都不知道,纯纯一个小傻子。与此同时,比起嘲笑更爱发现的用户,已经找到了使用生成式 AI 的一万种方法。
事实上,挑错永远容易。挂一漏万,任何技术总有短板,其实对于一个人也是一样。HR 面试,需要问这个人才会什么,而不是他不会什么,否则拿着百科全书去找,一个人总有知识盲区。“车水马龙”这样的问题,在文心一言这种涉及庞大数据与知识的模型刚刚发布时,近乎是必然存在的。今天乃至此后很久,文心一言也和其他大模型一样,在很多垂直功能上有不确定性、不合理性。
只有快速发现问题,快速修复问题,才是正确的解题思路,并且这也恰好是大语言模型基于用户反馈快速迭代的价值所在。事实证明,文心一言确实做到了这点。
那么换个角度想想,文心一言是不是能等一切都调教完美再发布呢? 首先完美这件事本身就是相对概念,不可能存在绝对的完美。百度自己发现问题,效率远不及跟全球用户一起找问题。
其次,延迟发布虽然更稳妥,但会平白浪费了产业机遇,浪费了各界可以了解、参与到生成式 AI 的机会窗口。中国 AI 需要争分夺秒,而文心一言顶着压力和被质疑、被嘲笑的可能,抢在 3 月 16 日就完成了发布,这件事本身就有点“孤勇者”的味道。
所以说,新技术诞生近乎是必然迎接质疑、嘲笑的。重要的不是你能说什么证明自己,而是你接下来能够做什么来证明技术。
无法打败你的,总是让你更强大
李彦宏现在可以云淡风轻提到“车水马龙”,就是因为文心一言已经证明了技术实力,并且验证了高效发布、快速迭代这个策略的正确性。
所谓的“车水马龙”,甚至更多问题,并没有成为百度大模型发展道路上的阻碍,反而成为了百度能够快速听到反馈,完成迭代的佐证。
最终结果,已经可以在过去几个月的发展数据中得到证明。
从经营业绩上看,5 月 16 日,百度发布了截至 2023 年第一季度未经审计的财务报告,营收和利润双双超市场预期,其中营收 311 亿元,同比增长 10%,净利润 (non-GAAP)57 亿元,同比大幅增长 48%。分析师认为,百度 Q1 的良好势头,与文心一言获得的积极用户反馈与市场回应紧密相关。百度在大语言模型层面的先声夺人,已经取得了市场的广泛认同。
而从技术数据上看,文心一言不仅在众多核心技术上保持了领先,也为业界带来了最高效的升级、发展方法。通过文心一言与百度自研的产业级深度学习框架飞桨进行联合优化,实现了文心一言发布后平均某周进行 1 此迭代的效率,经过 4 次迭代,实现了一言的推理能力提升近 10 倍。这意味着,文心一言的模型推理成本大幅降低,可为 10 倍数量的用户提供服务。
不难看出,“车水马龙”这类问题,没有成为百度的短板,没有阻碍 AI 发展的脚步。相反,这些“梗”的存在,让文心一言更加强大,让中国 AI 更加强大。
心底无私天地宽
在中国科技圈里,确实总是有一些企业,对自身技术存在过的问题大为忌讳,总是扭扭捏捏,好像被抓到了什么把柄。而这种态度,自然会激发网友的更热烈讨论,最终形成“你不让说,那我偏要说”的恶性循环。
相反,真的像李彦宏这样,主动说破这层小尴尬,用幽默和坦然的方式面对这一切,却会将格局打开,视野放宽。当然,这里需要的自然是企业家的襟怀气度,更重要的则是有技术底气,知道一些问题根本不构成问题。
百度的技术底气,就是百度并不仅仅有几个模型、几个算法。大模型要走向千行百业,万家灯火,光有模型是不够的。模型从哪来? 模型用什么来支持? 还需要算力、框架、生态等多重动力,提供足够的技术动能,来支撑大模型与行业适配,不断完成升级。
这种积累,正是百度在 AI 领域的真正王牌。就像前面提到模型层的文心一言和框架层的飞桨进行联合优化,起到了独特的效果。百度在模型、框架、开发套件、工具等全栈架构上,都有自己的积累,都有领先的核心技术,最终彼此适配,高效协同,才能够一次次带来百度在 AI 领域的“惊喜”。
这些“惊喜”包括首发文心一言,包括高效修复 Bug,包括 1 月 4 次迭代,也包括李彦宏的云淡风轻。
相反,其他没有自研深度学习框架、没有底层技术积累,却依靠风口进入 AI 领域的厂商,要么需要花费巨大资源和经历从头研发,要么基于 TensorFlow 和 PyTorch 等深度学习框架进行再开发,往往容易顾此失彼,最终让自己的底气也有所缺失。
在中国科技的创新路上,似乎始终都在说套壳,永远都要说套壳。其实“套壳与否”这东西怎么证明呢? 只有具备充沛的基础设施与核心技术,渐渐会形成越来越明显的差异化,最终用户会证明一切,最终时间会证明一切。
谈笑于过去,坦然于未来,勇猛于此刻,才能心底无私天地宽。百度如此,中国 AI 亦如是。