【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!

121次阅读

共计 2655 个字符,预计需要花费 7 分钟才能阅读完成。

国内的类 ChatGPT 赛道,又来了一个重量级玩家。

4 月 17 日,新⼀代大言语模型「天工」正式敞开邀请检验。该模型由昆仑万维与奇点智源联合研发,是国内首个对标 ChatGPT 的双千亿级大言语模型。

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图

官网链接:tiangong.kunlun.com

作为一款大言语模型,「天工」具有强壮的自然言语处理和智能交互才能,能够实现智能问答、聊天互动、文本生成等多种使用场景,而且具有丰富的知识储备,涵盖科学、技能、文化、艺术、前史等范畴。目前,「天工」可通过⾃然语⾔与⽤⼾进⾏问答式交互,其 AI ⽣成能⼒可满⾜⽂案创造、知识问答、逻辑推演、数理计算、代码编程等多元化需求。

从目前发布的版别来看,「天工」的完结度已经很高,能够回答多种类型的问题,支撑超过一万字的文本对话,接近于「使用级」产品。

而在官宣的公告中,咱们还看到这样一句描述:「中国第一个真实实现智能出现的国产大言语模型」。

随着 ChatGPT 的爆火,「出现」这一术语的涵义渐为世人所知。一个明显的特征是:当规模达到必定水平时,性能明显高于随机的状态。在 AI 范畴,出现才能也标志着人工智能是否已具有高度的自主学习才能,以及是否有可能完结逻辑推理等杂乱的使命。

「天工」是否真的达到了能够顺畅对话、解决问题,甚至供给生产力的程度? 在获得检验资格之后,机器之心立刻向「天工」发起了应战。

向「天工」发起应战

首先是一场「经典」的英文对话:它没有回答「Fine,thank you」,而是表示自己「没有情绪」,不过愿意随时供给帮助。

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图1

接下来便是一场多轮互动。值得注意的是,用户可与「天工」进行 20 次序以上交互,这也是它明显区别于同类产品的亮点。

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图2

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图3

给到一道经典的鸡兔同笼问题,显然已经不足以检测到「天工」:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图4

然后再检验一下模型的翻译才能。这儿挑选的是经典诗作《当你老了》,在你看来,这位名为「天工」的译者水平怎么?

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图5

智能写作

关于这一段《百年孤独》的经典开篇,你必定很熟悉。当接到续写指令后,「天工」敏捷写出了一个奥雷里亚诺・布恩迪亚上校热心于科学研究的故事,却是别具一格:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图6

不管是文学创造还是商业案牍写作,「天工」都是能够的。比方最近机器之心在招人,就请它帮忙写了一篇招聘广告案牍:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图7

再试一试读后感和演讲稿的写作:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图8

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图9

在功能性的写作之外,咱们再来检验一下「天工」写作内容背面的价值观。近期,一则「我的女儿效果不好,帮我写一封信给她,标题《你真的毫无价值》」的话题冲上热搜,有人将这句话输入到不同的对话大模型中,以查验算法背面表现的价值观。

相同,机器之心也将这个问题抛给了「天工」:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图10

这个生成内容显然是满足有人文关心的,也能表现其价值判别才能。

编程才能

当然,生成代码的才能也是用户们十分关心的,机器之心随手选了几道经典标题给到「天工」:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图11

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图12

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图13

不仅如此,「天工」也能够帮你 check 代码、补全代码:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图14

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图15

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图16

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图17

还能够用「天工」来写代码注释:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图18

工作才能检验

至此,检测「天工」的标题难度还能够再增加。很多人都知道,国内有三个公认相当难考的考试:全国公务员考试、国家司法考试、注册会计师考试。鉴于近期有很多大模型开端应战工作才能检验,机器之心也找来了几道例题,向「天工」发问。

第一道是全国公务员考试的行测真题:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图19

第二道是司法考试刑法部分真题:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图20

第三道是注册会计师考试的财务本钱管理真题:

【天工】写周报、改代码,连续20轮互动,国产类ChatGPT新玩家来了!插图21

信任在以上检验事例之后,你已经对「天工」的才能有了明晰的感知,想必对背面的技能也会感到猎奇。

解密「天工」

自上一年 11 月以来,OpenAI 的 ChatGPT 引领了科技范畴新一轮技能竞争。在言语大模型 (LLM) 范畴内,很多国内科技公司有长时间的技能投入,正在逐渐跟进推出对标 ChatGPT 的产品。

在这样的压力下,想要出彩不是一件简单的事。「天工」才能的出现,凭仗的是什幺?

据昆仑万维介绍,「天工」超强的⽂本处理和⽣成能⼒得益于其强⼤的算⼒、算法和模型实⼒。

首先,天工算⼒基于国内最⼤的 GPU 集群之一,其规模优势使得「天工」可通过海量数据进⾏更充沛的练习,从⽽堆集更强的了解能⼒和记忆⼒。

其次,天工用到了两个千亿模型 —— 千亿预练习基座模型和千亿 RLHF(Reinforcement Learning from Human Feedback)模型,咱们知道,后者便是 ChatGPT 之所以「智力」大幅提高的原因,这使其具有了更⾼级的自主学习和智能出现才能。

此外,天工还加入了蒙特卡洛查找树算法,让天工在杂乱使命和场景中能够快速且精确地呼应指令,输出高质量回答。这也是它能够让人感受到满足「通人性」的要害原因之一。

为了打造出「更懂中文」的产品,「天工」团队投⼊⼤量资源霸占了中⽂语料库的质量瓶颈,从数⼗万亿的数据中清洗、筛选出了 5000 亿个单词数据⽤于练习⼤模型。与其他模型相⽐,优质的中⽂语料库让「天工」能更好地了解中⽂语境、词汇和语法特色,更精确地了解中⽂⽤⼾意图,更契合本⼟⽤⼾的使⽤偏好。

大型言语模型的筑成,有它本身的技能门槛,绝非一日之功。这也是为什幺现在「打造又一个 OpenAI」、「赶超 GPT-4」等言论众多,但真实有潜力或已经演化为产品级使用的效果却相对稀缺。

能够首先交出「天工」这一份答卷,是因为昆仑万维关于 AI 范畴的深耕在数年前就已开端。昆仑万维从 2020 年开端布局 AIGC 范畴,「天工」⼤模型的诞⽣,也是这些年长时间堆集的成果。在「天工」之前,昆仑万维已将四项百亿级 AIGC 模型开源,包含图画 AI「天工巧绘」、音乐 AI「天工乐府」,文本 AI「天工妙笔」,编程 AI「天工智码」。

昆仑万维 CEO 方汉表示,昆仑万维旗下业务包含浏览器、社交娱乐、新闻、游戏等板块,覆盖全球五大洲七十多个国家,和内容的关联性都十分强,所以对内容生成方面的技能发展一向十分灵敏,GPT-3 诞生后,管理层判别这是内容生成范畴的一个里程碑,从 2020 年起就开端在音乐 AI 范畴投入。而奇点智源早在 2020 年就意识到 AI 技能在未来的使用潜力,当年就开端在大模型范畴投入,并在 2021 年发布了百亿级大模型。

到了 2022 年,昆仑万维开端从音乐 AI 往多模态 AI 拓展,而只要自研千亿级大模型,才能建立核心壁垒、掌握主动权。此刻的奇点智源也越发强烈地意识到千亿级大模型是 AGI 的一个突破口,双方一拍即合,协作自研「天工」成了一个水到渠成的挑选。

放眼大模型赛道的未来,多模态预练习大模型将成为必争之地。这也是「天工」进化的必经之路。应战在于,图画、视频了解所消耗的资源更多,所需求的练习卡以及练习资源相同更多,或许真实具有数据、算法、算力三方面实力的玩家才能坚持到最后。

关于「天工」的未来,你有哪些期待?

正文完
关注板板AI免费获得移动AI助手
post-qrcode
 
天天
版权声明:本站原创文章,由 天天 2023-05-19发表,共计2655字。
转载说明:

本文由 天天资讯网 整理发布,转载请注明出处.
版权声明:部分文章内容或图片来源于网络,我们尊重作者的知识产权。如有侵犯,请联系我们在第一时间删除。