智东西三级片电影
智东西4月18日报谈,这一周,2025年大阪·关西世博会(大阪世博会)上,本届世博会面积最大的番邦自建馆之一中国馆无疑成为焦点。
从“嫦娥五号”“嫦娥六号”带回的月壤样本,到”蛟龙”号深潜器的体验舱,一件件代表中国科技实力的”大国重器”精彩亮相。而在AI领域,中国馆也带来了令东谈主目前一亮的互动展项——由科大讯飞调理打造的”AI孙悟空”。
中国第一部彩色动画长片《大闹玉阙》中的”孙悟空”形象,是国东谈主心中当之无愧的动画英杰。这一次,在讯飞星火大模子的科技赋能下,“AI孙悟空”用中日英三国语言及时与不雅众进行对话交流、传播中国文化,化身世博会中国馆的“导览小高手”,图文并茂地先容中国纯正好意思食以及田地深刻的古诗词。
这些皆皆亮相的硬核科技和改进效果,正成为中国科技实力的纯真注脚。
一、“AI孙悟空”化身中国馆宣传大使,三国语言解放切换上个世纪60年代,上海好意思术电影制片厂出品的《大闹玉阙》中,皆天大圣的形象深入东谈主心。为了体现传统文化与AI大模子的结合,科大讯飞将身穿皋比裙、手拿金箍棒的“AI孙悟空”搬到了世博会的中国馆里,此AI大模子展项由上影元调理共创。屏幕上的“AI孙悟空”出场效果惊艳,依托讯飞星火的期间,语言交互、AI作画功能让孙悟空“七十二变”的才能变得切实可感,引得不少不雅众交流互动。
话未几说,先来一览“AI孙悟空”在大阪世博会中国馆上的精彩推崇。
走向海外舞台,“AI孙悟空”的外语才智当然不在话下,面对现场不雅众中、日、英三国语言的发问,“AI孙悟空”自由切换,运动回答现场不雅众的问题。不仅多语言对话功底深厚,中日英三国语言的回答都十足忠于变装特质,即使说日语、英语时也能和动画片中变装格调保捏一致。
自世博会开园以来,前来参不雅的不雅众取之不尽,赓续不断的会场里东谈主声烦躁,然则,即便在这么的嘈杂环境中,”AI孙悟空”依然不错精确捕捉到不雅众的声息,并快速给出准确的回答,可见孙悟空的“听力”功底也曲直归并般。
光会说外语还不及以体现“AI孙悟空”的多材多艺,它还不错“写诗作画”。互助着屏幕进行图文并茂的展示,“AI孙悟空”径直将“大漠孤烟直”这句古诗词的情状“画”了出来。
郜静文称,科大讯飞团队对“AI孙悟空”重心打造的才智集中在数字东谈主和星火大模子的问答才智之上。基于上影元为孙悟空构建的3D模子,科大讯飞进行了普遍的AI化责任,既要让孙悟空动起来,还要结合大模子才智让其回答、动作推崇、与东谈主交互的面目方面更复原孙悟空形象。
科大讯飞为世博会定制的“AI孙悟空”,上知天文、下知地舆、邃晓三国语言,成为世博会上一个相称引东谈主注指标“中国柬帖”。
二、拆解“AI孙悟空”背后的期间密码“AI孙悟空”浩大的才智背后三级片电影,科大讯飞想要传递的恰是中国在AI方面的深刻积淀。当下全球科技圈内,大模子才智赶紧崛起成为新一轮科技竞争与海外发展风物重塑中的关节变量。
惊艳世东谈主的“AI孙悟空”背后,一系列前沿期间的赞助不行或缺。
滥觞是在东谈主声烦躁的场馆内,让“AI孙悟空”听得充足明晰的高噪场景语音识别期间。
语音仍是成为东谈主们在诸多场景的高频交互面目,但实质诈欺中每每会靠近嘈杂环境识别不清、多东谈主语言识别繁杂等诸多问题,也便是语音识别领域的“鸡尾酒会”困难。措置这一困难的关节在于“抗噪”期间的处理,即如安在多东谈主对话的场景中,精确识别出多位主讲东谈主的声息。
而科大讯飞的期间团队早已冲破这一困难。客岁9月,在海外泰斗赛事、语音领域公认“最难语音识别任务”——CHiME-8中,科大讯飞在“会议室场景远场多东谈主语音识别”(NOTSOFAR)任务中取得一谈两个赛谈的第别称,自2020年已团结五届拿下冠军,记号着“鸡尾酒会”困难仍是取得了要紧冲破。据科大讯飞东北亚权术院院长孙庆华先容,科大讯飞团队已毕了在多重干豫噪声场景中,对多通谈语音识别和语言东谈主辨认,多通谈赛谈上语音识别失实率(tcpWER)缩短至10.8%,远远当先第二名的18.7%,且在细分的7个声学场景下的推崇都优于其他团队。
孙庆华还先容到,语音识别准确性进步的门槛集中于数据、模子算法、复杂环境处理三大方面。
具体来看,科大讯飞围绕着输入法、翻译机、智能座舱、臆造东谈主交互等想到场景麇集了普遍真实多语种语音数据;基于上述语音识别领域的数据麇集,结合无监督预测验、多模态交融期间,科大讯飞在客岁1月就率先发布了星火语音大模子;此外,基于“多通谈语音书号时空辨认建模模范”已毕了语言内容和环境噪声的高度解耦,进步了复杂环境中的语音识别性能。
恰是在这三个维度的深耕,使得科大讯飞在语音识别领域一骑绝尘,客岁讯飞星火4.0的发布会上,一段三个东谈主混叠语言的语音识别场景惊艳亮相。
孙庆华显现,当今,科大讯飞的语音识别在三东谈主混叠语言场景也能已毕86%的准确率。况且在噪声比东谈主声大好多的-5dB信噪比高噪场景下,其识别准确率也能达到85%以上,远超OpenAI语音识别模子Whisper-V3。
大阪世博会时候,科大讯飞发布了双屏翻译机2.0新品,措置了高分贝杂音干豫、多语种混谈等痛点,其1米音障强降噪才智,让用户在嘈杂环境下也能进行及时翻译。
其次是多心理超拟东谈主语音合成期间,高度复原孙悟空声线。
中出事实上,这一期间并不奥秘,仍是被用于舆图导航、数字东谈主声息等场景,讯飞星火曾经在客岁4月推出“一句话声息复刻”功能,用户只需要用一句话就不错定制专属的AI助手声息,大幅缩短了语音合成的网罗资本。
孙庆华先容说,“AI孙悟空”通过语音大模辅音色解耦期间,戒指合谚语音的音色,无缺复刻了86年版《西纪行》前5集中孙悟空的配音演员李世宏憨厚的声息,并让孙悟空“学会了”把日语和英语也用相同的音色说出来。如斯一来,已毕了孙悟空的声息穿越时空,在今天的世博会上与不雅众对话。
同期,为了让“AI孙悟空”的对话内容更相宜西纪行中孙悟空的形象,研发东谈主员在星火多语种大模子基础上,增强了多轮对话、变装上演才智,从脾气、东谈主格、语言特质、理论禅、语言场景等维度执行解耦,用日语再现了中国东谈主众所周知的阿谁孙悟空的形象。
第三是“AI孙悟空”的多模态交互才智。
大模子的才智仍是从单一模态向多模态交融演进,具备图片、视频、音频等生成才智的大模子成千上万。客岁4月,讯飞首发长文本、长图文、长语音“三合一”的星火多模态交互大模子,径直跨模态已毕翰墨、图像、语音交互。
通过深度交融多模态交互才智与超拟东谈主数字东谈主期间,“AI孙悟空”能依据和旅客语音对话的内容,生成丰富的动作和脸色,让每一个动作、每一个神气都与语言抒发无缺契合;同期,依托讯飞星火大模子的视觉处理图像相识与创作才智,粗略基于语义需求生成高质地视觉内容,从而打造出这个能“写诗作画”的AI孙悟空。
临了,对各式问题都能唐突自由的“AI孙悟空”,离不开科大讯飞“奇念念妙问”这款居品多年的期间麇集。辞世博会上,“AI孙悟空”鼓诗书,粗略间隙唐突不雅众对于中国传统文化、东谈主文风情的千般问题,这一丰富的常识储备,以及让AI大模子达到类科学家的解放对话、问题准确相识、海量科普常识、逻辑推理才智,亦然科大讯飞在解说场景持续麇集的效果。
科大讯飞科学解说居品线总司理刘君谈谈,奇念念妙问居品的研发初志是,在入校调研中发现的一个矛盾:学生的奇念念妙想是无尽的,但憨厚的常识储备存在鸿沟。当孩子提议跨学科甚而“天马行空”的问题时,或然被憨厚拖拉、淡薄甚而责备。因此,科大讯飞决心用期间“接住”每一个问题,作念一个“随时兴奋孩子‘十万个为什么’”的居品。她补充说,依托讯飞星火大模子及数字东谈主期间,科大讯飞为学生构建爱因斯坦(科学)、李白(东谈主文)等10位中外科学大师与文假名东谈主的AI臆造形象。通过深度语义相识与多模态对话才智,及时解答孩子的问题并通过启发式问答疏导逻辑推理。收尾2025年4月,“奇念念妙问”已累计为18万中小学生解答超362万个问题,98.7%的孩子取得了舒坦谜底。
这4项关节的期间密码,以及多年的数据麇集、践诺告诫千里淀,组成了大阪世博会上纯真实“AI孙悟空”,凭借过硬的实力在这一届世博会上火出了圈。
三、基于世界产化算力底座测验,科大讯飞展现中国科技实力这次,“AI孙悟空”手脚世博会中国馆唯独大模子展项,不仅折射出科大讯飞在AI领域的长足麇集,更是体现了中国科技发展的底气。
2022年底大模子风起,科大讯飞赶紧布局,并率先对准了“世界产”布局。客岁10月,讯飞星火4.0 Turbo发布,彼时已毕了七大中枢才智全面跳跃GPT-4 Turbo,数学和代码才智杰出GPT-4o;本年1月,发布业界首个基于世界产算力平台测验的深度推理大模子讯飞星火X1。
不错看到,讯飞星火大模子正一步步从追逐海外先进模子到对标甚而赶超。
此外,AI行业的发展一霎万变,但其中的一大隐忧是算力生态的布局。因此率先细察到这一产业趋势的同期,科大讯飞将测验基座模子和构开国产算力生态同步鞭策。
2023年7月,讯飞星火大模子与华为昇腾自主改进算力平台结合拉开了构建世界产算力平台的序幕,3个月后,其联手打造的首个赞助万亿参数大模子测验的万卡国产算力平台“飞星一号”启用。24年10月,科大讯飞、华为、合肥市大数据金钱运营有限公司三方调理打造的国产超大领域智算平台“飞星二号”负责运行。
这也使得讯飞星火大模子成为国内唯独全栈国产算力测验、推理双已毕的大模子。
在AI发展日益利害确当下,科大讯飞此前的期间布局与麇集,正在已毕交叉交融,其语音期间和大模子的结合进一步扩宽了业务场景,并平缓升沉到真实场景的软硬件业务落地之上,在解说、办公、医疗等诸多场景落地。以数字东谈主为例,科大讯飞持续探索AI与数字东谈主形象相结合,将场景从传统的电话客服、企业营销等领域,渐渐扩张到面向寰球的文化传播赛谈,粗略让AI大模子期间在丰富的责任、生计场景中落地,亦然这次科大讯飞粗略赋能“AI孙悟空”,成为本届世博会上唯独大模子展项的关节。
同期,这亦然动须相应的科大讯飞在当下交出的一张满分答卷。
结语:科大讯飞亮剑全球AI竞技场在大阪世博会上,”AI孙悟空”的身影,亦然中国东谈主工智能发展的一个纯真缩影。它向世界评释,基于世界产化算力底座测验的国产大模子,相同能冲破期间鸿沟,展现出令东谈主惊奇的交互才智和文化创造力。
这不仅记号着中国AI产业已构建起从芯片、框架到诈欺的完整生态链,更标记着在全球东谈主工智能竞赛中,中国正以自主改进的姿态,成长为与全球顶尖水平并驾皆驱的”第二极”。AI的发展,不仅赋予了一个传统动画变装的重生,更是代表了一个科技大国在智能波涛中的崛起宣言。
4月21日三级片电影,讯飞星火深度推理模子X1将再次升级,讯飞星火将在世界产算力平台上捏续测验,以对标世界当先的期间水平。