热门事件

科大讯飞刘庆峰:人工智能是赋能数字经济发展的核心引擎 - 电子信息产业网

12月11日,科大讯飞董事长刘庆峰在2022中国移动全球合作伙伴大会主论坛发表《AI赋能数智创新》线上主题演讲。刘庆峰表示,数字经济是全球经济复苏的关键动力,人工智能是数字经济下一步发展的核心引擎。他认为,源头技术的持续创新,是引领人工智能发展的必选之路。人工智能解决重大社会命题,需要坚持源头核心技术的持续创新,在单点技术持续突破的基础上,加强多项技术深度融合,比如科大讯飞在多模感知、多维表达、深度理解和运动智能四方面的关键技术的突破和系统性的创新。

微信图片_20221211175910.jpg

据介绍,多模感知不只有语音的感知,还要有视觉、眼神、面部表情、肢体语言、环境的综合感知,包括味觉、触觉等等。科大讯飞推出可以将唇形和语音技术相融合的多模态语音交互系统,让语音识别在高噪音场景下得到了实用。比如地铁站买票的场景,除了用户自己的声音外,周围人说的话也会被机器捕捉到。那么,想要从嘈杂背景环境中分离干净人声,除了必需的语音识别技术外,还可以结合嘴型等图像识别技术。同时,科大讯飞还推出了凌空手写、眼神打字等功能,都可以实现在虚拟世界和元宇宙中进行更自然地沟通和交流。

多维表达可以把文字内容配上图片、虚拟形象和语音,用更立体的方式对外表达。比如AI读朱自清的散文时,就可以生成朱自清的形象;读林徽因的散文时,就可以生成林徽因的形象。有了这样强大的多维表达功能,根据文章的进度,随时随地都可以配上AI生成的画面,既生动又有趣。

过去一年科大讯飞把AI的深度理解能力和认知能力提升到了全新的高度。在权威的知识推理比赛OpenBookQA上,科大讯飞的AI在单模型上已经首次超过人类水平,这标志着AI认知智能的重大突破,从而使得机器可以在越来越多的领域帮助人们解决更专业和复杂的问题。

运动智能是把多模感知、多维表达和深度理解结合在具体的机器人、机器狗、玩具等形象上面,从而在现实世界为人类提供更大帮助。近期发布的讯飞运动机器人,强大的运动能力让人眼前一亮。

刘庆峰表示,以上这些都是科大讯飞承建的语音及语言国家工程技术中心和认知智能全国重点实验室的最新成果。

此外,要满足未来社会事业、人类发展的刚性需求,需要懂知识、善学习、能进化的机器人。科大讯飞在今年年初提出了讯飞超脑2030计划,希望让懂知识、善学习、能进化的机器人,无论是虚拟形象的机器人还是实体机器人,未来能够走进每一个家庭。在人口老龄化的大背景下,讯飞超脑2030计划具有非常重要的产业意义和社会意义。刘庆峰还提到,未来老人或许可以穿上外骨骼机器人,跑步不会摔跤,搬东西不会扭伤胳膊,可以像年轻人一样登山。

2022-12-12 01:24
相关热门
联系我们
星泰丰森-2021白色黑字logo-PNG-无边框
星泰热榜
7cc8530814a9bfc4a80cad4ee1a08639.png
站内资讯