在人工智能技术日新月异的今天,人机交互正在经历一场深刻变革。近日,在2025年科大讯飞全球1024开发者节上,作为人工智能国家队的核心成员,科大讯飞展示了其超拟人多模态交互技术的最新突破,标志着AI交互正式迈入“更懂你”的新阶段。
从单一对话到多人互动:交互边界的全面突破
此次发布会上,科大讯飞的数字人“小飞”展现了令人惊艳的交互能力。不同于传统的一对一语音交互,“小飞”能够同时与多人进行自然流畅的对话,准确分辨说话对象,恰当把握插话时机,甚至能化身林黛玉等角色,形象与语气惟妙惟肖。
这一突破的背后,是科大讯飞在多模态技术领域的持续深耕。据了解,该系统具备5米0dB远场高噪语音识别能力,即使在嘈杂环境中也能精准识别用户语音。通过融合语音、人脸、姿态等多模态信息,系统能够在多人场景下准确锁定说话人,实现真正意义上的自由交互。
全国产技术栈:全栈自主可控的技术底气
值得关注的是,科大讯飞此次展示的超拟人多模态交互系统,依托全国产技术栈打造,实现了从芯片到算法的全栈自主可控。作为承建认知智能国家重点实验室、语音及语言信息处理国家工程研究中心的科技企业,科大讯飞在核心技术国产化方面始终走在行业前列。
自2023年讯飞星火大模型发布以来,其多模态能力持续迭代升级。2024年推出的星火图文识别大模型赋予机器“慧眼”,同年8月上线的极速超拟人交互功能已向全民开放体验。此次发布的技术更是在响应速度、情绪理解、个性化服务等维度实现了质的飞跃。
情感共鸣:让AI真正“读懂”人心
超拟人交互的核心在于“懂”。科大讯飞创新研发的多情感语音合成技术,能够对多轮对话中的历史信息进行编码,感知用户的情感变化,并通过语音合成大模型实现自适应情感回应。数字人不仅能识别用户说了什么,更能理解用户的真实心绪,给出“心领神会”的默契回应。
同时,首发的个性化记忆能力通过分层式动态记忆体架构,实现了长短期协同的精准用户记忆。系统能够记住用户的身份、偏好和历史信息,从“内容个性化”进化到“沟通风格个性化”,让每一次交互都更具温度。
布局未来:AI走进千家万户
业内专家指出,超拟人多模态交互将成为AI进入家庭场景的标配技术。无论是智能学习助手、工作伙伴,还是家庭陪伴机器人,只有真正理解用户需求的AI,才能创造实际价值。
作为国家新一代人工智能开放创新平台的承建单位,科大讯飞正以大模型国家队的担当,持续推动人工智能技术的创新与应用落地。从语音识别到多模态交互,从单一场景到万物智联,科大讯飞正在用技术实力书写人机交互的新篇章,让AI真正成为每个人身边有温度的智能伙伴。