科大讯飞星火多模态交互大模型上线 实现“语音、视觉、数字人交互”三合一

2024年11月15日 09:11浏览次数:6453次编辑:圣灵科技-小圣

科大讯飞公司近日宣布,其最新研发的讯飞星火多模态交互大模型正式投入运营。这一技术突破标志着科大讯飞从单一的语音交互技术拓展到音视频流实时多模态交互的新阶段。新模型集成了语音、视觉和数字人交互功能,用户可通过一键调用,实现三者的无缝结合。


讯飞星火多模态交互大模型的推出,首次引入了超拟人数字人技术,该技术能够使数字人的躯干和四肢动作与语音内容精准匹配,快速生成表情和动作,极大提升了AI的生动性和真实感。通过整合文本、语音和表情,新模型能够实现跨模态的语义一致性,让情感表达更加真实连贯。


微信截图_20241115083401.png


此外,讯飞星火支持超拟人极速交互技术,利用统一神经网络直接实现语音到语音的端到端建模,使得响应速度更快、更流畅。该技术能够敏锐感知情绪变化,并根据指令自由调整声音的节奏、大小和人设,提供更为个性化的交互体验。


微信截图_20241115083600.png


在多模态视觉交互方面,讯飞星火能够“听懂世界”“认清万物”,全面感知具体背景场景、物流状态等信息,使得对任务的理解更加精准。通过综合语音、手势、行为、情绪等多种信息,模型能够作出合适的回复,为用户提供更为丰富和精准的交互体验。


多模态交互大模型SDK:https://www.xfyun.cn/solutions/Multimodel


来源:AIbase基地


关注圣灵科技公众号,免费获得更多企业互联网发展方案!

圣灵科技公众号二维码.jpg

友情链接: 百度腾讯抖音小红书今日头条企业盟重庆互联网微星球建筑劳务网云人脉圈全民创收网全民财多多圣灵建站系统圣灵溯源系统圣灵客服系统圣灵人事系统创投100圣灵短视频圣灵传媒圣灵商学院重庆网海南网贵州网云南网广西网甘肃网宁夏网山西网陕西网山东网黑龙江网重庆百科web专家U站网青海网新疆网西藏网安徽网福建网湖北网湖南网四川网河北网河南网吉林网辽宁网AI应用工厂

Copyright @ 2004-2023 cqslkj.cn All Right Reserved @重庆市渝中区圣灵科技信息有限公司 版权所有

渝ICP备16004600号-5 渝公网安备 50010802001399号 电子营业执照

联系方式
023-62897001

77981978
023-62897001
81623110
62891977
微信公众号