智能硬件正从传统的屏幕交互向人工智能原生界面转变,这一变革为行业带来了新的发展机遇。10 月 28 日,在科大讯飞全球 1024 开发者节「AI+智能硬件」专场上,讯飞 AIUI 交互平台实现持续升级,围绕语音、视觉、语义理解等多模态能力展开深度融合,展示了全新的语音大模型、交互大模型、类人记忆系统及儿童专属交互方案,致力于与各方共同构建门槛更低、效率更高的智能交互新范式。
在 AI 开发者大赛展演现场,来自全球 3 万余支参赛团队的优胜者登台亮相,带来了智能眼镜、AR 头显、智慧交通、四足机器人等前沿创新成果,展现出 AI 与智能硬件融合的无限想象空间。
秒级响应 深度懂你
AIUI 人机交互平台升级
2025 年,AIUI 开放平台升级至大模型极速超拟人交互阶段,不仅支持超多轮连续对话、AI 人格、共情交互、长时记忆、驱动数字人等能力,还可接入三方智能体、开源及私有大模型,全链路响应耗时仅 1.6 秒,为智能硬件语音交互带来颠覆性体验变革。
AIUI 以全双工交互重塑自然对话体验。创新融入大模型 VAD 技术,依托上下文语义精准识别用户对话意图,实现流畅连续交互;还具备情感贯穿能力,能通过捕捉语气、语调预判用户情绪,让大模型输出更具情商的回复;同时搭配超拟人合成技术,让机器回应满含人情味。
在场景化交互方面,AIUI 基于千万级精标文本数据与音频数据,打造出适用于人机交互的场景交互大模型;结合深度优化的工程链路,设备的意图理解能力显著增强,还采用更贴近真实沟通习惯的渐进式对话模式,确保交互过程精准且高效。
AIUI 构建了强大的类人记忆系统,让硬件成为「成长的陪伴搭子」。该系统具备 10 轮以上的对话记忆能力,能总结用户喜好并生成个性画像,从而给出更贴合用户需求的友好回复;更能记录关键事件并将其转化为长时记忆,推动硬件从单纯的机器向有温度的伙伴进化。
针对大模型可能导致语音交互链路耗时增加的问题,AIUI 通过全流式对接和特定任务的小模型训练,将链路耗时优化到 1.6 秒,真正让交互过程变得流畅丝滑,带来更快的交互体验。
在具体场景落地中,AIUI 开放平台已展现出强大的赋能价值。在机器人领域,讯飞机器人超脑平台面向人形、仿生等各类机器人,提供视听融合的感知交互能力;其首创的机器人智能「语音背包」方案,可让机器人即插即用、「轻松开口」。在儿童领域,平台打造了童声识别引擎和童语理解模型,能提供准确的语音识别与理解能力;该模型以儿童科学成长理论为基石,在保证内容健康的同时对孩子进行积极引导,助力孩子在趣味交互中全面成长。
如今,AIUI 正成为万千智能硬件的交互中枢,让更懂用户的 AI 伙伴走进千行百业。
拟人交互 灵活定制
解码 AIUI 平台新特性
讯飞 AIUI 人机交互开放平台,是以自然语言理解为核心,能提供从「录音降噪-语音识别-大模型理解-语音合成」全链路能力与解决方案的一站式技术平台。自 2023 年起,在大模型的加持下,平台能力持续升级,目前,平台单次对话交互轮数较此前上涨 5 倍,对话字数翻倍,家庭和儿童场景的硬件产品交互量也显著增长,涨幅分别达 60% 和 700%,这两大场景已成为平台深度覆盖的核心领域。
基于 AIUI 平台的升级,智能硬件不仅能与用户聊天,还能听懂并执行指令,再加上大模型的助力,AIUI 的智能化水平进一步提升,在直播中,平台的新特性也得以全面展示。
交互体验全面升级:平台深度融合大模型技术,支持多款模型灵活接入。其中,专为儿童设计的交互大模型,具备情绪理解、话题引导与童言适配能力;整体交互轮次与对话自由度显著提升,带来更自然的沟通体验。
角色自定义更灵活:平台提供覆盖全风格的 95 种音色库,从小孩到长辈、可爱到沉稳的风格均有包含。用户可自定义角色人设、音色与回复风格,结合声音复刻技术,能直接打造品牌专属的 AI IP 形象。
工具与智能体强化赋能:平台已集成问答库、智能体工作流、外部工具接入等核心能力。可支持设备指令控制、知识精准问答与多任务串联,真正实现从「能聊天」到「懂执行、有知识、会思考」的能力跨越。
从大模型驱动的流畅交互到灵活的角色自定义,从精准的知识问答到多元的智能体赋能,再到家庭陪伴、儿童教育及智能硬件开发等领域,讯飞 AIUI 开放平台始终以更智能、更灵活的语音交互能力全程赋能。
AI 开发者大赛路演
见证创新力量的崛起
从 2018 年首届赛事至今,科大讯飞 AI 开发者大赛已共建超过 580 道高质量赛题,累计吸引全球超 18 万支团队角逐。在 AI+智能硬件的赛道上,参赛团队们将大模型能力融入现实应用,在智能眼镜、AR 头显、智慧交通、四足机器人等领域,探索 AI 赋能智能硬件的无限潜能,也为未来的人机共生打开了更多想象的空间。
南京魔数团信息科技,成为问鼎「基于增强现实与多模态交互技术的 AI 智能眼镜产品赛道」的冠军团队。针对 AR 硬件落地应用周期长的问题,他们聚焦 B 端市场,推出了 Teamhelper+AI 开发平台,通过集成常用应用和标准化 SDK 封装等方式,减少开发时间和成本,提高落地效率。目前,产品体系已全面融合 AI 能力,兼容全球主流大模型,助力 AR 眼镜实现交互效率和服务变革。
上海火离科技,是今年 AI 开发者大赛评委会联合推优的团队,他们在 AR 行业拥有丰富产品与技术积累。聚焦工业级和消费级产品创新,在工业场景研发了 AR 头戴设备,用 AI 技术打造外挂大脑,赋能一线员工;在青少年防近视场景,则推出了健康护眼的儿童专属 AI 终端,通过将屏幕放大到桌面距离解决近距离观看问题。
智丽显示技术深圳团队,则是今年「大模型赋能下的智慧交通创新应用赛道」的冠军团队,他们开发了 FSHD 场序显示技术。该技术以成熟的国产供应链和全新的理论构架为基础,在保留 LCD 低成本优势的同时,将亮度、色彩、分辨率提升至接近 OLED 水平,可应用于 AR/VR、车载 HUD、投影机等场景。
香港中文大学纪祥团队,作为 2025AI 开发者大赛评委会联合推优团队,带来了 Spark 生态赋能四足机器人巡检与孪生操控系统项目,致力于打造基于星火多场景模型矩阵赋能四足机器人校园安全巡检和孪生操控平台。在边缘端,他们打造了多地形低成本的四足机器人平台,实现多地形自主巡检和基于雷达的自主导航。在云端,引入星火模型矩阵,实现多模型的调度。在网页端,打造机器人云孪生控制平台,实现机器人的远程控制和数据在线评估存储。
10 月 29 日—11 月 1 日,2025 科大讯飞全球 1024 开发者节将持续通过线上形式带来更多精彩内容,围绕大模型在机器人、教育、企业出海等领域的落地应用,分享行业前沿观点,展示产业生态创新实践。
11 月 2 日—11 月 6 日,线下盛会将正式开启,2025 科大讯飞全球 1024 开发者节主论坛、开发者生态发布会、科博展、行业论坛、城市峰会、AI 开发者大赛十佳团队展演及年度颁奖盛典等活动将如期举办。
从开源共建生态繁荣,科大讯飞正与全球开发者携手共创共享,共同见证「更懂你的 AI」持续解放生产力、释放想象力!
*文中数据来源于实际应用




0 条评论
请「登录」后评论