品玩2月5日讯,据 CNET 报道,法国人工智能公司Mistral AI今日正式发布两款Voxtral Transcribe 2系列模型,显著提升语音转文字的效率与实时性。
Voxtral Realtime专为实时转录设计,采用全新流式架构,能将延迟压缩至200毫秒以内,实现音频到达即刻转录的效果。Voxtral Mini Transcribe V2则面向批量处理,以其高性价比为亮点,其API准确率表现优于GPT-4o mini Transcribe等模型,单次请求可处理长达3小时的录音。
这两款模型均支持包括中文在内的13种语言。在定价方面,Voxtral Mini Transcribe V2的API价格为每分钟0.003美元,而Voxtral Realtime为每分钟0.006美元。值得注意的是,Voxtral Realtime的模型权重以Apache 2.0许可公开,进一步降低了开发者的使用门槛。





0 条评论
请「登录」后评论