12月1日,爱诗科技正式发布了PixVerse V5.5,国内版为拍我AI V5.5。这一新版本标志着 AI 视频从“镜头生成”向自动“讲故事”的进化,进入具备“完整叙事能力”的实用阶段。与以往只能产出单镜头或零散画面的大模型不同,V5.5 可以生成具备叙事结构的短片,甚至接近“成片”质量的视频。
这一版本是继 Sora2 发布后,国内首个实现“分镜 + 音频”一键直出的重大更新,让创作者能够在几秒钟内生成完整的视频故事,而无需再从素材中拼接。

AI具备导演思维:多镜头生成和多角色音画同步
V5.5 的核心进步来自于底层模型的全面升级。此次更新首次支持音频(Audio)与多镜头(Multi-shot)同步生成,并强化了多角色音画同步能力。AI 能够根据用户输入的提示词,自动理解并生成完整的故事段落,而非仅仅提供单一镜头的素材。用户只需要输入一个简短的提示,AI 就能完成镜头推进、景别切换、人物对白、环境声和背景音乐的生成,直接呈现一个可被使用的叙事片段。
在拍我AI(PixVerse)中,用户可以在V5.5大模型多镜头和音画同步打开状态下,生成5秒、8 秒、10秒的视频。用户现在可以在提示词(Prompt)里直接控制「音效、台词、音色、音乐、镜头」,AI 能自动理解提示词中的叙事意图,自动设计推拉、摇移、切换、景别变化等镜头语言。AI 的运镜节奏更自然,紧贴真实制作逻辑,带给用户“成为导演”般的创作体验。
V5.5 的智能化程度还体现在它对模糊信息的理解能力上。即使用户只输入“一只小熊在森林里讲笑话”的简单提示词(Prompt),勾选音频( Audio )和多镜头( Multi-shot )后,AI 就能自动生成具有景别变化、搞笑情绪并搭配匹配笑声的完整片段。镜头骨架、情绪走向都由AI自动搭建,让普通人也能以“导演思维”进行表达。

从体验角度来看,V5.5 进一步缩短了创作工作流中的时间差。生成速度大幅提升,镜头语言更丰富,控制方式更加直观,使得 C 端用户和创作者都能以更低的门槛,迅速将抽象的灵感变成可观看的成品视频。
音画同步的能力也得到了飞跃性提升。V5.5 成为国内首个可以在一次生成中实现“分镜 + 声音”的 AI 视频生成大模型。画面生成的同时,人物对白、口型、表情、动作、环境声和背景音乐被自动融合,呈现出自然协调的多角色互动。这一能力的实现,使得创作者无需再额外调参或上传音频,便能生成近乎“直出成片”的高质量视频。


拍我AI(PixVerse)海内外创作者社区的测试反馈来看,V5.5 多镜头能力足以改变短视频的创作方式。过去,创作者需要依赖摄影师和剪辑师的配合,才能完成具有“黄金三秒开场节奏”的镜头。现在, AI 就能自动生成这一部分内容。
从图像到视频:一条龙工作流
随着视频生成能力的升级,爱诗科技正在为创作者提供更加完整的AI视频工作流,全流程的一体化制作能力,加上全球最快的1080p生成速度(V5Fast模式下约30秒即可出片),帮助创作者更好地在效率、成本与成片质量取得平衡。
在 PixVerse.ai 和 pai.video 上,用户可以上传多张图片,利用内置的 Nano Banana Pro 模型生成高清图像,并一键转入视频制作流程。平台此前已接入 Qwen-image、Seedream 4.0 和 Nano Banana 等图像模型,为“从图到视频”的生产路径提供基础能力;Nano Banana Pro 的加入进一步提升了图像质量与衔接顺畅度,使整体创作效率显著增强。
过去一个月,爱诗科技还推出了 Swap、Remix 和 Modify 三大视频编辑功能。结合Diffusion + Transformer视频生成大模型和多模态特征融合技术(Fusion),为创作者提供更加自由、自然的编辑体验:
Swap(替换):支持替换视频中的角色、场景与背景,满足影视再创作、品牌 定制与社交娱乐内容的需求;
Remix(二创):从“单向生成”到“互动共创”,允许用户基于他人创作进行二次创 作,推动内容的循环传播。
Modify(精修):基于关键帧编辑的“全视频推理与追踪”方式,用户像修改照片 一样,轻松PS视频,确保跨帧一致、自然衔接。


这些能力正在成为新一代创作者的日常工具。今日正式开启预售的电影《比如父子》也与拍我AI合作推出“未完成的对话”项目,通过老照片生成动态影像,帮助用户跨越时间表达情绪,使 AI 视频技术首次进入更具情感价值的场景。
AI 视频正在成为基础设施
从 2023 年成立至今,爱诗科技在两年内完成了五代 PixVerse 模型、八个版本的快速迭代。从基础模型的突破,到功能创新,再到规模化应用,技术与产品的共同演进为 V5.5 的推出奠定了坚实基础。2025 年初,PixVerse V4 曾领先实现 5 秒极速生成高质量视频,并成为全球首家上线“人声+音效”的 AI 视频平台。如今,PixVerse 已成为全球创作者使用 AI 视频生成的首选平台之一,用户规模超过1个亿。
依托“速度快、易上手、创意可控”的产品理念,以及准实时生成、角色驱动视频等核心技术,它正在让 AI 视频真正成为可规模化的内容生产方式,在影像、广告、游戏、营销和社交娱乐等领域不断拓宽应用空间。
拍我AI(PixVerse) V5.5 指向的是一个更普惠的视频创作未来:让更多人能以“导演思维”进行表达。无论是漫剧、玩梗、MV、Vlog、复古影像还是动画与二次元内容,制作成本都被进一步降低。从灵感浮现到看到成片,也许只需要一杯咖啡的时间。




0 条评论
请「登录」后评论