2022年末,ChatGPT的火种点燃全球AI浪潮,人们很快意识到:这场技术革命不仅将改变内容创作方式,更将重塑信息传递的底层逻辑。在演示创作领域,这一变革显得尤为迫切——作为胶片时代的产物,PowerPoint的核心交互逻辑自1987年诞生以来几无本质变化。如今,AI正为这个古老的赛道注入前所未有的可能性。
在AI演示产品PI的CEO杨疆看来,当前市场上的AI演示工具(如Gamma、Tome、Canva AI以及国内的各类AI PPT产品)虽同属AI内容生成赛道,但本质上是不同物种。
这种变革需求催生了新一代演示工具的爆发。从Gamma、Tome,到整合AI功能的Canva,再到国内外层出不穷的AI PPT工具,整个行业正经历着从“工具辅助”向“AI原生”的代际跃迁。
主流AI演示工具横向评测:从模板革命到原生创新
2025年的AI演示工具市场呈现两极分化格局:一边是以AI PPT为代表的效率工具,通过模板库与AI填充技术实现快速制作;另一边是以Gamma为代表的创新演示工具,尝试突破传统幻灯片的线性结构。通过对页面设计、核心功能与成果质量的三维度测评,我们得以窥见行业演进的清晰脉络。
测试对象:AI PPT;Pi
两款工具均支持“AI生成”、“文档生成”、“链接生成”等核心数据来源。在生成选项的丰富度上,AI PPT 表现更突出:它允许用户精细选择文档的受众特点(如大众、投资者、学生)、应用场景(报告、课件等)、语言风格(专业、幽默等)以及底层模型(GLM、豆包、DeepSeek等),在三款产品中选项最为全面。相比之下,PI 在生成界面主要提供语言选择(如汉语、英语)和内容详略程度的调整。
我们以提示词(Prompt)“AI文档生成现状研究报告”为例,测试两款的PPT的AI生成能力
两款工具逻辑相似:先由AI生成PPT大纲,用户确认或修改后,再进入模板、模型选择等环节。PI 的策略更为“激进”,其AI不仅生成大纲,通常还会直接填充更详尽的页面内容。而 AI PPT 在此阶段更侧重于结构框架。从大纲生成的结果来看,两者的大纲结构都较为常规,未展现出显著的结构创新或亮点。这倒也能理解,都是基于市面上的大模型,prompts也比较简单,大纲质量也都差不多。
对于演示文稿这种高度定制化的需求,生成后的编辑便捷性往往比初始内容质量更为关键。 在这一环节,两款工具的设计理念差异显著。
AI PPT的编辑界面设计理念更接近于在传统PPT工具上增强AI能力。其界面采用熟悉的横向页面缩略图导航,非常类似微软PowerPoint。用户可以直接在幻灯片画布上修改文字、图片等元素,操作习惯无缝衔接。额外的AI功能,例如更改页面布局(横排/竖排切换)或润色文字,则主要通过右侧的AI对话侧边栏来调用和实现。当用户需要添加空白页时,流程以文字输入为导向:用户先填写标题和内容要点,系统随后自动匹配合适的模板。
PI则采用了不同的思路,其编辑界面是竖向的单页编辑视图,当前编辑页占据视觉中心,布局更接近文档编辑器。PI显著弱化了独立AI侧边栏的存在感,侧边栏的AI智能进行问答无法对文稿进行操作。PI将常用的页面操作功能(如直接更改布局)直接呈现为页面上的按钮或菜单项,用户无需与AI对话即可快速完成大部分基础修改。像“改进写作”、“翻译”这类AI功能,也常以顶部功能按钮的形式集成。在添加空白页时,PI支持用户预先选择样式布局。不仅如此,它还能基于文档上下文,智能地提供AI生成的内容建议来辅助用户填充新页面,体现了更强的场景化智能。
然而,两者之间更本质的区别可能在于对“演示文档”概念的理解,这直接体现在画布尺寸和演示方式上。AI PPT 严格遵循了传统幻灯片的范式:每一页拥有固定尺寸的长宽比(如常见的16:9或4:3),编辑和演示都以离散的“页”为单位。演示时,用户一页一页地翻动浏览。
PI 则如其“智能演示文档”的定位所示,它打破了传统PPT的尺寸限制。只要内容需要,PI生成的文档画布可以更宽、更长,不受固定长宽比的约束。相应地,在演示环节,PI摒弃了传统的“翻页”概念,采用了类似网页或长图文的流畅滑动方式进行呈现,内容的连贯性更强。
这也是两款产品带给我们最直观、也最深刻的体验差别。
以下是和PI产品CEO杨疆博士访谈:
AI时代的原生展示应该是什么样的?
硅星人:如果用一句话介绍PI,您会说什么。
杨疆:
这是我们在这个AGI时代背景下,做的一个专注于AI原生的演示创作平台。
硅星人:如果把PI看作一个AIPPT工具,它和目前市面上流行的那些AIPPT产品(比如Gamma或者国内的产品),能做个比较吗?
杨疆:
其实像Gamma,还有咱们国内一些AIPPT工具,包括很多大厂做的类似产品,本质上都属于“AI内容生成”这个大赛道。它们算是这个赛道里不同的物种。功能上肯定会有很多重叠,但PI的定位其实不止于PPT。
为什么呢?我们都知道,PPT其实是三四十年前、胶片时代的产物了。可能年轻点的朋友没见过,以前有种物理的幻灯片胶片,用投影仪打光投到幕布上,所以叫幻灯片。后来微软把它电子化,变成了我们现在熟悉的PPT。无论是胶片还是电子PPT,它的核心功能是一样的:都是为了帮助人们在沟通、传播信息时,能够更视觉化地呈现内容。
而我们现在做的探索,是面向AGI时代的。我们不想把自己框死在旧有的技术模式里。我们在思考:在AI原生的时代,当人们需要沟通和展示信息时,应该用什么样的新工具?这才是PI在做的事情。
硅星人:PI有没有其他APP或AI产品无法替代的功能,或者说最大的差异化是什么?
杨疆:
关于差异化,我觉得可以从当前AI内容生成的“代际”划分来看。目前市面上很多做PPT、海报这类内容的AI产品,本质上可以分成两个代际:
第一代是“模板+AI”模式。怎么理解呢?就是过去积累了大量现成的素材——PPT模板、海报模板、网站模板、详情页模板等等。这些模板通常是用XML或HTML这类技术写好的,本身已经定义好了框架。AI的作用,主要是解析模板中可以被替换的部分,然后用生成式AI去替换这些内容。这是大模型在这个赛道带来的第一层价值。
第二代则是像PI和Gamma这样的产品在做的事情,我们称之为AI原生模式。这代产品最大的不同在于,它完全没有模板的概念。整个内容是从零开始,由AI原生构建的。
具体来说,AI会从头思考并构建内容的“信息架构”这个内容主体需要包含哪些模块?它们如何组织?然后,AI会决定每个部分该用什么样的视觉语言和风格来呈现,并生成或选择合适的素材填充进去。这整个过程,都是原生设计的。
硅星人:我之前尝试过不少AIPPT产品,也采访过一些用户。他们普遍反馈AI生成内容确实很快,但大部分时间都花在修改上,结果不尽人意。PI有没有什么方法来确保生成内容更符合用户需求?
杨疆:
您提到的这个问题,其实是我们做好这个产品最核心的目标,也是最难的点。这绝对不是说做一两件简单事情就能解决的。我们看到市场上“AI+PPT”的形式非常吸引眼球,很火爆,我认为原因在于它能在一些简单的、低价值场景里,快速满足用户需求。这些需求对质量要求不高,可能一两次修改就能交付。
我们其实也刚起步,但已经做了不少事情。比如,我们构建了一个非常智能的多智能体协同系统。它能处理用户告诉你的表面意图、他实际潜在的深层意图、他提供的各种信息,以及他过往行为表现出的偏好。同时,它还能针对用户当前任务主题,去查询、组织相关素材和内容,这些素材可能来自我们已有的资源,也可能需要即时搜索获取,或者连接特定的数据源。
这一步,我们称之为构建上下文。即围绕任务本身收集一切相关信息。这本身已经是一个非常复杂的、需要协同一致的工作流。完成这一步,你可能会得到一个好的底稿、结构和一个符合预期的方向。但就像朱啸虎老师说的,AI生成只是第一步,后面还有大量的调整和编辑工作。
硅星人:PI的训练数据或产品设计上有什么特别之处?
杨疆:
我们投入了很大精力在开发一个全栈的、原生支持AI的编辑器。在这个编辑器里,用户可以随时智能地调取修改或调整所需的数据、素材,无论是通过搜索还是申请的方式,都能瞬间获取。把原来耗时很久的修改工作,压缩到可能十分之一甚至更少的时间。
其次,我们的产品升级是用户与系统协作进化和迭代的过程。我们的整个系统设计就是高度模块化、可插拔、可调度的,无论是决策、工作流还是API模块。我们会在本地或全局各个节点持续测量、收集用户反馈。这样一方面能学习:比如设计中的专业知识和场景专业知识。这些知识会沉淀到我们的知识图谱中。
另一方面,用户在我们这里积累的偏好、数据以及我们接入的更多外部数据源,都能帮助系统理解用户长期风格、偏好及其专属场景的特殊表达需求。您刚才提到的数据积累,其实正是与这个流程紧密结合、共同积累的。它不是孤立的,必须与流程结合才能产生更好效果。只有这样,我们才能逐步达到目标——让用户真正交付高精准度、高要求、高质量的内容。
从用户数据也能看出,所谓“一句话生成PPT”、“一分钟生成PPT”更多是营销话术。真正严肃的用户,要求非常高。我们看到现在60%-70%的用户是带着自己的内容来的,上传一两个资料,说明他们对产品有明确预期和标准要求。这和“一句话生成”的难度完全不在一个量级。
AI原生的交互设计不仅仅是放个对话框
硅星人:AI原生的演示创作平台应该是什么样的?我看到现在很多AI软件就是在右边放个问答框。
杨疆:
我们经常听到AI原生这个概念,很多人一提到AI原生,就简单理解为:放个对话框,让用户输入Prompt。但我认为,所有交互设计的核心,都是为了让人和机器更好地沟通协作,从而高效地产出内容。就像我们两人讨论方案,聊着聊着可能就跑到白板上去画图了,这就是因为我们需要更丰富的交互工具。
所以,交互设计对我们来说,是一个非常棘手问题。特别是在像PI这样的产品里,处理一个演示文稿远比处理一篇文章复杂得多。它融合了多种元素,你不仅要理解用户想表达什么,还要精准定位到他指的是文稿中的哪一个具体元素?哪一段文字?哪个区域?这种信息的沟通难度极高。这就是为什么传统软件在过去几十年里,大多依赖“选中对象,菜单操作,命令行”的模式。这种方式提供了精准控制,但学习成本高,不够直观,把很多用户挡在了门外。现在我们有了自然语言交互,这看起来更人性化,但它带来了另一个大问题:不精准。在充满像素点的复杂视觉空间里,单靠语言描述很难精确定位目标。
在我看来,这并非非此即彼的选择,而是一个需要精心权衡的设计平衡点。这个平衡点在哪里?没有标准答案。它需要我们通过不断的实验、测试和探索来寻找,并且会随着技术发展而动态变化。
比如我们产品里的智能助手“小狗狗”AI助手,就是这种探索的体现。它的设计目标,就是尝试在相对简单的自然语言指令下,帮你完成更精准的操作。
硅星人:说到交互设计,我之前看到一个挺有意思的观点:说那些对AI能力非常有信心的公司,会把AI对话框放在产品的左边;而对AI没信心的公司,则会放在右边。您怎么看这种说法?
杨疆:
我觉得讨论对话框在左在右,核心道理或者说后验道理在于:设计必须服务于用户的实际操作场景。您可以观察一下像Photoshop这样的专业工具,它很早就引入了智能提示功能。您会发现,它的提示框往往是动态跟随鼠标出现的。 为什么?因为它要精准地辅助你处理当前鼠标所指的对象或区域。它的位置是由用户的操作焦点决定的,而不是预先固定在左边或右边。 这背后有深刻的设计考量。
具体到PI的设计,我们把主要交互面板放在右侧,主要基于两个关键的用户行为洞察:
右手操作习惯,大多数用户是右手操作鼠标或触控板。在编辑状态下,用户的自然行为流是左边浏览,右边进行操作。当用户在左侧画布上看PPT,发现问题,他的右手很自然地就会移动到右侧区域开始输入指令或进行编辑。将功能面板放在右侧,符合这个高效的操作动线。
其次,在PI的编辑器环境中,用户的核心任务是演示文稿的创建、检查和迭代。这个工作流非常类似于审阅模式:用户在左侧仔细查看演示文稿内容,发现问题或产生修改想法,然后很自然地在右侧区域进行操作,无论是输入修改意见、调用AI助手,还是添加注释。右侧区域天然承载了行动区的角色。
硅星人:我看到PI上推出了交互问卷功能,想了解PI未来还会在哪些内容形式或功能上发力?类似交互问卷这种,或者其它能更好满足用户场景需求的新体验?
杨疆:
这个问题其实点到了PI最根本的追求。从我们做PI的第一天起,“实时交互”就是我们最核心的基因和终极目标。 我们团队从一开始就非常明确:未来的内容工具,必须打破过去那种线性、一次性的模式,那种一个人写好、单向传播出去、反馈要么滞后要么彻底断掉的传统方式,是技术限制下的无奈产物。
我们坚信,人们真正需要的,是能即时互动、共同生长的内容。沿着这个方向,PI未来会持续探索和深化。首先,我们会无缝融入更多样的交互媒介。 比如,引入个性化的虚拟人形象。想象一下,未来你在PI上生成的可能不再是一份静态文档,而是一个完整的项目包。其次,在智能能力的深度应用上,我们会走得更远。 刚才提到的交互问卷功能,正是我们尝试数据连接与即时反馈的一个起点。 未来的PI,会更像一个随时在线的顾问。你可以边学边问。像交互问卷这样的创新,只是我们迈出的第一步。PI会持续投入,开发更多能真正实现实时交互这一愿景。
AI产品共创式“营销”
硅星人:说到很多是和用户共创的,我在你们的PI广场里看到不少模板,比如WAIC大会的模板、rokid的模板等等。想请问一下,这些是你们专门邀请这些机构或个人来合作共创的?还是说,这些其实是真实用户自己在平台上制作、上传的PPT,然后你们觉得质量特别好,就挑选出来展示给大家?
杨疆:
这两种情况都存在。像WAIC(世界人工智能大会)这个例子,它其实就是一个典型的深度共创案例。一方面,我们和WAIC本身有合作关系——我们也是大会的重要参展商;另一方面,经过长期的协同沟通,双方建立了很好的互信,他们对PI平台的能力和价值也非常认同。
目前PI广场上的很多模板,本质上都是一种共创的结果。营造这种共创氛围,正是我们非常看重的一点。我们相信,好的内容创作应该是“百花齐放”——就像毛主席说的,需要一个开放的环境、空间和工具,让大家能够自由地展现创意。PI的角色不是闭门造车去预设所有内容,而是提供强大的底层能力。 我们的重点是理解用户想要做什么但可能做不到,然后想办法帮他们实现。我们更希望用户去主导创意,思考“我想做出什么样的效果?”
杨疆:
因此,我们非常欢迎那些自身对内容要求很高、有强烈表达欲的用户和团队。 PI广场上的很多优秀作品,正是来自这样的朋友,他们可能是听说了PI,就想用它来展现自己公司的价值、产品的亮点。
大厂也不是什么都做,抓住“大厂魔咒”的机会,创业公司也能生存。
硅星人:这个问题可能有点老生常谈:如果像OpenAI,或者国内的百度、阿里这些大厂,也开始做类似PI的PPT功能。你们除了在产品上持续精进,还有什么特别的应对之道?或者,对于面临类似挑战的创业者,您会给出哪些建议?
杨疆:
说实话,这个问题对我们来说困扰不大。原因有三点:首先,大厂的实际投入往往有限。像阿里这样的巨头,他们的一些接口可能直接用了类似AIPPT的外部方案,自己并不深度投入开发,这不是个例。其次,我们深知大厂魔咒是客观存在的。我和很多创业者朋友聊过,包括一些大厂出来的创始人,大家都有共识,无论美国还是中国的大公司,都难以摆脱这种魔咒。如果大厂没有这些内在的限制,那创业公司就根本不会有生存空间了。正因为大厂有它的掣肘,才给了创新者机会。这是市场规律。
最关键的是第三点:技术代际的变化彻底改变了游戏规则。现在的AI产品,相比互联网时代又向前跃进了一大步。它不再需要庞大团队和巨额资源才能做出具备颠覆潜力的产品。这在过去是无法想象的。如今一个更精干、更有战斗力的团队,完全有可能利用AI技术做出影响力巨大的产品。
所以综合来看,大厂入场是必然的,但我们并不特别担心。我们相信小团队的敏捷、专注和对创新的纯粹追求,在AI这个新时代反而能释放出更强的战斗力。
硅星人:对于AI软件/产品来说,哪些指标是最关键的?你们会关心哪些数据,像日活、用户数还是其他的?
杨疆:
我们很幸运得到了有耐心、有长期信念的资本支持,这让我们能够将目光放得更长远一些。 现阶段,对我们来说最重要的目标,不是急于追求盈利或达到收支平衡,而是全力证明用户能在PI这里获得持续的价值,并形成真正的使用习惯和粘性。
这一点非常关键。 我们看到很多新兴的AI产品会像一阵风,用户初期涌入很快,但留存率可能迅速下滑。观察一个重要的指标,日活跃用户数(DAU)除以月活跃用户数(MAU)的比例,非常有说服力。比如看OpenAI的发展轨迹,这个比例从最初的个位数,逐步提升到10%、20%,甚至超过了30%。这说明用户不仅在使用,更开始依赖这个平台,把他们的工作流程和数据沉淀了下来。达到这种状态意味着,即便短期没有大规模盈利,只要持续提供不可替代的价值,用户就会选择留下。这是我们未来一年最核心的专注点。 我们不会盲目追求用户数量的激增,因为来了的用户也可能离开。我们更希望用户是真正认可PI的价值,欣赏它解决复杂创作问题的能力,从而主动选择留下。 我们的投资人也非常理解并支持我们优先把这件基础的事情做扎实。
硅星人:另外,我看到PI目前的商业模式更偏向ToC,主要是会员订阅收费。未来是否有计划拓展其他方向?比如更侧重于ToB,为大公司或机构提供企业级的内容创作解决方案?
杨疆:
在探索商业模式的具体路径上,我们持开放和务实的态度。 面向个人和专业用户市场, 我们会关注并参考类似Gamma这样成熟的订阅模式,努力达到并争取在用户付费意愿和单用户贡献价值等关键指标上做得更好。对于服务企业客户的方向, 我们则更侧重于开放与合作的策略。PI的核心任务始终是打磨好产品本身。 因此,我们不会投入大量资源去做传统的商务销售,而是更愿意与各类平台伙伴进行深度合作。
事实上,过去三个月我们已经开放了API等集成能力,国内外已经有不少合作伙伴主动找我们接洽,共同探索PI在不同场景的应用落地。我未来,我们计划开放模型调用平台(MCP),并积极参与构建开放的Agent智能体生态。
硅星人:你怎么看待目前很多出圈的AI产品,更加注重UI设计这个趋势。
杨疆:
我认为,过分追求整个产品UI的“漂亮”可能没那么重要。我们更应该关注的是基础排版元素,比如行间距、字间距这些。这些才是更关键的事情。相比之下,UI设计目前不是我们的首要焦点。毕竟,我们的产品本身就是帮助用户设计的用户用它,最终是为了生成一个他自己觉得满意的PPT。如果因为我们的技术或产品问题,导致生成的PPT效果不理想,达不到用户的预期,那才是一个更严重的问题,一个真正的“Bug”。
当然,我也承认我们的UI目前还有很多不足。但在资源有限,比如目前设计师只有两位的情况下,我们必须做优先级排序。有更重要的事情等着我们去解决。
因此,在重要性排序上,我们不会盲目投入过多资源。资源有限,就必须从最关键的事情入手做取舍。对,这就是我们的一个基本哲学。
0 条评论
请「登录」后评论