引发关注：美图一口气发了8款产品，我挨个用完发现它们在干同一件事 - 辉达登录

近日，有媒体报道称，为一组照片摆了十几个 pose、拍了几百张废片，回到家想挑两张让 AI 修一修，结果 AI 说「请精准描述你的需求」。

吴欣鸿在现场提到一个数据：在这个短视频时代，有超过 80% 的年轻人是通过刷视频发现一首新歌的。然而现实是，市面上绝大多数的歌，根本没有 MV。

实测中，我上传了一张商品实拍图，输入商品卖点，它就能生成市场分析、场景图、卖点文案以及多尺寸电商海报的整套物料。

Picchi 的价值核心就在于，它背后虽然是一支由调色、妆造、形象、打光、体态各司其职的 AI 修图师团队，但用户不必知道复杂的底层参数，只需要看到「真的像我、真的好看」。

AI 影像，率先从生成走向交付

前几天 APPSO 来到美图影像节，他们一次发了八款产品，号称是「AI 影像团队」，这个节奏确实很 AI 了，但影像设计这个领域的 AI 产品实在太卷了，美图这次有什么不一样呢？

这也是 RoboNeo 出力的方向，也是短剧规模化最难的一环，一致性与可持续。

在口播领域，美图推出了由导演、营销、拍摄、剪辑 Agent 组成的口播团队——「开拍」。这次更新，它实现了从选题到拍剪，再到成片和数据复盘的全托管。

所以回到最初那个事项：美图「让 AI 适应人、对结果负责」，到底走到哪一步了？

工具越强，人反而越累。我们好像都默认了一条潜规则：AI 越厉害，人就得越拼命去追、去学、去写小作文讨好它。

打开 Picchi 应用，首页找到「学我修图」，上传 3-10 组前后对比图，Picchi 就会创建一个专属我们自己的修图模型，它能自动记忆我们的修图风格。

以往用 AI 修图，最痛苦的莫过于每次都要重新打长串提示词，而部分 AI 的指令遵循能力不够强，还经常修改了表情，改到根本不像本人。

一张商品图，变成一套卖货素材

例如，我们可以直接把出门旅游，拍的实际上原图一股脑批量丢进去，Picchi 就会根据之前总结的自定义图片模型，依照我们想要的风格，把照片统一编辑好。

我尝试扔进去一段粗糙的口播素材并选定网感模板，它会自动剪掉气口、加字幕、配 BGM 并直出成片。

值得注意的是，「学我修图」是 Picchi 采用顶级显卡、前沿算法以及高质量渲染来实现的，所以它对上传照片的要求也非常严格。

少则几万、多则几十万的成本，两三月的制作周期，让 MV 成了少数头部的特权。这叫视频时代的「音乐遗憾」。我们做 MVLAND，就是想把这个遗憾补上。

这种全托管让很多个体户和创作者松了口气。根据开拍一些真实用户的体验，一位实体店老板娘提到，以前自己是「拍摄 5 分钟、剪辑 5 小时」，现在用开拍十分钟搞定。而快速产出的短视频获客，也让店铺业绩翻了 2.5 倍。

为了检验它的能力，我挑了四个层层递进的场景，看它到底做没做到。

虽然这个影像团队还有很多空间，Picchi 的专属模型训练时长，Artflo、RoboNeo 短剧新版、MeituHub 正式版也还得等正式上线才见真章。但有件事我越来越确定：美图这次是真正多走了一步，把焦点落在了「给你结果」这件事上。

最终，把 AI 产品的及格线，从「生成」抬到了「交付」。

它完美解构了一支专业 MV 必备的 5 大要素，拥有理解音乐、人物演绎、视觉风格、情绪编排、歌词字幕等功能，并行业首创了「画布剪辑台」。

人、灵感和定制需求也在这套系统里

如果说 Picchi 搞定的是静态人像的动态审美，那么另一款重磅新品 MVLAND，则把触角伸向了更注重情绪共鸣的音乐视频领域。

规模化生产短剧的 RoboNeo

▲ 我们使用美图设计室内的爆款视频，给制糖工厂的小电拼生成了一段 15s 的小视频。

做比想容易太多了，很容易让人产生一种我在创造价值的幻觉。但交付给用户好的成果，帮用户赚到钱，才是真正的价值。

P 图也有一套 Skill

在演示中可以看到，剧本、角色、分镜全在画布上可控可改，角色和场景可以跨项目复用，披露后数据还能反哺下一集。

往回看，这也正是美图这两年种种变化的落点：从 App 到 AI Agent，工具复杂度的债由 AI 扛，不再甩给用户；从订阅到算力点消费，你买的是「成果」，费用跟着算力点走，功能权限退到后面；从成熟组织到 AI 创新组织，就是要适配新时代的需求……

但这种「记住你是谁」的能力，相当于直接把我们过去繁琐的 P 图流程直接打包成了一套 Skill，它也能在批量精修时展现出更大的优势。

审美这种事本来就是个性化的，我每次都是凭着自己感觉在 P，要想描述清楚到底该怎么 P，相当不容易。说给人都难解释清，何况说给 AI。

结果有点出乎我意料，它们和其他 AI 产品比起来有点「非主流」。别的产品让人去适应 AI，美图是让 AI 来适应人；其他人是只丢给你一个工具，美图会把能直接用的成果，交到你手上。

例如照片必须足够清晰足够大，照片的人脸区域也必须足够大，此外也只能上传同一人脸的照片，你帮其他人修的图不能和你自己的放在一起。

而为了让这支团队运转得更稳、更远，美图还布下了三块重要拼图。

在「像不像我自己修的」这一项上，如果满分是 100 分，我愿意打 90 分。因为测试的时候，我上传的原图和对比图，其实就是简单的修了一些光，以及皮肤。在使用「学我修图」时，Picchi 很好地抓住了这些习惯。

而即将在 6 月 30 日上线的 Artflo 则走的是灵感创作路线。它保留你的判断，把概念影像那套又长又绕的创作流程压短，让过去一条动辄几十万的概念视频，用 AI 几百块就能做出来。

▲美图生产力场景多款 AI 影像产品

这项全新的功能叫「开拍 AI 助手」。过去拍一条口播，我们要先想好文案、架起设备面对镜头，最后还要调整剪辑轨道。

如果说开拍解决的是个人表达，美图设计室解决的则是商业生存。

而在「学我修图」和「学 Ta 修图」之外，那些我们常常挂在嘴边、说不清道不明的「氛围感」，Picchi 现在也能用自然语言准确拆解。

在「学 Ta 修图」旁边，Picchi 还提供了一系列的预设，这些预设包含了当下的热门照片风格，像是 Pocket 3、理光负片、Xs Max、徕卡 DL7、鲜花增色、CCD 等不同的相机和场景。

首先是作为人力底座的站酷（ZCOOL）。当人人都能产图，大家对 AI 生成内容的「信任」反而成了稀缺品。

运营二十年的站酷，其价值正是「相信一份作品背后那个鲜活的人」，这也为美图的 AI 提供着高视觉标准、AI 资产库和效果工作流。

硬要挑一处不足的话，就是创建次数确实太有限了，以及处理的时间还是有点久。

把一首歌扔进去，音乐分析 Agent 会自动拆解节拍、段落与情绪并生成画面。

最后是 8 月 5 日推出正式版的MeituHub，它接住了标准化产品够不着的那 20% 规模化需求。用户只需要用大白话把需求说清楚，专家 Agent 就会替你搭出一条 AI 影像生产线，既能生成网页应用，也能通过 API 嵌入企业原有的流程中。

它通过市场洞察、内容策划、视觉创作、数据分析等 Agent 以及几十个专业技能，能够一次交付全套商业物料。

这两年我越来越觉得，现在的 AI 工具有点像越买越贵的智能健身器材，功能堆得越来越满，可大多数人扛回家，只用来晾衣服。

发布会上，美图公司首席产品官陈剑毅说了句挺朴素的话：

开拍的好用，是它让我们连学都不用学，它懂用户的生意，直接帮我们做视频，我们只需要把自己要传递的内容表达清楚，它会把成片这个「结果」直接交付。

面对AI，我只想说一句，「我要美」。结果就是它修了十张，没几张是能用的，还有几张根本不像我自己。

我们从网上找了一些相机直拍的原图，然后放到 Picchi 中使用「学 Ta 修图」来进行修改；依次使用了哦基儿、Iris 和 Hana，最终呈现的高光面部提亮和骨相微调，是真的很像专业大拿坐在你身边亲自操刀的手笔。

而 AI 修图的终点除了要有更强的参数，更应该是懂你的那个人。专注人像这一件刚需，让 Picchi 反而做到了通用大模型做不到的「真的像你」。

如果说 Picchi 解决的是「懂不懂你」，MVLAND 解决的是情绪和画面的对齐，那么在这次美图影像节上带来的另外几款产品，美图设计室、开拍和 RoboNeo，则将这种「直接交付成果」的底气，带到了更硬核、更需要全流程托管的商业生产力场景。

美图把这件事拎出来，做成了「交付式 AI」，AI 负责生成，也要把最终好不好用这件事扛到最后。

至于面向短剧规模化生产的 RoboNeo，则直接模拟了一个真实的剧组，配置了编剧、选角、导演、美术、执行、运营等 Agent，它主打四大核心能力：懂短剧、镜头可控、资产沉淀和数据闭环。

我发现其中有几款，恰好压在我天天犯怵的地方：人像修图、口播、做图，趁着假期我还是一款款真上手用了下来。

下面跟大家分享下我真实的使用体验，用的时候我的标准也很简单：东西能不能一次出对、比从前省了多少功夫、到底适合谁，给出的东西对我又有多大用处。

▲ 开拍生成的自动字幕和花字视频

如美图创始人吴欣鸿所说：从「用户学工具」，到「用户直接获得结果」，从事实来看，这支 AI 影像团队交出的答卷，确实不太一样。

连学都不用学，把口播交给「开拍」

把 8 款产品挨个体验下来，我的感受是：8 款产品合在一起，确实拼出了一套「AI 影像团队」。

它们的场景覆盖范围相当广，涵盖了口播、电商、MV 和短剧，但落点出奇一致，那就是最终交付的，必须是一件能直接拿去用的成品。

你可以直接在里面选用官方合作的「百万改妆师」或者「骨相修图大拿」等合伙人模型，直接在 Picchi 首页找到学 Ta 修图，里面就囊括了 Hana、哦基儿、Iris、清颜好困啊等模型，还有热门预设和灵感玩法。

在实测中，这也是最让我感到惊艳的一款新品。以前的通用 AI 视频工具往往「读不懂音乐」，最多只能傻傻地对个鼓点。但 MVLAND 的底层做到了对音乐结构、节拍、情感的深度理解。

这一整套物料，能直接帮助用户进一步完善自己的营销方案，包括判断、选图、写卖点……美图设计室几乎是把「能不能卖货」的压力也扛了下来。

当我说出「修出冬日萧肃氛围感」时，它能自动调整面部暖调光和发丝微光，同组提示词直接出片，不需要像以前那样频繁「抽卡」碰运气。

根据实际工作流对比，同样做一支精致的 MV，通用视频工具要 3 小时，MVLAND 只要 10 分钟，且画面情绪与音乐节拍严丝合缝。

而开拍 AI 助手的出现，让过去这种传统的工作流直接升级，口播创作变成了真正的「不用你想、不用你拍、不用你剪」。

实测的过程中，我尝试把一些平时 PS 的照片丢给它学偏好，再上传新原图，它能从原图和修后图中间找到完整的修图细节，直接 Get 到我的修图偏好。

我的答案是，它走到了把成果交付当成底线这一步，它没有把 AI 说成万能药，只一件件啃小众刚需。它始终站在用户和创作者那一边：靠效果驱动，少谈数据驱动。

再派出一支专业团队，直接交付

如果你是一个不懂 HSL、不懂骨相蒙版的新手，平时就不知道该怎么手动修图，Picchi 无从学习你的修图模式，它便提供了一种「借用审美」的解法。

这一步，恰恰是行业最容易跳过的。大家都忙着比「生成式 AI」谁生得更快、更炫，可用户要的是一次更好的商业判断，一条能直接发的视频，一支情绪真的对得上的 MV。

看着那些 AI 生成的 P 图，我很想知道，到底是我不会用 AI，还是 AI 根本没想过要懂我？

先从那款最戳我痛点的产品 Picchi 说起。通用大模型逼我们「精准描述需求」，说到底还是人在迁就 AI；Picchi 反过来——让 AI 来迁就你。

设计师、灵感型创作者、要规模化生产的企业，三类人需求差得很远。但美图想干的是同一件事：让 AI 来适应你，再对交付出去的结果负责。

这几款产品虽然场景各异，但它们合在一起，才真正撑起了「你的 AI 影像团队已就位」这句话；团队的意义，就是替你把结果交付到底。

当整个行业忙着证明「AI 有多强」，美图在证明的是另一件事：AI 到底能不能对你有用、对你的结果负责。前者制造焦虑。后者，才在终结焦虑。

给每首歌都能拍个大片的 MVLAND

AI 产品到底成不成，最后都得落回这句话上：不看它生成了多少，看你有没有真的用上，有没有真的拿到那个结果。

究竟事情将如何发展，我们将持续跟踪报道。