根据最新消息显示,要说这段时间的热门 AI 产品,Codex 必然是绕不过去的话题。
最后我们得到的分析报告也非常全面,数据表、可视化分析和具体的公司介绍都囊括在里面。更有意思的是,每家公司的详情部分都写着一句「风险」,Kimi 给自己的定位是「估值上涨过快,盈利拐点不明」,而核心竞争力是「长文本、编程能力、智能体、开源领先。」
例如我们可以要它「检查我的 Gmail 邮箱,看看有没有过去 24 小时内未读的邮件。把核心的邮件总结一下。」然后,总结的内容全部保存到本地,甚至是把重要的邮件都保存下来。
对大多数国内用户来说,Codex 算是第一个真正迈过这道坎的,虽然 Claude Code 在它之前,但 Claude 难用上,Codex 一键安装,加上接连的体验优化,把 Coding Agent 从程序员的玩具变成了普通人也能上手的东西。
早在 OpenClaw 火爆的时期,其实就有类似的趋势,但是龙虾的安装和部署劝退了众多人。叫好的多,真用起来的没几个。这类工具一直卡在同一道坎上,只有会折腾的人玩得转,普通人连门都进不去。
究其本质,都是将从前单一的 Agent 演变成 Agent Team,甚至是一整套高达上百个 Agents 的动态工作流。
在 Kimi Work 的案例里,无论是研究 20 家 AI 公司,还是围绕本地文件生成一整套咨询报告,背后是一组 Agent 自动拆解任务、分工协作、交叉审核,再完成最终交付。
使用 WebBridge 的方式也非常简单,按照官方的指引,我们在浏览器上安装好 Kimi WebBridge 的扩展程序,或是直接新建任务,要求 Kimi 帮我们完成安装,它会自动执行对应的安装脚本,在本地处理好 WebBridge 相关的服务。
为了分析预测,它调用 300 个 Agent 去搜集信息、拆解数据、评估概率,再持续复盘整个赛事过程。这套流程和前面那些行业研究、财报分析、咨询报告一样,世界杯预测只是另一种形式的复杂任务。
当所有 AI 公司都在押注多 Agent 的产品形态时,四年一度的押注开始了。
更重要的变化在于,完成一项任务的主体,正在从单个 Agent 变成多个 Agent 的协作。
这些检索内容、生成报告相关的能力,其实也正是前段时间 OpenAI 「知识工作者的下一个时代」报告里提到的,Codex 增长最快的知识型任务。统计的数据显示,数据分析任务,周环比增长 110%,而研究和知识产物也排名前三,有将近 37% 左右增长。
聊天机器人负责回答问题,Copilot 开始参与工作,Coding Agent 学会执行任务。如今,随着文件访问、浏览器操作和工具调用能力逐渐成熟,Agent 开始承担越来越完整的工作流程。
今天 Kimi 发布的这份世界杯预测报告里面提到,连续两届世界杯小组出局的阴影,在公众和市场心理上留下了顽固的「近因偏差」,持续压低了德国的定价;但 Elo 排名、阵容估值和人才储备厚度的硬指标上,日耳曼战车依旧稳居世界第一梯队。
过去,知识工作的瓶颈往往来自人的时间和精力;未来,越来越多工作或许会变成另一种形式,人负责提出目标、判断方向和做最终决策,而资料搜集、信息整理、分析研究和文档交付,则由一支随时待命的 AI 团队协同完成。
Kimi 最近推出了 Kimi Work,也是建立在这个趋势之上的一次尝试;其核心逻辑,就是把底层的 Agent Swarm 模型能力,用可视化界面进行封装,放到了本地电脑上。
Kimi Work 另一项降低「交给 AI」门槛的功能是 WebBridge。根据官方的指引,我们也先让它使用浏览器搜索了 Kimi K2.6 的信息。
Kimi Work 的出现很大程度上帮助知识工作者更好地处理这些任务,另一方面,知识工作者的核心竞争力开始与长时间内的信息处理速度高度绑定,Agent 集群的能力迎合了这一需求。
本地 Agent+Agent Swarm+WebBridge,这几项能力的综合,让 Kimi 能胜任的场景比单纯的聊天要广泛得多。
开启 300 个 AI 分身
我们先是使用现有的本地文件夹创建项目,在该项目内新建任务,要求 Kimi Work 帮我们整理 20 家值得关注的 AI 公司,分析它们的产品定位、融资动态、核心竞争力等信息,并给出网页报告、PPT 等内容。
Kimi Work 最大的优点是 Agent 集群的能力放到了本地 Agent 上;而为了让 Agent Swarm 真正工作起来,Kimi Work 提供了多项实用能力。
本地文件深度连接,可直接读取和管理本地文件夹,安全护栏机制要求在修改文件前需用户授权。 7×24 小时定时任务(Cron 引擎),支持按设定时间自动执行 LLM 对话请求、Python/Shell 脚本等,如清晨生成简报或夜间清洗数据,可保持电脑唤醒以确保任务运行。 WebBridge 浏览器自动化,通过自然语言指令让 AI 自主操作浏览器,实现跨网页信息检索、深层数据抓取、自动填写表单等。 原生接入全球金融市场数据,直接打通 A 股、港股、美股等核心数据源,可在对话中调取财报、分析盘面、进行跨表对账,辅助投资决策。
越来越多人发现,虽然 Claude Code、Codex,都是叫 Code(代码),但这些 Agent 不只是会写代码;它们还能整理文件、分析数据、搜索资料、自动跑工作流,甚至替我们完成一整个项目里的重复劳动。
我们要求它使用 K2.6 Agent 集群来启动并行协作,根据文件夹内的资料,完成行业研究、论文综述、产品策略、技术架构、合规治理、财务测算、PPT 设计、Word 报告、PDF 研究报告、Excel 模型和质量审查等多份文档。
选择 K2.6 Agent 集群开始任务,Kimi 会自动给任务设置对应的进度,并且使用 Subagent 工具调用多个 Agents 来处理。
由于涉及的文件过多,Kimi K2.6 Agent 集群这次启动了多个阶段来完成,像是在研究分析的第一阶段,它就找来了行业研究员、论文综述员、产品策略师、技术架构师、合规治理专家以及财务测算师 6 个 Agent。
展开任务过程,可以看到有分析组 1-大厂 AI、研究组 2-新锐大模型、研究组 3-基础设施,以及研究组 4-AI 应用 4 个研究 Agent 去搜集和分析对应公司的资料。
我们找了一份会议记录,并搜集了一些论文资料和图片数据,累计本地的文件数量达到了十余个。过去使用云端的 Kimi,我们要一个个上传这些文件到网页,现在 Kimi Work 可以直接选择该文件夹作为一个项目,开始 Agent Swarm 进行处理。
打开电脑,面对的可能不再只是一个 AI 助手,而是一整个 Agent 团队。
随便点开其中一份文档,Kimi Work 都不是随便应付,从内容到格式都符合直接交付的标准。
这个一开始只是给开发者用来做代码补全、项目管理、功能开发的编程平台,到现在已成长为一款适用于任何角色、工具和工作流程,且人人都能使用的生产力工具。
对于 Google 这种无法搜索到小红书信息的搜索引擎,用 Kimi 来自动化整个搜索过程,并给出对应的总结,也是一种不错的用例。
当然,德国队最后能不能夺冠,目前还不得而知。有意思的是,在这件事里,Kimi 想证明的可能从来不是自己会不会猜球。
这件事放到我们打工人身上,只能是先看 A 公司,再看 B 公司;先开网页,再记笔记;先跑表格,再写结论。但 Kimi Work 这类本地 Agent 的加入,让知识工作正在从「一个人依次处理任务」变成「一个人调度一群 AI 处理任务」。
美加墨世界杯即将在本周打响,48 支球队、104 场比赛。今年的竞猜选手,也有 AI 一席地。
这套数据配合 Agent 集群更能发挥它真正的实力。苹果 WWDC 马上要来了,我们要求 Kimi 帮我整理一下苹果这三年来的股价信息,以及每年的财报,分析其中值得的关注信息。
过去几年,大模型产品一直在寻找进入工作的方式。
除了网页,还有基于金融数据整理的 PPT、表格等内容,详细地概括了苹果的股价、主要收入、不同地区的收入情况等。
对大多数的知识工作者来说,这套内置的专业金融数据源能帮助我们减少很多上手 Agent 的负担。
Kimi 用 Agent Swarm 功能调动 300 个 Agent,对全部 104 场比赛进行赛前公开预测和赛后复盘,认为德国队被严重低估了,模型测算显示,德国队基准夺冠概率约11.0%,校准后约11.3%。
从右侧的进度可以看到它会读取文本文件内容,也能提取 PDF 文件、查看图片文件以及处理 Office 文件等,最后生成的表格也成功列举了所有的文件内容和对应的信息。
放心 Vibe Working
Kimi 在浏览器中自动化操作了一会儿,就自动为我们生成了这份 Gmail 邮件总结报告。
除了这种常见的深度研究任务,有了 Kimi Work,我们现在可以直接让它处理本地的文件。最简单的先让它帮我整理一下最近 30 天内的文件,使用对应的工具查看文件内容,汇总这些文件的信息。
Anthropic 前几天在 AI 自我进化的报告中,就曾提到,现在的 Agent 已经从 Coding agents 的时代来到了 Autonomous agents 的阶段,核心的变化就是多 Agent 成为了一种新的工作组织方式。
One More Thing
在第二步,Kimi 又找来了 PPT 设计师、Word 报告员、PDF 研究员和 Excel 建模师 4 个 Agent 来完成整合交付。整合交付之后,还会自动开启质量审查,利用质量审查员和网页开发师两个子 Agent 对之前的内容进行最终确认。
AI 正在组队上工,学会做个甲方
针对每份文件,它还贴心地给出了使用场景快速导航,例如向 CEO/高管汇报用 07_管理层汇报.pptx + 12_数字化汇报.html,提交正式咨询报告使用 08_综合咨询报告.docx,投行/研究机构参考是 09_深度研究报告.pdf 等。
最后,Kimi Work 产出了六份文字报告、一份测算模型,以及用于汇报的 HTML 和 PPT 文档。
大到工作中需要 300 个 Agents 并行处理的复杂任务,小到平时繁琐的文件整理、操作浏览器等等,都能通过这支 Agent 队伍在后台挂机完成。

此外,结合我们之前要求它完成行业咨询任务,现在可以让它总结信息,自动撰写文件,选择合适的附件并发送邮件。
或者针对那些从搜索引擎或者内置数据库中找不到的信息,先用 WebBridge 获取相关信息,再通过 Agent 集群来处理,形成各种报告文档。
Kimi 一点都不含糊,同样是启用了 Subagent 工具,调用多个 Agents,完成了一份内容丰富的调研报告。
除了直接使用 300 个 Agent 的能力,配合 Agents 集群,我们还能利用之前 Kimi 内置专业金融数据源的独家亮点。不需要专门去找各种金融 Skill 或者配置数据 API,Kimi 会直接抓取到包括同花顺、天眼查以及世界银行经济数据库的金融数据。
▲ OpenAI 在《知识工作的下一个时代》报告里提到,Codex 现在周活用户超过 500 万,自从今年 2 月上线桌面版 APP 后增长了 6 倍多。用户画像方面,虽然开发者仍然是 Codex 最大的用户群体,但知识工作者目前约占用户总数的 20%,并且增长速度是开发者的三倍多。
而调用 Skill 这些都是基本操作,从右侧的上下文部分,我们能看到 Kimi 调用了报告撰写、可视化、集群深度研究、前端主题等来帮助它完成任务。
Kimi 会自动启用一个标签组,所有自动化的操作都在该标签组内的网页上进行,调试过程中,Kimi 会自动输入对应的信息,自动截图查看当前页面状态,也会通过获取页面结构来定位搜索框、帖子内容等信息。
在 Kimi Work 的回复里,Kimi 提到基于本地文件夹的内容,它启动了 11 个专业 Agent 分 3 个阶段并行协作,模拟完整的企业咨询项目组,最终交付 12 份专业文档,覆盖 6 种格式。
而当生活和工作中,越来越多的事情,我们都能安心交给这 300 个 AI 去完成时,那我的八块腹肌,或许真的还有点希望。
究竟事情将如何发展,我们将持续跟踪报道。