AI agent 用例:工作里真正跑得通的那些

同事甩给你一条 X 上的帖子:有人搭了个 AI agent,“整个市场部都靠它在跑”。你照着抄。两小时后,你手里只有一个能总结一份 PDF 的聊天机器人。那个 agent 是 demo,那条帖子本身才是产品。

大多数 AI agent 用例都是这样散架的——不是想法不好,是这个用例从一开始就不成立。下面讲怎么分辨,以及真正经得起一份真实工作考验的那几种模式。

四问测试

在你花一下午搭东西之前,先拿这个用例过四个问题。任何一个不过关,你手里就是个 demo,不是用例。

  1. 这件事重复吗? 你应该能数出这周自己做过它三次。agent 是靠重复把搭建成本赚回来的。只做一次的事,自己动手更快。
  2. 输入是乱的,但有边界吗? 邮件、会议记录、表格里的某一列、客服工单——每次都不一样,但形态是已知的。输入要是完全开放,agent 就稳不了;输入要是已经干干净净,你根本不需要 agent。
  3. 输出你能在几秒内检查完吗? 你得能扫一眼结果就知道它对不对。一份待办清单、一份草稿、一行被标出来的数据——可以。一份法律意见、一份财务预测——不行,至少现在不行。
  4. 它有触发器吗? 真正的 agent 是在某件事发生时跑起来的——早晨到了、来了封新邮件、有人提交了表单。“想起来再打开”不算触发器,一个要靠你记着去跑的 agent,第二周就悄悄死了。

真正有效的几种模式

在职场人真正在跑的 agent 里,能成的那些集中在几种形态上:

  • 收件箱和队列分拣。 把堆起来的东西全读一遍,按“现在就得管 / 之后管 / 不用管”分好。邮件、客服工单、Slack 里的 @、PR review 队列。
  • 会议和通话准备。 通话前,把上一轮往来、CRM 里的记录、还没结的待办项拉到一起,给你一页纸的简报。这活儿是真有用,只是烦到没人愿意做。
  • 初稿生成。 进度同步、release notes、周期性报告、跟进邮件。agent 把你带到 80%,你花五分钟,而不是四十分钟。
  • 数据清洗和对账。 把某一列规范化、在两个系统之间匹配记录、标出对不上的行。输入有边界,输出可检查——教科书级别的合适。
  • 监控和摘要。 盯着一个 feed、一个频道、一组页面,等真的有变化了,发一条摘要给你。替掉那个你老想着要看、却一直没看的标签页。

注意这几种的共同点:重复、输入有边界、输出扫一眼就能验证、有明确的触发器。它们都过得了那个测试。

现在还不行的那些

另一面也得说实话:

  • 有真实后果的判断。 凡是输出错了要赔上钱、信任或者饭碗的——agent 可以打草稿,但拍板的还得是人。
  • 没法快速检查的事。 如果验证输出花的时间跟自己干一样长,agent 等于啥也没省。
  • “把我整份工作做了”的 agent。 你的工作是上百件小事,靠只有你才有的上下文粘在一起。先自动化一件,再下一件。X 上那条帖子,跳过的就是这一段。

唯一一个完整记录下来的例子

Issue #001 从头到尾走了一遍真实的例子:一个 Gmail agent,每天早上读一遍收件箱,输出一份带时间块的 P0/P1/P2 待办清单。二十分钟搭好,每月 $20,不用写代码。它四个问题全过——这件事重复、输入乱但有边界、输出几秒就能检查、而且靠早晨这个触发器跑起来。

完整搭建过程看这里:Issue #001:每天给我写待办清单的 Gmail AI agent。如果你在选技术栈,对比文也可以看一下:Gmail agent 怎么搭:Claude/Zapier/n8n

自己试试

挑一件你这周做过三次的事,拿它过一遍那四个问题。要是过了,那就是你的第一个 agent——从这儿开始,别从 X 上那条帖子开始。

每周一个真在用的 AI agent,直接发到你邮箱。免费,不卖课。