AI Agent 之路,由 MCP 铺就,AI 自动化操作的时代已经到来,代码已不再是创意实现的最大门槛。还记得 GPT-4 刚发布视频时的惊艳亮相时的视频演示场景吗?只见 AI 看着网站草图,就自动做了一个原形网站。只需要告诉 AI 指令,它就帮你完成了一系列的机票订票流程。许多人更是憧憬过 All in One App —— 通过 AI 搞定一切。 这其实才是大多数普通人眼里 AI 的原本模样 —— 我只需要动嘴,一切活有人搞定。可以说,现阶段的 AI 使用形态,充其量就是个氛围组。我只能获取必要的资料指引,具体的活还得我自己来干。真正的 AI,难道不是可以自动帮我干活,做 PPT 再顺手当个司机吗? 而过去两年的发展,AI Agent 不过是雷声大,雨点小的玩意了。做的人很多,但是能够在路人之间火出圈的产品,大抵也只有 Manus。但是高昂的使用门槛,很明显还是一个处于测试环节的产品。大人,这远处只能看的大饼,它不香呀! 但是,它的火爆宣告着 —— AI Agent,就是众人的希望。没办法,谁让人类就是这么懒呢?要是一个技术能让我偷懒摸鱼,那最好赶紧的。 接触 MCP 之后,我想说,想象中的全知全能 AI Agent,离我们可能真的近在咫尺。 不信?来看看下面这两个我实测过的场景吧: 1. 基于内部文档的智能客服 把帮助文档做成 MCP 服务,直接变身智能客服,不需要做 RAG 知识库,也能够精准解答客户基础问题。
2. 自动网页爬虫工具
让 AI 自动爬取澳洲各高校录取要求,自动生成汇总生成招生简章,并附上所有引用信源。
你可以直接点击此处看看它写的咋样。
3. 浏览器操作助手
让 AI 操作浏览器,登录 WP 网站后台,按照你的需求进行点点的操作。我更喜欢这个案例,因为它真的可以看懂你的网页内容,按照你的指令干活。
其实呀,上班上班,到底是公司请人上班,还是说给电脑配了个人?如果 AI 能够全部控制电脑,按照你的需求干活。可悲的办公室白领还能干啥?什么是 MCP?
MCP(模型上下文协议)是一个标准化工具箱,使 AI 大模型能够与外部工具交互,获取信息并完成具体任务。在传统方法中,用户需要手动复制文本、截图,然后粘贴到 AI 窗口进行交互。而 MCP 通过标准化协议自动化了这一过程,作为 AI 与外部工具的中间层,替代人工操作。 说人话版:一个能够让所有 LLM 顺畅自动使用工具的机器语言。这里说的工具并不是现实里的斧头锤子,而是指的是互联网上开源闭源的一系列软件工具。说白了就是人怎么用工具,只要那个工具支持了 MCP,那么不用你教,LLM 自己就会用了。并且,比人玩的还溜。MCP 的工作原理
MCP 由多个 MCP 服务器(MCP Server)组成,每个 Server 负责特定任务,例如:- 浏览器操作(如读取网页内容)
- 文档处理(如编辑和解析本地文档)
- 代码管理(如操作 Git 仓库)
你就记得一句话完事,只要某个软件支持了 MCP,比如说 Figma, Blender, Photoshop,Excel 或 PPT(不知道支持没,我乱说的),那么安装工具之后,你的 AI 助手马上就学会了这些工具的使用。而且,可以接管你的电脑/网页。
你动嘴,它干活。
MCP 和 API 的对比
可能你会说,这些事情不是只需要 LLM 知道怎么调 API 工具就可以完成了吗? 事情远没这么简单,因为 REST API 的设计对象是给人类程序员使用的。它非常死板,你输入的信息必须要符合我定义的格式才能正确返回结果。但 MCP 赋予了 AI 自助提问,自主寻找答案和结果的权力。 新时代,新思想,新方法。快速上手:安装 MCP
就像大部分软件使用一样,想要让 AI 使用上 MCP,那么你得安装一个客户端软件。这个软件里要能调 AI,还能连接 MCP 服务器。1. 安装支持 MCP 的客户端
目前支持 MCP 的客户端较少,基本只有以下工具:- Cursor(AI 编程工具,开通 MCP 需支付 20 美元/月)
- Claude 官方客户端 (美国信用卡 20 美元 / 月)
- Client(开源免费,本文以此为例)
安装 Cline 并配置 AI 模型
- 下载并安装 VS Code。
- 在 VS Code 的 Extensions(插件)市场搜索并安装 Client。
-
配置 AI 模型:
- 选择 DeepSeek 作为模型提供商。
(不是 DickSeek)
- 去 DeepSeek API 平台申请一个 API Key。现在官方的服务器已经可以稳定使用了。
- 选择
deepseek-chat。你也可以使用deepseek-r1,我只是嫌它每次使用工具还要思考一遍,太内耗太慢了。
- 选择 DeepSeek 作为模型提供商。
啥?你咋给我安装了一个开发者才会用的东西?这安装页面这么程序员,有没有一个更小清新的使用入口?没错希望我朋友圈的大厂里的高人快速整一个,AI 大舞台,有梦你就来。MCP 时代,客户端软件是妥妥的流量入口。
2. 安装 Node.js 运行环境
MCP Server 运行在本地的 Node.js 进程上,因此需要安装 Node.js。- 访问 Node.js 官网 下载并安装。
- 验证安装:
3. 安装 MCP Server
- 在 Cline 内点击 MCP Server 按钮,打开 MCP Server 应用市场。
- 选择所需的 MCP Server(例如 Playwright 会使用浏览器的工具),点击安装。
4. 测试 MCP Server
- 在 Cline 中输入命令:使用 Playwright 打开网站: au.pflm.net
- AI 自动调用 MCP 工具,此时你需要点击同意。
- 然后你就可以让 AI 去帮你干活了,比如说扒拉网页中的内容,变成自己的文档。
- 其它 MCP 工具同理。
更多 MCP 工具推荐
- browser2:AI 读取浏览器内容,需安装 Chrome 插件。
- Squint Shell Thinking:将普通大模型转换为推理模型。
- Filesystem:允许 AI 访问本地文件系统。