AI Agent 之路,由 MCP 铺就,AI 自动化操作的时代已经到来,代码已不再是创意实现的最大门槛。
还记得 GPT-4 刚发布视频时的惊艳亮相时的视频演示场景吗?只见 AI 看着网站草图,就自动做了一个原形网站。只需要告诉 AI 指令,它就帮你完成了一系列的机票订票流程。许多人更是憧憬过 All in One App —— 通过 AI 搞定一切。 这其实才是大多数普通人眼里 AI 的原本模样 —— 我只需要动嘴,一切活有人搞定。可以说,现阶段的 AI 使用形态,充其量就是个氛围组。我只能获取必要的资料指引,具体的活还得我自己来干。真正的 AI,难道不是可以自动帮我干活,做 PPT 再顺手当个司机吗? 而过去两年的发展,AI Agent 不过是雷声大,雨点小的玩意了。做的人很多,但是能够在路人之间火出圈的产品,大抵也只有 Manus。但是高昂的使用门槛,很明显还是一个处于测试环节的产品。大人,这远处只能看的大饼,它不香呀! 但是,它的火爆宣告着 —— AI Agent,就是众人的希望。没办法,谁让人类就是这么懒呢?要是一个技术能让我偷懒摸鱼,那最好赶紧的。 接触 MCP 之后,我想说,想象中的全知全能 AI Agent,离我们可能真的近在咫尺。 不信?来看看下面这两个我实测过的场景吧: 1. 基于内部文档的智能客服 把帮助文档做成 MCP 服务,直接变身智能客服,不需要做 RAG 知识库,也能够精准解答客户基础问题。 2. 自动网页爬虫工具 让 AI 自动爬取澳洲各高校录取要求,自动生成汇总生成招生简章,并附上所有引用信源。 你可以直接点击此处看看它写的咋样。 3. 浏览器操作助手 让 AI 操作浏览器,登录 WP 网站后台,按照你的需求进行点点的操作。我更喜欢这个案例,因为它真的可以看懂你的网页内容,按照你的指令干活。 其实呀,上班上班,到底是公司请人上班,还是说给电脑配了个人?如果 AI 能够全部控制电脑,按照你的需求干活。可悲的办公室白领还能干啥?(那当然是背锅 而实现这一切的背后技术,全然离不开 Anthropic 在 24 年 12 月悄咪咪发布的 MCP(模型上下文协议)标准。接下来,本文将深入解析 MCP 的概念、技术原理以及多种应用场景,帮助你快速理解并上手 MCP。

什么是 MCP?

MCP(模型上下文协议)是一个标准化工具箱,使 AI 大模型能够与外部工具交互,获取信息并完成具体任务。在传统方法中,用户需要手动复制文本、截图,然后粘贴到 AI 窗口进行交互。而 MCP 通过标准化协议自动化了这一过程,作为 AI 与外部工具的中间层,替代人工操作。 说人话版:一个能够让所有 LLM 顺畅自动使用工具的机器语言。这里说的工具并不是现实里的斧头锤子,而是指的是互联网上开源闭源的一系列软件工具。说白了就是人怎么用工具,只要那个工具支持了 MCP,那么不用你教,LLM 自己就会用了。并且,比人玩的还溜。

MCP 的工作原理

MCP 由多个 MCP 服务器(MCP Server)组成,每个 Server 负责特定任务,例如:
  • 浏览器操作(如读取网页内容)
  • 文档处理(如编辑和解析本地文档)
  • 代码管理(如操作 Git 仓库)
MCP Server 运行在本地,通常是一个 Node.js 或 Python 进程。大模型通过标准输入(STDIO)与 MCP Server 交互,消息格式如下:
{
  "tool": "search_repository",
  "query": "TechShrump的GitHub仓库"
}
MCP Server 处理请求后,返回数据给大模型。 你就记得一句话完事,只要某个软件支持了 MCP,比如说 Figma, Blender, Photoshop,Excel 或 PPT(不知道支持没,我乱说的),那么安装工具之后,你的 AI 助手马上就学会了这些工具的使用。而且,可以接管你的电脑/网页。 你动嘴,它干活。

MCP 和 API 的对比

可能你会说,这些事情不是只需要 LLM 知道怎么调 API 工具就可以完成了吗? 事情远没这么简单,因为 REST API 的设计对象是给人类程序员使用的。它非常死板,你输入的信息必须要符合我定义的格式才能正确返回结果。但 MCP 赋予了 AI 自助提问,自主寻找答案和结果的权力。 新时代,新思想,新方法。

快速上手:安装 MCP

就像大部分软件使用一样,想要让 AI 使用上 MCP,那么你得安装一个客户端软件。这个软件里要能调 AI,还能连接 MCP 服务器。

1. 安装支持 MCP 的客户端

目前支持 MCP 的客户端较少,基本只有以下工具:
  • Cursor(AI 编程工具,开通 MCP 需支付 20 美元/月)
  • Claude 官方客户端 (美国信用卡 20 美元 / 月)
  • Client(开源免费,本文以此为例)
我知道你们在想啥,不就是钱的事(你还得搞定美国信用卡),所以下文将会用免费的 VS Code + Cline 插件来带你一步步安装 → 感受你的 AI Agent 时刻。

安装 Cline 并配置 AI 模型

  1. 下载并安装 VS Code
  2. 在 VS Code 的 Extensions(插件)市场搜索并安装 Client
  1. 配置 AI 模型:
    • 选择 DeepSeek 作为模型提供商。(不是 DickSeek)
    • 去 DeepSeek API 平台申请一个 API Key。现在官方的服务器已经可以稳定使用了。
    • 选择 deepseek-chat。你也可以使用 deepseek-r1,我只是嫌它每次使用工具还要思考一遍,太内耗太慢了。
啥?你咋给我安装了一个开发者才会用的东西?这安装页面这么程序员,有没有一个更小清新的使用入口?没错希望我朋友圈的大厂里的高人快速整一个,AI 大舞台,有梦你就来。MCP 时代,客户端软件是妥妥的流量入口。

2. 安装 Node.js 运行环境

MCP Server 运行在本地的 Node.js 进程上,因此需要安装 Node.js。
  1. 访问 Node.js 官网 下载并安装。
  2. 验证安装:
打开你的终端,运行以下命令:
node -v
npx -v
好了确保成功输出版本号。

3. 安装 MCP Server

  1. 在 Cline 内点击 MCP Server 按钮,打开 MCP Server 应用市场。
  1. 选择所需的 MCP Server(例如 Playwright 会使用浏览器的工具),点击安装。

4. 测试 MCP Server

  1. 在 Cline 中输入命令:使用 Playwright 打开网站: au.pflm.net
  2. AI 自动调用 MCP 工具,此时你需要点击同意。
  1. 然后你就可以让 AI 去帮你干活了,比如说扒拉网页中的内容,变成自己的文档。
  2. 其它 MCP 工具同理。

更多 MCP 工具推荐

  • browser2:AI 读取浏览器内容,需安装 Chrome 插件。
  • Squint Shell Thinking:将普通大模型转换为推理模型。
  • Filesystem:允许 AI 访问本地文件系统。
你也可以访问访问 Smithery AI 发现更多 MCP Server。

总结

MCP 作为 AI 与外部工具交互的标准协议,极大提升了自动化能力。掌握 MCP 的基本原理和配置方法,可以帮助你高效利用 AI 进行开发和数据处理。 📌 下一期,我们将深入探讨如何组合 MCP 工具,实现更加复杂的自动化任务。敬请关注!