跳转到主要内容AI 发展的两条路线
如果你关注 AI 关注 agent,那么你一定要关注 MCP,一定要好好理解它,一定要多用它。AI 的发展有两条非常明确的路线,我之前在社群里说过:
- 掌握更多的信息
- 控制更多的工具
两年前的大模型,它的信息来源只有训练时候的数据,以及推理的时候我们告诉它的东西。后来我们给它加上了联网搜索,让它能获得更广阔更及时的信息。我们给它加上了 RAC 技术,加上了知识库,让它能获得垂直领域那些不外传的信息。
但这些还不够,因为都是文本信息,于是我们又加上了多模态,现在连图片它都能理解了。你看所有这些发展都符合我刚才说的第一条路线:掌握更多信息。
但是光有信息还不够,要改变世界影响世界,你手里头还得有工具。这个就是第二条路线了。我认为 MCP 是第二条路线的关键,有了 MCP,你手里的 AI 就从功能机进化到了智能机。
MCP 实际演示
回到今天的主题:MCP。老规矩,我先演示再解释。
屏幕左边是 Obsidian,一个笔记应用。为了演示,我新建了一个库,放了三篇之前的视频脚本作为笔记。屏幕右边是 Client,它是一个 AI 插件,编程能力非常强。如果你的主力是 VSCode,那一定要用它。
那么我想给大家看的是,通过 Obsidian MCP(你先简单理解成就是一个接口了),像 Client 这类的 AI 工具,可以直接读取和修改 Obsidian 里面的笔记。
基础功能演示
咱们先从最简单的开始,我问 Client 库里都有哪些笔记。
接到请求后,Client 看了一圈环境,发现 Obsidian 跟一个 MCP 服务器连在了一起,于是他决定通过 MCP 服务器,调用 ListNodes 这个工具,去查询都有哪些笔记。在 Response 里边,MCP 服务器把查询到的信息返回给了 Client,然后他给出了最终的答案。
跟查询库里都有哪些笔记一样的原理,Client 还可以通过 MCP 服务器读取笔记的具体内容。我问他 “这篇笔记的主要内容是什么”,这时 Client 会使用读取笔记的工具,把一千多字的内容全部提取之后,他对内容进行总结,然后给出最终的答案。
与之前方法的对比
大家如果有印象的话,应该记得我之前出过两期视频,都是关于 Cursor 对 Obsidian 笔记的修改。那这个做法的前提是,Cursor 要打开 Obsidian 存放在本地的笔记仓库。但是并不是所有的 AI 工具都有这样的条件,有这样的能力去调用整个本地的笔记仓库的。这个时候就需要 MCP 服务器,它作为一个通用的接口去连接两端。
多 MCP 服务器的应用
我刚才演示的只连接了一个 MCP 服务器,其实为了完成一项任务,AI 可以去连接多个 MCP 服务器,调用多个工具。
我这边再演示一个例子,这是 OpenAI 官网的文章,关于 GPT 4.5。
我把链接给到 Client,希望他能把文章的内容给我扒下来。这时 Client 发现,还有 Tavli 的 MCP 可以连接。
Tavli 是一个专门为大模型优化过的搜索引擎,它的 MCP 里面有一个提取网页内容的工具。使用这个工具,Client 顺利把网页内容给扒了下来,然后他刷新和总结所有的信息,最终给出很清晰的回答。
接着我给出第二条指令:把这份 Summary 作为新笔记,存进 Obsidian 里面。
你看他调用 Obsidian MCP 里面的工具,开始创建笔记。中间遇到了一个格式上的问题,主要是特殊制服导致的解析错误,我猜是中文的标点问题。好在 Client 很聪明,在第二次尝试的时候,他主动去规避了特殊制服,最后完成了笔记的创建。
通过刚才的演示可以看到,像 Client、Cloud 之类的 AI 应用,能够调用各种工具去完成更加进阶的任务,这个就是 MCP 的价值。
MCP 的价值与原理
这么说吧,MCP 就是 AI 的 USB-C 接口。
在 MCP 出来之前,AI 都是怎么调用工具的?通过 API 接口对吧。但是 API 有很大的局限性,其实不太适合 AI:
API 的局限性
- 不同工具的 API 都有各自的规范
举个例子,如果要调用一个天气预报工具,我就得按照它的格式要求,告诉它城市名称和日期,比如 “当时北京 0315”(也就是 3 月 15 号)。如果我要调用一个计算器工具,我就得按它的格式要求,告诉它数值和符号,比如 “1 加 2”。
市面上有海量的工具,AI 要知道要去满足每一个工具的要求,这是不现实的。这就好比有的设备是 USB-A 接口,有的设备是 Micro USB,有的设备是 Mini USB,那作为用户看到这一堆的接口,头都大了好吗。所以 AI 需要一套统一的规范,去统一所有的工具接口,就好比今天的 USB-C。
手机也好电脑也好,全都用这个接口,而且现在新的显示器,还支持用 USB-C 去接 MacBook,既能充电还能传输信号,连 HDMI 都省了。一根线走天下是大势所趋。
- API 关注的是数据的传输,而非数据的含义
就像刚才的例子,如果我问 “下周一北京天气怎么样” 或者 “1 加 2 等于几”,像这样的数据,API 没法接受,因为它不理解,也不需要去理解是什么意思,它的职责就是把数据拿过来,传过去。
MCP 的优势
但是 MCP 能搞定,它会把一切都打包好,给到大模型去理解。MCP 把用户的查询、工具的描述和参数,以结构化的方式传递给大模型,由大模型决定如何去处理。
市面上的 MCP 工具
目前市面上对 MCP 支持最好的工具:
- Cloud 的桌面版(毕竟 MCP 就是他们家提出的)
- Client(我刚才演示的)
我刚才演示的两个 MCP:
- Tavli 那个是现成的,你可以在 Client Marketplace 里收到,然后 Client 会去下载整个代码仓库,并且自动部署,非常方便。
- Obsidian 那个是我让 Client 自动生成的,过程中我没有写一行代码,就是一路点同意,几分钟就搞定了。
如果需要增加或者修改某个工具,也可以交给 Client 去完成。
自己开发 MCP
MCP 本身并不复杂,在 AI 编程工具的帮助下,你也可以开发自己的 MCP 工具,然后部署在本地或者云端,比如 Cloudflare。最内核的 Index 文档,你完全可以在 AI 的帮助下去理解清楚。
或者你就用现成的吧,市面上已经出现好多个 MCP 的导航网站了,比如 Smithereens。
在商业化方面,我看到市面上也出现了第一款收费的 MCP,可以帮助设计 UI。
今天 MCP 的价值正在得到越来越多人的认可,一切都在快速推进当中。就像我前面说的,如果 AI 只能调用有限的预先设置好的工具的话,那不就是以前的功能机吗?通过 MCP,AI 可以自由揭露海量的工具,从这一刻开始,AI 才从功能机时代迈入智能机时代。
OK,以上就是本期内容,那咱们下期见!