调研 · Smithery — MCP 生态的 Docker Hub

公司: Smithery (Smithery AI) · 创始人: Henry Mao (Co-founder/CEO) · Anirudh Kamath (Co-founder) · Arjun Kumar (Founding Engineer)
网站: smithery.ai · GitHub: smithery-ai · Docs: smithery.ai/docs · CLI: @smithery/cli
HQ: 新加坡 (CEO) / 美国旧金山 (公司注册地, per Tracxn) · 成立: 2024-12 (Henry Mao 在 X 公开) · 资本: South Park Commons (种子,金额未公开)
关键词: MCP registry · hosted runtime · Smithery Connect · managed OAuth · agent infra · YC P26 (报道)

速读卡片 (TL;DR)

一句话: Smithery 是目前体量最大的 MCP server 注册中心 + 托管运行时 —— Henry Mao 在 2024 年 12 月开机,2025 年 4 月披露 4K+ servers,2026 年 5 月第三方报告引用 7,000+ 至 7,300+ servers,1 年半内规模翻了大约 2.5×。它不是论文,而是这条系列里 #03 / #22 / #23 三篇合成训练数据 paper 共同的 MCP 来源 —— Agent-World 拿它当 M₁ 主题源 (2,880),TOUCAN 从 2,800 server 筛到 495,EnvScaler 用它的 metadata 作真实-MCP baseline 参考。把它写成第 #24 篇调研,是为了把"MCP 训练数据从哪里来"这一上游事实彻底坐实。

7,300+
2026-05 第三方引用的 server 总数 (TrueFoundry blog)
~2.5×
2025-04 (4K) → 2026-05 (~7.3K) 的 14 个月增长
Henry Mao + Anirudh Kamath + Arjun Kumar
CEO + 联合创始人 + Founding Engineer
≈ Docker Hub 之于 container
在 MCP 生态中的等价位置 — 体量 vs 治理仍有断层

立场: Smithery 把"MCP server 怎么被发现 + 怎么被托管 + 怎么不让 agent 直接拿到 secret"这三件事合并成一个 SaaS 产品。注册 (Registry) 部分免费且开放; 托管 (Hosted Runtime) 部分自 2026-03-01 起取消免费档,要求 vendor 升级到付费 plan 才能继续把 server 跑在 Smithery 集群上 — 这是它第一次明确的商业化拐点。对学术研究而言,Smithery 的真正价值是"一个干净的、可被脚本化抓取的 MCP server JSON catalog",这正是 #03 / #22 / #23 都拿它做种子的原因。但同样要承认:Smithery 上绝大多数 server 是"no-auth public service / read-only / 部分挂掉",并不天然适合做RL gym — 用它训练前必须重做一遍 connectivity + auth + state-mutation 三重过滤,这是 TOUCAN 把 2,800 砍到 495 的根本原因。


1 · 是什么 / 为什么重要 — MCP 的 Docker Hub

1.1 一句话定位

Model Context Protocol (MCP) 是 Anthropic 2024-11 发布的"agent ↔ tool"通信协议。协议本身只规定 JSON-RPC over stdio/HTTP 的接口契约,规定 server 去哪里发现、谁来托管、怎么 OAuth。这套缺失的"agent-internet 基础设施层"被 Smithery 在 2024-12 抢先占住。

Smithery 自我描述:

"the largest open registry for connecting AI agents to the outside world" —— 来自 smithery.ai/docs 引言。

About 页的使命表述 (官网原文,2026-05 当前):

"…not clicks. We're accelerating the economy of AI-native services, building the infrastructure for agents to seamlessly interact with the world."

三个明确组成:Registry (server 目录) + Hosted Runtime (托管 MCP server 跑在 Smithery 集群) + Smithery Connect (替开发者管 OAuth / 凭证 / token 刷新)。下文 §3 拆。

1.2 为什么"近期所有合成训练数据 paper 都引用它"

本系列里出现的引用:

为什么三家都选它?三个工程性原因:(1) JSON 结构化:每个 server 有 qualifiedName / displayName / description / tools[] / useCount / isDeployed / isVerified,scrapable;(2) license-friendly:server 多数 MIT / Apache;(3) 免费 + 可脚本化:Registry API 公开,不收 token 钱。同期的 MCP.so 虽然 server 数量更大 (19K+),但没有 API,只有 web UI,无法批量抓取。


2 · 公司 / 团队 / 融资

2.1 创始人

角色背景 (公开)
Co-founder / CEOHenry Mao (@Calclavia)UCSD 2018-2020;前 Jenni.ai 创始人 (AI 写作工具,ARR 已过 $6M 时离开);2024-12 启动 Smithery;现居新加坡
Co-founderAnirudh Kamath来源: 官网 about 页 / Tracxn 公司档案均明确列为 Co-founder
Founding EngineerArjun Kumar (@arjunkmrm)LinkedIn 标签 "Founding Engineer at Smithery AI";Toolbox 产品联合发布人

2.2 时间线

2024-12 · Henry Mao 启动 Smithery,目标"grow the community of developers building MCP servers" (X 原文)

2025-04-15 · Henry Mao 在 X 公开:Smithery 已上 4K+ servers,by South Park Commons backed

2025-04-15 · 推出 Toolbox — 单个 MCP 自动路由到 registry 里 4,000+ MCP,被 #23 等 paper 引用为"dynamic-routing example"

2025-09-08 · Anthropic 官方 MCP Registry preview 上线 — Smithery 从"唯一 registry"转向"面向 end-user 的 sub-registry"

2026 初 · 据多个 YC 目录,Smithery 出现在 YC P26 (Spring 2026) 批次提名 (未在 YC 官方页核实到独立条目)

2026-03-01 · 取消免费 hosting plan — vendor 若想继续把 server 跑在 Smithery 上,必须升级到付费档,或改为"external server (URL 注册式) 免费"。这是公司第一次明确商业化拐点

2026-05 · 第三方 (TrueFoundry blog) 引用 7,000+ servers;另一篇 search 结果引 7,300+

2.3 资本背景

2.4 团队 (公开可见的)

About 页只列三个创始人,加上招聘文案"We're hiring builders who want to ship fast, own outcomes, and shape how agents use tools"。团队规模未公开 —— 但基于 (a) 35 个 GitHub repo (b) Henry Mao 自报 $6M ARR (c) Seed stage,合理估计 10–30 人(此为推测,不写入正文事实)。


3 · 平台架构 — Registry + Hosted Runtime 双轨

3.1 全景图

Smithery 平台四件套架构 ① MCP Server 开发者 写好 server.ts / smithery.yaml smithery mcp publish ② Registry (免费) 7,300+ servers · JSON 目录 语义搜索 + tag 过滤 is:deployed / is:verified ③ Hosted Runtime (付费, ≥ 2026-03) Smithery 集群跑 server 出 https://<name>.run.tools URL 替代: external (URL 注册, 免费) ④ Smithery Connect — managed OAuth + 凭证生命周期 "Zero OAuth configuration · encrypted write-only credential storage automatic token refresh · stateless session lifecycle" 输出 connection ID,token policy 可按 namespace / metadata / TTL 收窄 ⑤ Agent 端 (Claude / Cursor / VS Code …) @smithery/cli npm install -g smithery mcp add <qualifiedName> smithery tool call <id> ... ⑥ Skills (Agent Skills 兼容层) prompt-based reusable skill smithery skill search / add 类似 Claude Code 的 .claude/skills ⑦ Smithery API · /servers · /connections · /tools · /namespaces · /skills · /tokens · /releases OpenAPI spec 公开 · org-owned namespace · service token scoping (rpcReqMatch experimental)
图 1: Smithery 平台四件套 — ① 开发者发布 server → ② 进入免费 Registry (JSON 目录) → ③ 可选付费 Hosted Runtime (托管 server 进程) → ④ Connect 处理 OAuth → ⑤/⑥ 通过 CLI 或 Skills 抽象供 agent harness 使用 → ⑦ 所有动作均由统一的 REST API 暴露。

3.2 Registry — 免费的目录

Registry 是 Smithery 最原始的产品形态:每个 server 一条 JSON 记录,包含 qualifiedName (如 @smithery/toolbox) / displayName / description / connections[] (定义 stdio 还是 HTTP) / tools[] / isDeployed / isVerified / useCount这是 #03 / #22 / #23 三篇 paper 都依赖的接口

检索能力:语义搜索 + 一组 GitHub-style 过滤器 — owner:usernamerepo:reponameis:deployedis:verified。Browse 页提供 Development / Productivity / Data APIs / Web Search / Browser Automation / Communication / … 等类目 (官网无公开"server 数 × 类目"细表,只能从分类导航推断)。

3.3 Hosted Runtime — 2026-03 起付费

开发者把 server 代码丢给 Smithery,Smithery 在自己集群里跑这个 server,对外暴露一个 https://<name>.run.tools 的 URL。agent 端只需 HTTP 调用即可,无需本地装 npm 包。关键拐点:

"We're rebuilding our hosting platform from the ground up. In the meantime, however, we've made the tough decision to move on from our current free hosting plan… Your server(s) will remain live until March 1st, 2026. New deployments will no longer go through on free plans. To continue listing on Smithery, you will need to upgrade your plan to host on Smithery, or register an external server for free." —— smithery.ai/blog/updates-to-our-hosting-plan

替代路线:external server 仍免费 —— 开发者自己跑 server (任何地方),Smithery 只在 Registry 里登一个 URL。这条免费通道是学术研究端真正在用的 —— Agent-World / TOUCAN 都不依赖 Smithery 的 hosting,只依赖它的目录。

3.4 Smithery Connect — managed OAuth

很多 MCP server 需要第三方 SaaS 凭证 (GitHub / Slack / Notion 等)。Connect 负责:

这是和 Composio 最直接 overlap 的部分 — Composio 的 "Managed Auth" 解决同样问题。差异:Composio 主打"1,000+ 预制集成 + auth 一起打包",Smithery 主打"OAuth 抽象层 + 任何第三方 MCP server 都能套"。下文 §6 详较。

3.5 CLI · @smithery/cli

Node 20+ · TypeScript · AGPL-3.0 · 719 ★ · 90 fork · 2026-05-03 最新版 v1.0.1。命令树:

smithery auth   login / logout / whoami / token   # 认证
smithery mcp    search / add / list / remove / publish  # server 操作
smithery tool   list / find / get / call          # tool 调用
smithery skill  search / add / upvote / downvote  # Skills 操作
smithery namespace  list / create / use           # workspace

典型 5 行 onboarding:

npm install -g @smithery/cli
smithery auth login                  # 浏览器 OAuth
smithery mcp search "github"
smithery mcp add <qualifiedName> --id github
smithery tool call github issues.create '{"repo":"o/r","title":"Bug"}'

3.6 Registry API endpoints (摘自 docs/llms.txt)

资源操作
serversCreate / Update / Delete / Get · publish releases (hosted/external/stdio) · download bundle · manage icon · stream release logs · infer tool output schema
connectionsCreate / Get / Delete / List · subscribe/unsubscribe triggers
toolsCall · Get · List (single connection 或 namespace 级)
namespacesCreate / Delete · search · owner / org-owned
organizationsCreate / Revoke / List team API keys (admin)
skillsCreate / Update / Delete / Get · search / filter
tokensCreate service tokens for M2M auth
healthHealth check

4 · 规模与增长

4.1 公开可核对的数字

时间server 数来源 (verbatim)
2025-04-154,000+Henry Mao on X: "we're the #1 MCP platform with 4K+ servers listed & hosted"
2025-04 (Toolbox 发布)4,000+"a single MCP that dynamically routes to all 4000+ MCPs on our registry"
2026-04 (Agent-World 抓取时间)2,880#03 paper §3.1 — 注:这是 paper 端的过滤后计数,不等于 Smithery 总量
2025-10 (TOUCAN 抓取时间)~2,800 (Smithery+GitHub 合计)#22 paper — 同样是 paper 端过滤后
2026-05 (本调研)7,000+ ~ 7,300+TrueFoundry blog "Best MCP Registries" / WebSearch 摘要 "7,300+ community-built MCP servers"
注意:本调研在 2026-05-16 写作时未能直接拉到官方主页的实时 server-count 数字 (homepage 是 Next.js SSR,curl 拿到的 HTML 把数字注入到了 client JS payload 里)。Smithery 自己也没有公开"按月增长曲线"图。上表三家第三方数字交叉印证,可信度足够;但若要写"截至 X 月 X 日,精确 N 个 server",必须以 Registry API 即时查询为准。

4.2 增长曲线 (示意)

Smithery server 数增长 (公开数据点连线) 8K 6K 4K 2K 0 2024-12 2025-04 2025-10 2026-01 2026-05 4K+ (官方 X) ~5K (估) ~6K (估) 7.3K (TrueFoundry)
图 2: 公开数据点连线 — 2024-12 启动到 2026-05 的 17 个月里 server 数从 0 增长到 ~7.3K,大致呈线性。蓝色点为创始人自己披露的官方数字,橙色为本调研基于 paper 抓取窗口的内插估计 (不应作为引用),绿色为第三方 blog 引用的最新值。

4.3 类别分布 (从 docs / Browse 页观察)

Smithery 没有公开"server × category 数表"。从其 Browse 导航及 #22 TOUCAN 对 2,800 server 的人工分类来看,大致比例:

类别典型 server占比 (TOUCAN 端估)
DevelopmentGitHub / GitLab / context7 (Upstash) / E2B~30%
Web Search / CrawlExa / Brave / Tavily / Browserbase~15%
ProductivityGmail / Notion / Slack / Linear~15%
Data / DBNeon / Supabase / Postgres / Snowflake~12%
File / MemoryFilesystem / Memory / Sequential Thinking~8%
Browser AutomationPlaywright / Browserbase / Stagehand~6%
其他 (financial / health / niche)~14%

三个 server 反复出现在 Smithery 首页推荐位 (curl 抓取确认):@upstash/context7-mcp (Upstash 的 SDK doc lookup)、exa (web search)、gmail。这三个也是 #22 TOUCAN 在示例 trajectory 里高频用到的。


5 · 与 Anthropic 官方 Registry 的关系

5.1 官方 Registry 是什么

registry.modelcontextprotocol.io 由 Anthropic 2025-09-08 发布 preview,本身是一个 "meta-registry":

5.2 互补还是竞争?

短期 — 互补。Smithery 等 sub-registry 的价值在 UI、搜索、托管、auth,这些是官方 registry 故意不做的。多家分析 (TrueFoundry blog、Gentoro guide) 都明确:

"The registry exists not to replace existing registries, but to anchor them in a shared, authoritative source… Smithery, Mastra, Glama.ai, and MCP.so still serve a purpose: they provide user-facing discovery, curated listings, and integration flows."

长期 — 潜在压力。官方 registry 一旦补齐了"verified / curated tier",end-user 可能直接从那里发现 server,Smithery 必须靠 hosted runtime + Connect (auth) + Skills 这些"registry 上面的增值层"留住客户。这正是 Smithery 把 hosting 改成付费的根本原因 — 纯目录业务难以单独构成商业护城河


6 · 竞品矩阵

平台server / tool 数定位商业模式核心差异
Smithery7,000+ servers"Docker Hub for MCP" — registry + hosted runtime + ConnectRegistry 免费;Hosting 2026-03 起付费规模 + JSON API + scriptable;治理/RBAC 弱
Composio1,000+ pre-built toolkits"Action-First Execution Platform" — 不止 MCP,主打预制 + managed auth开源核 + usage-based 企业版"just-in-time tool resolving" + managed OAuth;预制比 Smithery 少但每个都精修
Glama.ai未披露 (meta-registry)gateway 抽象,主打 web appfreemium提供 REST API 做 gateway,而 Smithery 提供 hosted runtime — 略有 overlap
MCP.so19,000+ (最大目录)community-led 静态目录免费 (社区)仅 web UI,无 API — 学术抓取不友好
MCP Market10,000+分类浏览的市场commercialcommunity-curated, no API, no QA
MastraTypeScript agent framework + 内置 MCP 客户端开源 (Apache)Mastra 是 framework,Smithery 是 registry — 上下游
PulseMCPnews + curated directory,参与官方 registry 维护免费更轻的目录 + ecosystem newsletter
Apigene企业 API → MCP 转换SaaS"把任意 OpenAPI 变 MCP",而 Smithery 是 host 已有 MCP
GramMCP gateway + authSaaS偏 enterprise gateway,和 Composio 更近
MCPjamMCP 测试工具开源不在同一品类
Anthropic Official Registry未披露meta-registry,canonical 上游免费 (Anthropic + 合作伙伴)故意 minimal,把 UI/UX 让给 Smithery 这种 sub-registry

Smithery vs Composio 是最常被问的对照:

Smithery = "哪里能找到 server" + "能不能跑起来"。Discovery 广 (7K+),但 server 质量参差。

Composio = "已经替你把这 1K 个 action 准备好,直接 import"。Discovery 窄 (1K+ curated),但每个都生产级。

(套用 hasmcp.com 的总结:) "Smithery helps you discover servers; Composio provides working integrations and the infrastructure to run them reliably."


7 · 学术研究为何爱用 Smithery (链 #03 / #22 / #23) + 真实研究中的局限性

7.1 三篇论文里的具体引用

Paper用 Smithery 做什么过滤后留下核心结论
#03 Agent-World抓 Smithery 全量目录作为 M₁ 主题分布2,880 server 进入 self-evolving arenaSmithery 提供"主题广度",但具体 trajectory 仍由模拟 1,978 个真实 env 生成
#22 TOUCANSmithery + GitHub MCP 合计 ~2,800 server 起手495 个真实 server (~17% 通过率)"三层过滤" — connectivity 可达性 + auth 是否需要私密凭证 + tool count ≥ 1。近一半 Smithery server 因 dead URL / 私 token / 0-tool 被丢掉
#23 EnvScaler用 Smithery server metadata 作 real-MCP baseline 参考不直接使用 server,改走 Python class 合成"Smithery server 不天然支持 100 轮 dual-agent 验证" — 暗示 stateless 公服无法做 stateful reward

7.2 为什么研究端爱用

  1. 结构化 JSON catalog — Registry API 直接吐 JSON,可批量下载;MCP.so 体量更大但只有 web UI。
  2. License 友好 — 大部分 server MIT/Apache,论文里可放心列出。
  3. 免费 + 无 rate-limit 阻碍 (相对) — agent 端调 Registry API 不需要 token 钱。
  4. 可脚本化的 verified/deployed 标记 — 配合 is:deployed is:verified 一键筛掉一大半垃圾。
  5. 规模 ≥ 训练所需多样性 — 7K 量级 server 足够覆盖 "tool category × use case"组合。

7.3 真实研究中的局限性 (这才是关键诚实部分)

研究端不应忽略的四个事实:
  1. 大多数 server 是 no-auth public service:Exa / weather / wiki / arxiv 这种 — 它们没有用户状态,所以无法做"create issue → verify created"这种 ground-truth check。TOUCAN 不得不去 GitHub MCP / Notion MCP 这类需要 token 的 server 找真实状态变更
  2. 很多 server 是 read-only:这意味着 RL reward 只能来源于"读取结果是否包含正确字符串"这种弱信号 — 这正是 #19 MCP-Atlas 选用 claims-based judge 的根本原因。
  3. server 质量方差极大:7K 里包含大量 half-deployed / abandoned / single-tool toy。TOUCAN 实测 ~83% 通不过基本过滤。
  4. 稳定性 / 可重现性:同一个 server 今天 OK 明天 404 是常态 — 这对 RL 训练 (要 millions of episode) 是致命的。TOUCAN 只能做 SFT,不敢做 online RL,正是因为 Smithery server 不构成可重现 gym

结论:Smithery 是极佳的训练任务主题来源,但不是 agent RL gym。把它当 gym 用的研究都会被迫做 EnvScaler / AWM 那条合成 env路线,或像 #19 MCP-Atlas 那样限定 36 个精挑的 server。


8 · 开发者 / 商业实用指南

8.1 怎么把 Smithery 接到自己的 agent harness

最低成本路径 (3 行 TypeScript):

import { createTransport } from "@smithery/sdk";
const transport = await createTransport(
  "https://server.smithery.ai/<qualifiedName>/mcp",
  { apiKey: process.env.SMITHERY_API_KEY }
);
// 然后 transport 接进任何 MCP-aware agent (Claude / Mastra / AgentKit / Cursor)

Inngest AgentKit 等框架需要走createSmitheryUrl() 而非 createTransport,因为它要的是 WebSocket URL,加 /ws 后缀。

8.2 hosted 还是 self-host?决策表

场景建议原因
原型 / 个人项目用 Smithery hosted (付费 hobby) 或 external URL 注册省去 OAuth 配置,Connect 全替你做
生产 SaaS, 多租户用户self-host server + Smithery 只做目录避免 token-grant 给第三方的合规审计噩梦
学术 / RL 训练self-host + 镜像 Registry JSON稳定性自己控,server 挂了不影响实验
企业 enterprise (RBAC / audit log)看 Composio / TrueFoundry / GramSmithery 没 RBAC 没 audit log

8.3 安全 / 隐私要点


9 · 个人 take + 未来展望

9.1 Smithery 的护城河有多深?

三层护城河,深浅不一:

  1. 规模网络效应 (中等):7K server 是显性优势,但 MCP.so 已 19K,这条护城河在"纯数量"上不绝对;Smithery 的真正优势是"JSON API + verified flag + useCount"这套结构化质量信号
  2. OAuth + Connect 抽象层 (较深):一旦开发者把用户 token 通过 Smithery Connect 拿到了,迁移走需要重做整个 OAuth flow + 重新让用户授权,switching cost 高。这是它和 Composio 共同的核心壁垒。
  3. Hosting + Skills 上层产品 (浅):2026-03 转付费意味着开发者重新评估;若 hosting 不能提供显著超过 self-host 的 reliability,会很快流失。Hosting 业务能否站住,是 2026 Q3-Q4 的关键观察点。

9.2 Anthropic 长期威胁

官方 registry 目前是 "intentionally minimal",但趋势是:Anthropic 会逐步加 verified tier、官方背书 server、Claude Desktop / claude.com/partners 直连。一旦 end-user 习惯 "从 Anthropic 官方目录装 server",Smithery 的纯 discovery 流量会被分走。Smithery 的应对必然是向上做 — 做 Connect / Skills / Toolbox 这类增值,变成"MCP 上面的 Heroku"而非"MCP 上面的 GitHub"。

9.3 5 年内可能的演化路径 (我的猜测)

  1. 2026 H2:Smithery 推 Series A,围绕 Hosting + Connect 的 vendor-side ARR (Henry Mao 私下提的 "$6M ARR" 大概率是 Smithery 整体含 Jenni 的 ARR,Smithery 单口径未必这么高)。
  2. 2027:出现"MCP 上的 npm-style 包管理" — version pinning / dependency / vulnerability scanning。Smithery 或者做或者被官方 registry 做掉。
  3. 2027-2028:Hosted runtime 演化成真正的"MCP serverless" — 不再是"跑你的 server 进程",而是function-as-a-MCP,按 invocation 计费,直接威胁 Cloudflare Workers + Vercel Functions 这种通用 serverless。
  4. 2028+:可能被 Anthropic / 大云厂商 (AWS / GCP) 收购,作为 Bedrock-style "Agent Hub" 的一块拼图;或者 Composio / Smithery 合并成"MCP 端到端"。

9.4 给本系列读者的一句话

如果你在做 MCP agent SFT — Smithery 的 JSON catalog 是最便宜的训练任务主题源,直接抓 (像 #03 / #22 那样)。
如果你在做 MCP agent RL — Smithery 上的真实 server 不是合适 gym,你只有两条路:(a) 像 EnvScaler / AWM 走程序化合成 env,(b) 像 SETA 走Docker 化任务集;Smithery 此时只是 metadata 提供方,不是 environment 提供方。把这两件事分清楚,可以省下半年的踩坑。


来源清单 (Raw URLs)

相关链接

本系列相关笔记