№ 03 · ENTERPRISE · LLM GATEWAY · v1.0

企业级
大模型网关

把企业已经买好的海外大模型账号(OpenAI、Anthropic、Google 等),部署成一套全公司能统一使用的企业级 AI 网关:一个入口、一套权限、一个看板、一次切换。我们不是 AI 算力转售商,也不是 API 中间商——账号、数据、服务器、网关代码全部归你所有。

预约方案沟通
异璧自己跑了一年

真实使用数据

这套网关不是 PPT 上的概念——异璧团队自己每天都在用。下面是我们内部一年的真实使用量级。

5–10亿
token / 天
内部团队 + 客户日常调用
100+
大模型接入
OpenAI · Anthropic · Google · Mistral · DeepSeek 等
租户
权限分级
团队 / 项目 / 员工各自的额度、权限、审计
1
部署完归客户
服务器 / 数据 / 代码 / 账号都是你的
什么情况下值得采购

团队月用量过线,PAYG 就明显贵起来

单看经济账:用最顶级模型(Claude / GPT / Gemini)的全员 pay-as-you-go 是一条随用量线性上涨的支出。Gateway 是一条固定月费。当公司月度 token 用量进入 10 亿(1B)量级,两条线就交叉了——再往上,Gateway 越用越省。

010 亿20 亿30 亿40 亿0¥2,500¥5,000¥7,500¥10,000月度 token 用量月度费用(人民币)PAYG 更便宜Gateway 越用越省PAYG · 员工各自开账号y = k × 用量Gateway · 月固定费 ≈ ¥2,500交点 · 10 亿 token / 月≈ ¥2,500 / 月(约 $370)
PAYG · 员工各自买顶级模型订阅 / 用各自 API,按用量计费 ——y = k × 用量
Gateway 月固定费 ≈ ¥2,500 · 含我方运维 ¥1,000 + 客户自购服务器 + LLM 订阅账号 ——y = a

上图为示意:水平线 = 你企业自有 subscription/seats + 服务器 + 我方运维的固定月成本;斜线 = 全员各自 PAYG 的线性月成本。交点位置随企业规模、模型组合、上下文长度浮动,10 亿是一个常见 break-even 阈值。
除了钱,还有 3 件事是 PAYG 模式拿不到的:统一权限(按部门/项目分配)、成本可见(谁花了多少做什么)、模型可切换(业务代码不动,模型一键切)。

什么情况下你该买这个

团队月度 token 用量已经接近或超过 10 亿,PAYG 账单越来越贵
员工各自开账号、各自付费,公司看不到也管不住谁在用什么
多部门、多项目,需要按组织维度分配额度和做成本对账
有合规 / 审计要求,需要调用日志和权限可追溯
用了多家厂商(OpenAI / Anthropic / Google),希望切换模型业务代码不动
有海外公司主体 + 海外账号,但没有 IT 团队专职运维 AI 基础设施
解决

三件事

员工各自注册账号、各自付费,公司看不见全公司统一入口,权限和成本可控
ChatGPT、Claude、Gemini 各用各的,切换麻烦一套 API,任意切换主流模型
AI 月底报销一堆,分不清是哪个部门花的部门 / 项目 / 个人维度的成本看板
适合的

什么样的企业

✓ 适合
  • 已经拥有海外公司主体 + 海外大模型账号的出海企业
  • 团队 10 人以上,员工已经在用海外 AI,但公司缺乏统一管理
  • 希望把 AI 使用情况可见、可控、可审计
  • 有 IT 负责人或运营管理员能配合配置和日常使用
  • 公司要做合规审计 / 财务对账 / 部门成本分摊
✕ 不适合
  • 还没有海外公司主体、海外账号(我们不代办这些)
  • 希望我们提供海外 AI 账号或算力(我们不卖账号)
  • 希望我们承诺账号永不被封、API 永不被限流
  • 没有 IT 配合、不愿意员工改变 AI 使用习惯
  • 对 AI / Agent 有强烈抵触抗拒情绪
两个独立产品

一次性部署 + 月度运维(可选)

网关搭建是一次性工程,1 周内交付完归你所有。 上线之后,是否订阅我们的月度运维由你决定——有专业 IT 团队的企业可以自己维护,没有的话由我们兜底。

产品 ① · 一次性SETUP

网关搭建与部署

1 周内完成现场调研 → 部署 → 模型接入 → 权限配置 → 管理员培训。交付完账号、服务器、网关代码、所有数据都归你所有,我们退出。

¥8,000 起200 人以内 · 5 模型 · 10 个 key
产品 ② · 月度订阅OPS

持续运维(可选)

上游 API 变更适配、新模型适配、配置调整、日常答疑、异常定位、月度报表——这些事我们替你扛。终止订阅后系统继续归你,无任何卡脖子环节。

¥1,000 / 月 起3 个月起订 · 12 月签约 9 折
产品 ①

网关搭建与部署 · ¥8,000 起

1 周以内,把企业 AI 网关装好、接好、配好。

交付内容 · 7 项

现场调研
工程师上门半天,梳理企业网络、组织架构、账号情况、权限诉求,输出配置方案。
网关系统部署
在客户服务器上部署企业级 AI 网关(基于成熟开源框架定制),数据库初始化、安全配置。
多模型接入
接入客户已有的所有海外大模型账号,统一 API 出口。5 个模型 / 10 个 key 在标准包内。
用户与权限配置
按部门 / 角色配置初始用户、权限矩阵、使用配额、模型路由策略。
监控与告警
基础监控大盘 + 告警通知(用量异常、错误率异常等)。
域名与 SSL
配置企业内部访问域名和 HTTPS。
管理员培训 + 操作手册
1 小时培训(系统概览 / 用户权限 / 配额 / 上游模型 / 异常处理)+ PDF 操作手册。建议 1-3 人,超过 3 人 +¥500 / 人。

交付节奏 · 1 周

1
现场调研
Day 1
工程师上门,半天
2
方案确认
Day 2
输出配置方案 + QA List,客户确认
3
部署 · 接入 · 配置
Day 3 – 5
部署、多模型接入、用户权限、监控配置
4
测试 · 验收 · 培训
Day 6 – 7
客户验收 + 1 小时管理员培训

价格 · 3 档

标准部署包¥8,000 起200 人以内团队 · 5 个上游模型 · 10 个 API key
复杂集成¥5,000 – 30,000SSO、AD / LDAP、HR 系统对接等,单独评估
超规模部署单独评估200 人以上、多区域、高可用集群

客户需要准备

海外大模型账号OpenAI / Anthropic / Google 等,客户自有
服务器一台 VPS:<50 人 2C4G50G · 50–100 人 4C8G100G · 100–200 人 8C16G200G
域名一个用于网关访问的域名
管理员1-3 名,接受培训后负责日常运营
组织架构部门、人员清单,提供给工程师做初始配置

服务器、域名、模型 API 费用由客户自行承担,云服务费、API 调用费由客户直接付费给上游,不经过我方。

产品 ② · 可选订阅

持续运维 · ¥1,000 / 月起

网关上线之后,真正的麻烦在长期运行里——OpenAI 改 API、Claude 出新模型、上游限速、配额调整、月度对账。

这些事单独看都不大,加起来就是一个不专职的 IT 同事会被烦死的工作量。我们的运维 scope 卡得很清楚——只解决「网关侧」的事。

包含什么 · 6 项

上游协议跟进
OpenAI / Anthropic / Google 等更新 API 格式或新增模型时,我们做兼容。
网关版本升级
系统版本升级、安全补丁、Bug 修复。
配置调整
增删改用户、部门、配额、模型路由等。
日常答疑
微信 / 钉钉群内工作时间响应,管理员有问题随时问。
异常初步定位
系统报错、用量异常时协助定位。
月度报表
用量、成本、错误率等月度数据汇总。

定价

月包
¥1,000/ 月
3 个月起订 · 工作日 9-18 群内 4 小时响应

非标增项 单独沟通定价:非工作时间紧急响应、月度配置调整超过 1 次的超频部分、7×24 全天候定制运维——这几件事单次成本难标准化,按实际情况评估。

不在运维范围内

上游账号被封、被限流客户自行联系 OpenAI / Anthropic 处理,我们配合接入新账号
服务器本身性能 / 硬件 / 宕机客户自行处理云服务商问题
客户网络问题(防火墙 / 带宽 / 运营商)客户自行解决
客户业务代码层面的 Bug客户开发团队负责
上游账号充值、付费员工自行操作
不在标品里 · 定制

自有本地算力?也能接进 Gateway

一些企业(金融、医疗、央国企、有合规约束的出海公司)有自己的 GPU 集群或本地推理服务,想把开源大模型(Llama、Qwen、DeepSeek、Mistral 等)和云端 API 模型一起接到同一个 Gateway。这件事我们能做,但不在标准部署包里——架构、网络、安全和 SLA 都需要单独评估。

混合云 / 本地大模型接入

统一入口同时接通:

  • 云端商业模型(OpenAI / Anthropic / Google / Mistral 等)
  • 本地开源模型(vLLM / SGLang / Ollama / TGI / TensorRT-LLM 推理服务)
  • 企业自部署的微调 / RAG / 蒸馏模型
  • 按敏感度路由:内部数据走本地、公开任务走云端

评估时我们需要了解

  • 本地模型部署方式(推理框架 / 显存规格 / 集群数量)
  • 预期并发与 QPS
  • 数据敏感等级与合规要求(私有部署 / 审计 / 加密)
  • 是否需要训练 / 微调 / RAG 流水线
联系销售评估
全局边界

我们做 / 不做

我们做

  • 在客户已有海外账号的基础上,搭建企业级 AI 网关
  • 接入客户已有的所有主流海外大模型
  • 配置用户、权限、配额、监控、审计
  • 培训管理员(1 小时 + PDF 手册)
  • 提供长期运维支持(可选)

我们不做

  • 不提供海外公司主体注册
  • 不提供海外大模型账号
  • 不卖 API 算力或 token
  • 不承诺账号永不被封 / API 永不被限流
  • 不代客户管理上游账号的充值与付款
  • 不解决客户自有服务器、网络、业务代码的问题
FAQ

常见问题