公测期 · 全部能力免费开放

全球边缘的
多租户 Agent 平台

一把 API key、一条 HTTP 请求,得到一个会搜索、能看图、有记忆、读得懂你私有资料、还能开口说话的 Agent。Rust 编译成 WASM,跑在 Cloudflare 全球边缘——请求落在离你最近的节点,冷启动趋近于零。

全球边缘Cloudflare 网络就近落点
SSE 原生逐 token 流式输出
仅存哈希key 只留 sha256
注册即用一分钟开租户
meow — /v1/agent
$ curl -N https://meowbot-cloud.workers.dev/v1/agent \
  -H "Authorization: Bearer sk-meow-…" \
  -d '{"text":"今天上海天气怎么样喵?"}'

event: tool_call
data: {"name":"web_search"}
event: kb_refs
data: {"refs":[{"title":"出行手册","seq":3}]}
event: llm_delta
data: {"text":"今天上海多云,"}
event: llm_delta
data: {"text":"二十六度,挺舒服的喵。"}
event: llm_end 
# pip install meowbot —— 多语言 SDK 之一
from meowbot import NovaMeow

bot = NovaMeow("https://meowbot-cloud.workers.dev", "sk-meow-…")
reply = bot.chat("今天上海天气怎么样喵?")
print(reply)
# → 今天上海多云,二十六度,挺舒服的喵。
// 浏览器 / Node 原生 fetch,逐 token 读 SSE
const res = await fetch("https://meowbot-cloud.workers.dev/v1/agent", {
  method: "POST",
  headers: { Authorization: "Bearer sk-meow-…" },
  body: JSON.stringify({ text: "今天上海天气怎么样喵?" }),
});
for await (const chunk of res.body.pipeThrough(new TextDecoderStream()))
  render(chunk); // 逐 token 上屏
// meowbot-sdk:no_std 核心 + 各语言薄壳
use meowbot_sdk::NovaMeow;

let mut bot = NovaMeow::new("https://meowbot-cloud.workers.dev", "sk-meow-…");
let reply = bot.chat("今天上海天气怎么样喵?")?;
println!("{reply}");
// → 今天上海多云,二十六度,挺舒服的喵。
8 大能力面对话 · RAG · 应用 · 设备 · 语音 · 观测 · 会话 · 配置
全球边缘Cloudflare 网络,请求就近落点
~0 冷启动Rust→WASM 跑在 V8 isolate
5 语言 SDKRust · C · C++ · Python · WASM
01

不只是聊天,是一整个智能后端

从流式对话到私有知识、从语音闭环到设备激活——同一把 key 之下,组合出你要的 Agent。

POST /v1/agent · SSE

会用工具、能看图、有记忆的流式 Agent

原生 SSE 逐 token 输出,事件契约稳定。内置联网搜索 / 报时 / 计算器治幻觉,请求带图即看图作答,超长对话自动折叠摘要——上下文不爆、关键事实不丢。

  • tool_call / kb_refs / llm_delta 事件流,SDK 与 curl 同一套契约
  • images[] 传 URL 或 base64,视觉与文本同一条 API
  • 滚动摘要自动压缩历史,零参数
帮我看看这张图是什么猫,顺便查下今天上海天气喵
tool_call · web_search这是一只英国短毛猫~ 今天上海多云二十六度,出门挺舒服的喵。
Vectorize + bge-m3

读得懂你私有资料的 RAG 知识库

上传文档,对话时自动检索并标注引用(kb_refs)。边缘原生向量检索,bge-m3 千维嵌入,租户间硬隔离——你的资料只属于你。

  • 边缘 Vectorize 向量库,无自管数据库
  • 命中自动注入上下文 + 回话标引用来源
  • App 可绑定专属知识库,一分身一脑
检索:「报销流程怎么走?」
员工手册 · 第 4 章 报销0.92
财务制度 · 附录 B0.87
/v1/tts · /v1/asr · /v1/voice

能开口说话的语音闭环

音频进、智能音频出:Whisper 边缘转写,Agent 思考,TTS 合成回声——一趟 API 闭环。流式 TTS 首块约 1.5 秒出声,适合实时对话与硬件设备。

  • ASR 中文可用,音频字节直接 POST
  • 激活码换设备 key,设备说话即对应分身
  • 心跳与最后在线一目了然
asr → agent → tts · 一趟闭环
02

一个平台,一整套 Agent 能力

以下能力全部已在生产环境上线

从对话到知识、从语音到设备——你需要的智能后端,在同一把 key 之下。

核心对话
POST /v1/agent

流式 Agent API

原生 SSE 逐 token 输出,打字机体验;事件契约稳定,SDK / curl / 浏览器直连皆可。

tool_call

工具调用

内置 web_search 联网搜索、get_time 报时、calculator 精确算术——治大模型的时间与算术幻觉。

images[]

视觉理解

请求里带图片 URL 或 base64,Agent 看图回答;与文本对话同一条 API。

滚动摘要

记忆压缩

超长对话自动把最旧轮次折叠进摘要,关键事实不丢、上下文不爆,无需任何参数。

知识与应用
Vectorize + bge-m3

RAG 知识库

上传文档,对话时自动检索并标注引用(kb_refs)。边缘原生向量检索,租户间硬隔离。

/v1/apps

应用模型

一个 App = 一个可发布的喵喵分身:绑定 prompt / 模型 / 工具 / 知识库,签发 App 专属 key。

persona_id

人格库

控制台可视化管理多套人格,API 按 id 引用、运行时切换,租户间完全隔离。

BYO Provider

自带模型通道

接入你自己的 OpenAI 兼容端点,key 经 AES-256-GCM 加密落库;主通道故障自动回落,且明着告诉你。

语音与设备
POST /v1/tts

语音合成 TTS

同步一次出整段 mp3;流式端点边合成边吐 PCM,首块约 1.5 秒出声,适合实时对话。

POST /v1/asr

语音识别 ASR

音频字节直接 POST,Workers AI Whisper 边缘转写,零外部依赖,中文可用。

POST /v1/voice

语音对话闭环

音频进 → ASR → Agent → TTS → 智能音频出,一趟 API 完成;tts 降级时文字仍在。

激活码 → 设备 key

设备管理

一次性激活码换设备专属 key,绑定 App = 设备说话即该分身;心跳与最后在线一目了然。

平台与运维
Bearer key

多租户与限流

注册即开租户;key 只存 sha256 哈希、明文仅签发时显示一次;每把 key 可配独立限流。

/v1/logs

请求日志观测

每次调用的端点 / 状态 / 时延 / 错误分类可查(只记元数据,绝不记对话内容),p50 / p95 一眼看清。

/v1/sessions

会话管理

列出 / 删除会话,删即清 Durable Object 记忆;控制台可视化查看每会话历史。

/v1/export · import

配置可移植

一键导出人格 / 应用 / 设置为 JSON,换环境原样导入复现;绝不导出任何密钥。

03

为边缘而生的架构

一个 Worker,零运维面
RUST → WASM

原生性能内核

Agent 内核用 Rust 写就,编译到 WebAssembly 跑在 V8 isolate——无容器、无冷启动惩罚。

DURABLE OBJECTS

强一致会话

每个会话一个 Durable Object 单例,多轮历史与摘要强一致,按「租户:会话」命名空间隔离。

D1 · KV · VECTORIZE

边缘持久化

租户 / key / 人格 / 应用落 D1,限流走 KV,知识库向量进 Vectorize——读写都在边缘,无自管数据库。

GLOBAL EDGE

Cloudflare 全球网络

同一份部署服务全球——请求就近落点,从个人项目到大流量,不改一行代码。

04

定价

公测期间,所有能力免费
公测进行中
FREE
免费
公测期全部能力开放,注册即用
  • 流式 Agent API + 全部内置工具
  • 视觉 · 记忆压缩 · 人格库
  • RAG 知识库 · 应用模型 · BYO 通道
  • TTS / ASR 语音 + 设备管理
  • 多租户隔离 · 用量看板 · 请求日志
立即开通 →
即将上线
PRO
敬请期待
公测结束后推出,面向生产负载
  • 更高配额与速率上限
  • 面向团队的能力规划中
  • 定价方案将在公测结束前公布
尚未开放

公测期间不收取任何费用;Pro 档具体权益与价格以正式公布为准。

一分钟,给你的产品接上一只会思考的喵

注册开租户、签一把 key、发第一条 /v1/agent 请求——公测期全部能力免费。