Skip to content

Tetrate Agent Router Service

Tetrate Agent Router Service 提供企业级的 AI 模型路由和管理服务,专注于安全性和可扩展性。

支持的模型

Tetrate 企业模型

  • tetrate-default - 默认企业模型
  • tetrate-premium - 高级企业模型
  • tetrate-secure - 安全增强模型

路由支持

  • openai/ - OpenAI 模型系列
  • anthropic/ - Anthropic 模型系列
  • google/ - Google 模型系列

配置方法

基础配置

config.yaml~/.bytebuddy/config.yaml 中配置:

yaml
models:
  - name: "tetrate-router"
    provider: "tetrate_agent_router_service"
    model: "tetrate-default"
    apiKey: "${TETRATE_API_KEY}"
    apiBase: "https://api.tetrate.ai/v1"
    roles: ["chat", "edit"]
    defaultCompletionOptions:
      temperature: 0.7
      maxTokens: 4096

多模型配置

yaml
models:
  - name: "tetrate-default"
    provider: "tetrate_agent_router_service"
    model: "tetrate-default"
    apiKey: "${TETRATE_API_KEY}"
    apiBase: "https://api.tetrate.ai/v1"
    roles: ["chat"]
    defaultCompletionOptions:
      temperature: 0.7
      maxTokens: 4096

  - name: "tetrate-secure"
    provider: "tetrate_agent_router_service"
    model: "tetrate-secure"
    apiKey: "${TETRATE_SECURE_KEY}"
    apiBase: "https://api.tetrate.ai/v1"
    roles: ["chat", "edit"]
    defaultCompletionOptions:
      temperature: 0.5
      maxTokens: 8192

配置字段说明

必需字段

  • name: 模型配置的唯一标识符
  • provider: 设置为 "tetrate_agent_router_service"
  • model: 模型标识符
  • apiKey: Tetrate API 密钥
  • apiBase: Tetrate API 端点

可选字段

  • roles: 模型角色 [chat, edit, apply]
  • defaultCompletionOptions:
    • temperature: 控制输出的随机性(0-1)
    • maxTokens: 最大令牌数
    • topP: 核采样参数
    • topK: 采样候选数量
    • frequencyPenalty: 频率惩罚
    • presencePenalty: 存在惩罚
  • requestOptions:
    • timeout: 请求超时时间(毫秒)
    • verifySsl: 是否验证 SSL 证书

环境变量配置

bash
# ~/.bashrc 或 ~/.zshrc
export TETRATE_API_KEY="your-tetrate-api-key"
export TETRATE_SECURE_KEY="your-secure-api-key"

获取 API 密钥

  1. 访问 Tetrate 官网
  2. 注册企业账户
  3. 导航到 AI 服务控制台
  4. 生成 API 密钥
  5. 配置访问权限和限额

使用场景配置

企业生产环境

yaml
models:
  - name: "prod-router"
    provider: "tetrate_agent_router_service"
    model: "tetrate-premium"
    apiKey: "${TETRATE_PROD_KEY}"
    apiBase: "https://api.tetrate.ai/v1"
    roles: ["chat", "edit", "apply"]
    defaultCompletionOptions:
      temperature: 0.3
      maxTokens: 8192
    requestOptions:
      timeout: 30000
      verifySsl: true

开发测试环境

yaml
models:
  - name: "dev-router"
    provider: "tetrate_agent_router_service"
    model: "tetrate-default"
    apiKey: "${TETRATE_DEV_KEY}"
    apiBase: "https://dev.api.tetrate.ai/v1"
    roles: ["chat"]
    defaultCompletionOptions:
      temperature: 0.8
      maxTokens: 2048

多区域配置

yaml
models:
  - name: "tetrate-us"
    provider: "tetrate_agent_router_service"
    model: "tetrate-default"
    apiKey: "${TETRATE_US_KEY}"
    apiBase: "https://us-west.api.tetrate.ai/v1"
    roles: ["chat"]

  - name: "tetrate-eu"
    provider: "tetrate_agent_router_service"
    model: "tetrate-default"
    apiKey: "${TETRATE_EU_KEY}"
    apiBase: "https://eu.api.tetrate.ai/v1"
    roles: ["chat"]

  - name: "tetrate-apac"
    provider: "tetrate_agent_router_service"
    model: "tetrate-default"
    apiKey: "${TETRATE_APAC_KEY}"
    apiBase: "https://apac.api.tetrate.ai/v1"
    roles: ["chat"]

故障排除

常见错误

  1. 401 Unauthorized: API 密钥无效或权限不足
  2. 403 Forbidden: 访问被拒绝,检查访问控制设置
  3. 429 Too Many Requests: 达到速率限制
  4. 502 Bad Gateway: 网关错误,检查端点配置
  5. 504 Gateway Timeout: 请求超时

调试步骤

  1. 验证 API 密钥和权限
  2. 检查网络连接和防火墙
  3. 查看审计日志
  4. 监控性能指标
  5. 确认端点 URL 正确

最佳实践

1. 安全性

  • 使用环境变量存储 API 密钥
  • 启用审计日志记录
  • 定期轮换 API 密钥
  • 使用加密连接
  • 实施访问控制

2. 性能优化

  • 配置适当的超时时间
  • 使用缓存减少延迟
  • 启用负载均衡
  • 选择最近的区域
  • 实施请求队列

3. 成本控制

  • 监控 API 使用量
  • 设置配额警报
  • 根据需求选择模型
  • 优化请求频率

4. 可靠性

  • 实施重试逻辑
  • 配置故障转移
  • 监控服务健康状态
  • 设置合理的超时
  • 记录错误日志

企业特性

负载均衡

Tetrate 提供智能路由和负载均衡功能,自动选择最佳可用端点。

访问控制

支持基于 IP、用户和时间的细粒度访问控制。

审计日志

完整的请求追踪和审计日志,满足合规要求。

数据驻留

支持多区域部署,满足数据驻留要求。

SLA 保证

企业级 SLA 保证,提供 99.9% 可用性承诺。

区域端点

区域端点延迟
美国西部https://us-west.api.tetrate.ai/v1
美国东部https://us-east.api.tetrate.ai/v1
欧洲https://eu.api.tetrate.ai/v1
亚太https://apac.api.tetrate.ai/v1