Skip to content

Google Gemini

Google Gemini 是 Google 的多模态 AI 模型系列,提供强大的文本生成和理解能力。

支持的模型

Gemini Pro 系列

  • gemini-pro - 通用文本模型
  • gemini-pro-vision - 多模态模型(支持图像和文本)

Gemini 1.5 系列

  • gemini-1.5-pro - 高性能模型
  • gemini-1.5-flash - 快速响应模型

Gemini 1.0 系列

  • gemini-1.0-pro - 原始 Gemini 模型

配置方法

基础配置

config.yaml~/.bytebuddy/config.yaml 中配置:

yaml
models:
  - name: "gemini-pro"
    provider: "google"
    model: "gemini-pro"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat"]
    defaultCompletionOptions:
      temperature: 0.7
      maxTokens: 8192

多模态配置

yaml
models:
  - name: "gemini-vision"
    provider: "google"
    model: "gemini-pro-vision"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat"]
    capabilities: ["image_input"]

多模型配置

yaml
models:
  - name: "gemini-1.5-pro"
    provider: "google"
    model: "gemini-1.5-pro"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat", "edit"]
    defaultCompletionOptions:
      temperature: 0.7
      maxTokens: 8192

  - name: "gemini-1.5-flash"
    provider: "google"
    model: "gemini-1.5-flash"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat", "autocomplete"]
    defaultCompletionOptions:
      temperature: 0.5
      maxTokens: 4096

配置字段说明

必需字段

  • name: 模型配置的唯一标识符
  • provider: 设置为 "google""gemini"
  • model: 模型名称
  • apiKey: Google AI API 密钥

可选字段

  • roles: 模型角色 [chat, edit, apply, autocomplete]
  • capabilities: 模型能力 [image_input]
  • defaultCompletionOptions:
    • temperature: 控制输出的随机性(0-2)
    • topP: 核采样参数(0-1)
    • topK: 采样候选数量(1-100)
    • maxTokens: 最大输出令牌数
    • candidateCount: 生成候选数量(1-8)

环境变量配置

bash
# ~/.bashrc 或 ~/.zshrc
export GOOGLE_API_KEY="your-google-api-key"
# 或
export GEMINI_API_KEY="your-gemini-api-key"

获取 API 密钥

  1. 访问 Google AI Studio
  2. 点击 "Create API Key"
  3. 选择或创建 Google Cloud 项目
  4. 复制生成的 API 密钥
  5. 将密钥保存到环境变量中

使用场景配置

文本生成

yaml
models:
  - name: "text-gen"
    provider: "google"
    model: "gemini-1.5-pro"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat"]
    defaultCompletionOptions:
      temperature: 0.7
      maxTokens: 8192

代码生成

yaml
models:
  - name: "code-gen"
    provider: "google"
    model: "gemini-1.5-pro"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat", "edit"]
    defaultCompletionOptions:
      temperature: 0.3
      maxTokens: 4000

快速响应

yaml
models:
  - name: "quick-response"
    provider: "google"
    model: "gemini-1.5-flash"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat", "autocomplete"]
    defaultCompletionOptions:
      temperature: 0.5
      maxTokens: 2000

图像理解

yaml
models:
  - name: "vision"
    provider: "google"
    model: "gemini-pro-vision"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat"]
    capabilities: ["image_input"]

故障排除

常见错误

  1. API_KEY_INVALID: 检查 API 密钥是否正确
  2. QUOTA_EXCEEDED: 达到配额限制,等待或升级配额
  3. MODEL_NOT_FOUND: 检查模型名称是否正确
  4. SAFETY_ERROR: 输入被安全过滤器阻止
  5. RATE_LIMIT_EXCEEDED: 达到速率限制

调试步骤

  1. 验证 API 密钥格式和有效性
  2. 检查请求格式和参数
  3. 监控配额使用情况
  4. 查看错误日志
  5. 确认模型可用性

速率限制

免费层

  • 每分钟 15 请求
  • 每天 1500 请求
  • 输入令牌:取决于模型
  • 输出令牌:最高 8192

付费层

  • 每分钟 60 请求
  • 每天 15000 请求
  • 更高的并发限制

最佳实践

1. 安全性

  • 使用环境变量存储 API 密钥
  • 避免在代码中硬编码密钥
  • 定期轮换 API 密钥
  • 监控异常使用

2. 性能优化

  • 根据任务选择合适的模型
  • 使用 Flash 模型获得更快响应
  • 设置合理的 maxTokens 限制
  • 实施请求缓存

3. 成本控制

  • 监控 API 使用量
  • 使用免费配额进行开发测试
  • 为简单任务使用 Flash 模型
  • 设置配额警报

4. 内容安全

  • Gemini 内置安全过滤
  • 处理被过滤的响应
  • 实施适当的内容审核

多语言支持

Gemini 支持多种语言:

  • 中文(简体/繁体)
  • 英文
  • 日文
  • 韩文
  • 法文
  • 德文
  • 西班牙文
  • 更多语言...

无需特殊配置即可处理多语言输入。

模型对比

特性Gemini 1.5 ProGemini 1.5 FlashGemini Pro Vision
文本生成优秀良好良好
响应速度中等快速中等
上下文长度中等中等
图像理解
成本