Google Gemini

Google Gemini 是 Google 的多模态 AI 模型系列，提供强大的文本生成和理解能力。

支持的模型

Gemini Pro 系列

gemini-pro - 通用文本模型
gemini-pro-vision - 多模态模型（支持图像和文本）

Gemini 1.5 系列

gemini-1.5-pro - 高性能模型
gemini-1.5-flash - 快速响应模型

Gemini 1.0 系列

gemini-1.0-pro - 原始 Gemini 模型

配置方法

基础配置

在 config.yaml 或 ~/.bytebuddy/config.yaml 中配置：

yaml

models:
  - name: "gemini-pro"
    provider: "google"
    model: "gemini-pro"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat"]
    defaultCompletionOptions:
      temperature: 0.7
      maxTokens: 8192

多模态配置

yaml

models:
  - name: "gemini-vision"
    provider: "google"
    model: "gemini-pro-vision"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat"]
    capabilities: ["image_input"]

多模型配置

yaml

models:
  - name: "gemini-1.5-pro"
    provider: "google"
    model: "gemini-1.5-pro"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat", "edit"]
    defaultCompletionOptions:
      temperature: 0.7
      maxTokens: 8192

  - name: "gemini-1.5-flash"
    provider: "google"
    model: "gemini-1.5-flash"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat", "autocomplete"]
    defaultCompletionOptions:
      temperature: 0.5
      maxTokens: 4096

配置字段说明

必需字段

name: 模型配置的唯一标识符
provider: 设置为 "google" 或 "gemini"
model: 模型名称
apiKey: Google AI API 密钥

可选字段

roles: 模型角色 [chat, edit, apply, autocomplete]
capabilities: 模型能力 [image_input]
defaultCompletionOptions:
- temperature: 控制输出的随机性（0-2）
- topP: 核采样参数（0-1）
- topK: 采样候选数量（1-100）
- maxTokens: 最大输出令牌数
- candidateCount: 生成候选数量（1-8）

环境变量配置

bash

# ~/.bashrc 或 ~/.zshrc
export GOOGLE_API_KEY="your-google-api-key"
# 或
export GEMINI_API_KEY="your-gemini-api-key"

获取 API 密钥

访问 Google AI Studio
点击 "Create API Key"
选择或创建 Google Cloud 项目
复制生成的 API 密钥
将密钥保存到环境变量中

使用场景配置

文本生成

yaml

models:
  - name: "text-gen"
    provider: "google"
    model: "gemini-1.5-pro"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat"]
    defaultCompletionOptions:
      temperature: 0.7
      maxTokens: 8192

代码生成

yaml

models:
  - name: "code-gen"
    provider: "google"
    model: "gemini-1.5-pro"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat", "edit"]
    defaultCompletionOptions:
      temperature: 0.3
      maxTokens: 4000

快速响应

yaml

models:
  - name: "quick-response"
    provider: "google"
    model: "gemini-1.5-flash"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat", "autocomplete"]
    defaultCompletionOptions:
      temperature: 0.5
      maxTokens: 2000

图像理解

yaml

models:
  - name: "vision"
    provider: "google"
    model: "gemini-pro-vision"
    apiKey: "${GOOGLE_API_KEY}"
    roles: ["chat"]
    capabilities: ["image_input"]

故障排除

常见错误

API_KEY_INVALID: 检查 API 密钥是否正确
QUOTA_EXCEEDED: 达到配额限制，等待或升级配额
MODEL_NOT_FOUND: 检查模型名称是否正确
SAFETY_ERROR: 输入被安全过滤器阻止
RATE_LIMIT_EXCEEDED: 达到速率限制

调试步骤

验证 API 密钥格式和有效性
检查请求格式和参数
监控配额使用情况
查看错误日志
确认模型可用性

速率限制

免费层

每分钟 15 请求
每天 1500 请求
输入令牌：取决于模型
输出令牌：最高 8192

付费层

每分钟 60 请求
每天 15000 请求
更高的并发限制

最佳实践

1. 安全性

使用环境变量存储 API 密钥
避免在代码中硬编码密钥
定期轮换 API 密钥
监控异常使用

2. 性能优化

根据任务选择合适的模型
使用 Flash 模型获得更快响应
设置合理的 maxTokens 限制
实施请求缓存

3. 成本控制

监控 API 使用量
使用免费配额进行开发测试
为简单任务使用 Flash 模型
设置配额警报

4. 内容安全

Gemini 内置安全过滤
处理被过滤的响应
实施适当的内容审核

多语言支持

Gemini 支持多种语言：

中文（简体/繁体）
英文
日文
韩文
法文
德文
西班牙文
更多语言...

无需特殊配置即可处理多语言输入。

模型对比

特性	Gemini 1.5 Pro	Gemini 1.5 Flash	Gemini Pro Vision
文本生成	优秀	良好	良好
响应速度	中等	快速	中等
上下文长度	长	中等	中等
图像理解	✅	❌	✅
成本	中	低	中

热门提供商

更多提供商

Google Gemini

支持的模型

Gemini Pro 系列

Gemini 1.5 系列

Gemini 1.0 系列

配置方法

基础配置

多模态配置

多模型配置

配置字段说明

必需字段

可选字段

环境变量配置

获取 API 密钥

使用场景配置

文本生成

代码生成

快速响应

图像理解

故障排除

常见错误

调试步骤

速率限制

免费层

付费层

最佳实践

1. 安全性

2. 性能优化

3. 成本控制

4. 内容安全

多语言支持

模型对比

Google Gemini ​

支持的模型 ​

Gemini Pro 系列 ​

Gemini 1.5 系列 ​

Gemini 1.0 系列 ​

配置方法 ​

基础配置 ​

多模态配置 ​

多模型配置 ​

配置字段说明 ​

必需字段 ​

可选字段 ​

环境变量配置 ​

获取 API 密钥 ​

使用场景配置 ​

文本生成 ​

代码生成 ​

快速响应 ​

图像理解 ​

故障排除 ​

常见错误 ​

调试步骤 ​

速率限制 ​

免费层 ​

付费层 ​

最佳实践 ​

1. 安全性 ​

2. 性能优化 ​

3. 成本控制 ​

4. 内容安全 ​

多语言支持 ​

模型对比 ​

Google Gemini

支持的模型

Gemini Pro 系列

Gemini 1.5 系列

Gemini 1.0 系列

配置方法

基础配置

多模态配置

多模型配置

配置字段说明

必需字段

可选字段

环境变量配置

获取 API 密钥

使用场景配置

文本生成

代码生成

快速响应

图像理解

故障排除

常见错误

调试步骤

速率限制

免费层

付费层

最佳实践

1. 安全性

2. 性能优化

3. 成本控制

4. 内容安全

多语言支持

模型对比