Google Gemini
Google Gemini 是 Google 的多模态 AI 模型系列,提供强大的文本生成和理解能力。
支持的模型
Gemini Pro 系列
- gemini-pro - 通用文本模型
- gemini-pro-vision - 多模态模型(支持图像和文本)
Gemini 1.5 系列
- gemini-1.5-pro - 高性能模型
- gemini-1.5-flash - 快速响应模型
Gemini 1.0 系列
- gemini-1.0-pro - 原始 Gemini 模型
配置方法
基础配置
在 config.yaml 或 ~/.bytebuddy/config.yaml 中配置:
yaml
models:
- name: "gemini-pro"
provider: "google"
model: "gemini-pro"
apiKey: "${GOOGLE_API_KEY}"
roles: ["chat"]
defaultCompletionOptions:
temperature: 0.7
maxTokens: 8192多模态配置
yaml
models:
- name: "gemini-vision"
provider: "google"
model: "gemini-pro-vision"
apiKey: "${GOOGLE_API_KEY}"
roles: ["chat"]
capabilities: ["image_input"]多模型配置
yaml
models:
- name: "gemini-1.5-pro"
provider: "google"
model: "gemini-1.5-pro"
apiKey: "${GOOGLE_API_KEY}"
roles: ["chat", "edit"]
defaultCompletionOptions:
temperature: 0.7
maxTokens: 8192
- name: "gemini-1.5-flash"
provider: "google"
model: "gemini-1.5-flash"
apiKey: "${GOOGLE_API_KEY}"
roles: ["chat", "autocomplete"]
defaultCompletionOptions:
temperature: 0.5
maxTokens: 4096配置字段说明
必需字段
- name: 模型配置的唯一标识符
- provider: 设置为
"google"或"gemini" - model: 模型名称
- apiKey: Google AI API 密钥
可选字段
- roles: 模型角色 [
chat,edit,apply,autocomplete] - capabilities: 模型能力 [
image_input] - defaultCompletionOptions:
temperature: 控制输出的随机性(0-2)topP: 核采样参数(0-1)topK: 采样候选数量(1-100)maxTokens: 最大输出令牌数candidateCount: 生成候选数量(1-8)
环境变量配置
bash
# ~/.bashrc 或 ~/.zshrc
export GOOGLE_API_KEY="your-google-api-key"
# 或
export GEMINI_API_KEY="your-gemini-api-key"获取 API 密钥
- 访问 Google AI Studio
- 点击 "Create API Key"
- 选择或创建 Google Cloud 项目
- 复制生成的 API 密钥
- 将密钥保存到环境变量中
使用场景配置
文本生成
yaml
models:
- name: "text-gen"
provider: "google"
model: "gemini-1.5-pro"
apiKey: "${GOOGLE_API_KEY}"
roles: ["chat"]
defaultCompletionOptions:
temperature: 0.7
maxTokens: 8192代码生成
yaml
models:
- name: "code-gen"
provider: "google"
model: "gemini-1.5-pro"
apiKey: "${GOOGLE_API_KEY}"
roles: ["chat", "edit"]
defaultCompletionOptions:
temperature: 0.3
maxTokens: 4000快速响应
yaml
models:
- name: "quick-response"
provider: "google"
model: "gemini-1.5-flash"
apiKey: "${GOOGLE_API_KEY}"
roles: ["chat", "autocomplete"]
defaultCompletionOptions:
temperature: 0.5
maxTokens: 2000图像理解
yaml
models:
- name: "vision"
provider: "google"
model: "gemini-pro-vision"
apiKey: "${GOOGLE_API_KEY}"
roles: ["chat"]
capabilities: ["image_input"]故障排除
常见错误
- API_KEY_INVALID: 检查 API 密钥是否正确
- QUOTA_EXCEEDED: 达到配额限制,等待或升级配额
- MODEL_NOT_FOUND: 检查模型名称是否正确
- SAFETY_ERROR: 输入被安全过滤器阻止
- RATE_LIMIT_EXCEEDED: 达到速率限制
调试步骤
- 验证 API 密钥格式和有效性
- 检查请求格式和参数
- 监控配额使用情况
- 查看错误日志
- 确认模型可用性
速率限制
免费层
- 每分钟 15 请求
- 每天 1500 请求
- 输入令牌:取决于模型
- 输出令牌:最高 8192
付费层
- 每分钟 60 请求
- 每天 15000 请求
- 更高的并发限制
最佳实践
1. 安全性
- 使用环境变量存储 API 密钥
- 避免在代码中硬编码密钥
- 定期轮换 API 密钥
- 监控异常使用
2. 性能优化
- 根据任务选择合适的模型
- 使用 Flash 模型获得更快响应
- 设置合理的 maxTokens 限制
- 实施请求缓存
3. 成本控制
- 监控 API 使用量
- 使用免费配额进行开发测试
- 为简单任务使用 Flash 模型
- 设置配额警报
4. 内容安全
- Gemini 内置安全过滤
- 处理被过滤的响应
- 实施适当的内容审核
多语言支持
Gemini 支持多种语言:
- 中文(简体/繁体)
- 英文
- 日文
- 韩文
- 法文
- 德文
- 西班牙文
- 更多语言...
无需特殊配置即可处理多语言输入。
模型对比
| 特性 | Gemini 1.5 Pro | Gemini 1.5 Flash | Gemini Pro Vision |
|---|---|---|---|
| 文本生成 | 优秀 | 良好 | 良好 |
| 响应速度 | 中等 | 快速 | 中等 |
| 上下文长度 | 长 | 中等 | 中等 |
| 图像理解 | ✅ | ❌ | ✅ |
| 成本 | 中 | 低 | 中 |