GEgemini

国内直连 Google Gemini 全系模型，OpenAI 兼容协议，改一行 base_url 即可迁移。官方同步更新，价格更低，让团队把精力放回产品本身。

免费开始

模型矩阵

Gemini 全家桶，一次滚动看完

Gemini 3.1 Pro

旗舰对话

复杂推理与长上下文旗舰，1M token 窗口。

$2.00 / 1M$2.50 / 1M

Gemini 3.5 Flash

高速对话

低时延高吞吐，线上业务的默认之选。

$0.24 / 1M$0.30 / 1M

Gemini 3 Flash-Lite

轻量对话

极致性价比，批量任务与分类场景首选。

$0.08 / 1M$0.10 / 1M

Gemini 2.5 Pro

深度推理

上一代旗舰，复杂推理与代码任务稳定可靠。

$1.60 / 1M$2.00 / 1M

Gemini 2.5 Flash

均衡对话

速度与质量兼顾，长尾业务的稳妥之选。

$0.20 / 1M$0.25 / 1M

Gemini Embedding

向量检索

多语种检索与 RAG 的高维向量模型。

$0.012 / 1M$0.015 / 1M

0%
通道可用性: ~0ms
中转开销: 0+
Gemini 系列模型: 0 行
代码切换成本

核心能力

把接入 Gemini，做到极简

01 直连02 兼容03 路由04 计费

01直连

官方直连通道

多区域专线回源 Google，国内免代理直接调用，与官方版本零时差同步。

channels · live

平均往返延迟

412ms

4 条专线在线

上海节点

38ms

香港节点

52ms

新加坡节点

61ms

02兼容

OpenAI 兼容接口

保留你现有的 SDK 与代码，改一行 base_url 即从 GPT 迁移到 Gemini。

migrate.py

from openai import OpenAI
 
client = OpenAI(
  base_url="https://gegemini.com/v1" # 只改这行
  api_key="sk-gegemini-***",
)

迁移完成

现有 SDK 与业务代码零改动

03路由

智能配额调度

多项目配额池自动轮转，单 Key 限流自动切换，线上业务不掉链子。

router · quota pool

项目 A Key 池82%

项目 B Key 池64%

项目 C Key 池45%

项目 A 触发限流，请求已自动切到项目 B，零中断。

04计费

官方价 8 折计费

用量越大折扣越深，账单透明到每一次调用，月底不再有意外。

billing · 1M tokens

模型官方价本站价Gemini 3.1 Pro$2.50$2.00Gemini 3.5 Flash$0.30$0.24Flash-Lite$0.10$0.08

本月已省

$1,180

你的 Gemini 用量，一屏掌握

请求趋势、成本拆分、缓存命中——全系模型的数据汇到一处。

用量总览· 实时

7 天30 天90 天

总请求数

+18.7%

总成本

-12.3%

缓存命中率

+4.2%

可用性

30 天

每日成本

7 天合计 $1,247

$120$60$0

$82

$98

$74

$115

$93

$61

$88

周一周二周三周四周五周六周日

日均 $178较上周 ↓ 12%

90%缓存命中

命中127.4K

未命中14.2K

节省$1,180

按模型拆分

Gemini 3.1 Pro$498

Gemini 3.5 Flash$324

Flash-Lite$212

Gemini 2.5 Flash$138

Embedding$75

为什么选我们

比直连官方，多省一步

价格更低

官方价 8 折起计费，用量越大折扣越深，账单透明到每一次调用。

免代理直连

国内网络直接访问，无需自建代理与海外信用卡，注册即用。

秒级开通

邮箱注册即发 Key，充值实时到账，从注册到第一次调用不超过一分钟。

7×24 监控

全链路时延与错误率监控，通道异常自动切换，状态页实时公开。

全部能力

你的产品想要的Gemini 都有

长上下文 1M多模态批量推理语义缓存向量检索函数调用JSON 模式流式输出思维链代码执行中文友好实时语音

开始用 Gemini 构建

注册即送测试额度，一分钟跑通第一次调用。

免费获取 API Key