GEgemini

国内直连 Google Gemini 全系模型,OpenAI 兼容协议,改一行 base_url 即可迁移。官方同步更新,价格更低,让团队把精力放回产品本身。

模型矩阵

Gemini 全家桶,一次滚动看完

01

Gemini 3.1 Pro

旗舰对话

复杂推理与长上下文旗舰,1M token 窗口。

$2.00 / 1M$2.50 / 1M

02

Gemini 3.5 Flash

高速对话

低时延高吞吐,线上业务的默认之选。

$0.24 / 1M$0.30 / 1M

03

Gemini 3 Flash-Lite

轻量对话

极致性价比,批量任务与分类场景首选。

$0.08 / 1M$0.10 / 1M

04

Gemini 2.5 Pro

深度推理

上一代旗舰,复杂推理与代码任务稳定可靠。

$1.60 / 1M$2.00 / 1M

05

Gemini 2.5 Flash

均衡对话

速度与质量兼顾,长尾业务的稳妥之选。

$0.20 / 1M$0.25 / 1M

06

Gemini Embedding

向量检索

多语种检索与 RAG 的高维向量模型。

$0.012 / 1M$0.015 / 1M

0%
通道可用性
~0ms
中转开销
0+
Gemini 系列模型
0
代码切换成本

核心能力

把接入 Gemini,做到极简

01 直连02 兼容03 路由04 计费
01直连

官方直连通道

多区域专线回源 Google,国内免代理直接调用,与官方版本零时差同步。

channels · live

平均往返延迟

412ms

4 条专线在线

上海节点

38ms

香港节点

52ms

新加坡节点

61ms

02兼容

OpenAI 兼容接口

保留你现有的 SDK 与代码,改一行 base_url 即从 GPT 迁移到 Gemini。

migrate.py
from openai import OpenAI
 
client = OpenAI(
  base_url="https://gegemini.com/v1" # 只改这行
  api_key="sk-gegemini-***",
)

迁移完成

现有 SDK 与业务代码零改动

03路由

智能配额调度

多项目配额池自动轮转,单 Key 限流自动切换,线上业务不掉链子。

router · quota pool
项目 A Key 池82%
项目 B Key 池64%
项目 C Key 池45%

项目 A 触发限流,请求已自动切到项目 B,零中断。

04计费

官方价 8 折计费

用量越大折扣越深,账单透明到每一次调用,月底不再有意外。

billing · 1M tokens
模型官方价本站价Gemini 3.1 Pro$2.50$2.00Gemini 3.5 Flash$0.30$0.24Flash-Lite$0.10$0.08

本月已省

$1,180

你的 Gemini 用量,一屏掌握

请求趋势、成本拆分、缓存命中——全系模型的数据汇到一处。

用量总览· 实时
7 天30 天90 天

总请求数

+18.7%

0K

总成本

-12.3%

$0

缓存命中率

+4.2%

0%

可用性

30 天

0%

每日成本

7 天合计 $1,247

$120$60$0
$82
$98
$74
$115
$93
$61
$88
周一周二周三周四周五周六周日
日均 $178较上周 ↓ 12%
90%缓存命中
命中127.4K
未命中14.2K
节省$1,180

按模型拆分

Gemini 3.1 Pro$498
Gemini 3.5 Flash$324
Flash-Lite$212
Gemini 2.5 Flash$138
Embedding$75

为什么选我们

比直连官方,多省一步

01

价格更低

官方价 8 折起计费,用量越大折扣越深,账单透明到每一次调用。

02

免代理直连

国内网络直接访问,无需自建代理与海外信用卡,注册即用。

03

秒级开通

邮箱注册即发 Key,充值实时到账,从注册到第一次调用不超过一分钟。

04

7×24 监控

全链路时延与错误率监控,通道异常自动切换,状态页实时公开。

全部能力

你的产品想要的Gemini 都有

长上下文 1M多模态批量推理语义缓存向量检索函数调用JSON 模式流式输出思维链代码执行中文友好实时语音

开始用 Gemini 构建

注册即送测试额度,一分钟跑通第一次调用。