01
能力介绍
多协议支持
支持 OpenAI Chat、OpenAI Responses、Anthropic 三种主流协议,一站接入。
3 步快速接入
开通服务 → 获取 API Token → 调用 LLM 模型,流程简洁清晰。
原厂一致计费
计费方式与原厂模型保持一致,折扣详询商务,每日结算出账。
接入三步骤
开通服务
在腾讯云官网开通云点播和媒体处理产品,系统自动创建 SubAppId。
获取 API Token
通过腾讯云 API 调用 CreateAigcApiToken 接口创建生文专用 Token(APIKey)。
调用 LLM 模型
使用 Token 直接调用生文接口,选择目标模型,支持流式和非流式输出。
平台入口
登录 → 腾讯云 → 云点播
Log in → Tencent Cloud → 云点播(国际站)
限速说明:默认限速 RPM(每分钟 10 个请求),TPM(每分钟 10W tokens)。如需调整,请提供 API Key 的 SubAppId,系统按 SubAppId 维度进行限频。
02
模型清单
目前支持以下模型,持续更新补齐中...
Pro 模型说明:目前谷歌整体资源都不足,无法做到保障,建议优先考虑使用 Flash 系列。文件和图片处理通过"内嵌数据"方式传输,文件大小限制在 70MB 以内。
| 厂商 | 模型标识 | 资源说明 | 上下文 / 输出 | 支持输入 |
|---|---|---|---|---|
| OpenAI | gpt-5.4 |
超过 200w TPM 需提前 3 天申请 | 上下文:1050k / 最大输出:128k | 文本、图片 |
gpt-5.2 |
上下文:400k / 最大输出:128k | 文本、图片 | ||
gpt-5.1 |
||||
gpt-5.1-chat |
||||
gpt-5-chat 4月15日下架 |
||||
gpt-5-nano |
||||
gpt-4o |
上下文:128k / 最大输出:16,384 | |||
| Gemini | gemini-3.1-pro-preview |
⚠️ 资源紧缺 | 输入:1,048,576 / 输出:65,536 | 文本、代码、图片、音频、视频 |
gemini-3.1-flash-lite-preview |
超过 200w TPM 需提前 3 天申请 | |||
gemini-3-pro-preview 3月9日下线 |
||||
gemini-3-flash-preview |
||||
gemini-2.5-pro |
||||
gemini-2.5-flash |
||||
| GK 仅国际站 | gk-4-1-fast-reasoning NEW |
超过 200w TPM 需提前 3 天申请 | 上下文:2M / 最大输出:2M | 文本、图片 |
| CD 仅国际站 | cd-sonnet-4.6 NEW |
超过 200w TPM 需提前 3 天申请 | 对齐官网 | 文本、图片 |
cd-opus-4.6 |
||||
cd-opus-4.5 |
||||
cd-haiku-4.5 |
03
开通服务
在腾讯云官网开通云点播和媒体处理产品服务,开通后系统自动创建 SubAppId。
SubAppId 重要说明:按照 SubAppId 维度限频,提交调频申请时请说明使用哪个 SubAppId。SubAppId 一旦被删除,其下所有 API Key 将立即失效。
子账户授权策略
如果子账户需要调用相关接口,需要主账户赋予其权限:
策略1:所有 SubAppId
策略2:指定 SubAppId
JSON
{
"statement": [
{
"action": [
"vod:CreateAigcApiToken",
"vod:DeleteAigcApiToken"
],
"effect": "allow",
"resource": "*"
}
],
"version": "2.0"
}
JSON
{
"statement": [
{
"action": [
"vod:CreateAigcApiToken",
"vod:DeleteAigcApiToken"
],
"effect": "allow",
"resource": "qcs::vod::uin/*:subAppId/1500050693"
}
],
"version": "2.0"
}
04
Token(APIKey)管理
APIKey 没有过期时间,不需要每次调用都创建一个 APIKey。每个用户限制最多 50 个 Token,可删除、可查询。注意:APIKey 需要约 1 分钟同步到网关,创建后马上使用可能会失败。
➕ 创建接口
CreateAigcApiToken
- 国内站代码示例可用
- 国际站代码示例可用(国际站与国内站 APIKey 不通用)
- 支持控制台界面直接操作生成
🗑️ 删除接口
DeleteAigcApiToken
- 删除后网关需要小段时间才能失效
- 国内站/国际站均有代码示例
🔍 查询接口
DescribeAigcApiTokens
- 可查询已创建的 Token 列表
- 国内站/国际站均有代码示例
05
生文接口
接口目前支持以下 3 种协议:
① OpenAI 兼容协议
② Anthropic 协议
③ Responses 协议
最主流协议,生文调用方法及参数业界较统一,除 CD 模型(走 Anthropic 协议)和 gpt-5.4-pro(走 Responses 协议)外,其他模型均推荐使用此协议。
POST
https://text-aigc.vod-qcloud.com/v1/chat/completions
Python SDK
cURL
Python
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://text-aigc.vod-qcloud.com/v1"
)
response = client.chat.completions.create(
model="gpt-5-nano",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hi, how are you?"},
],
extra_body={"reasoning_split": True},
)
print(f"Thinking:\n{response.choices[0].message.reasoning_details[0]['text']}\n")
print(f"Text:\n{response.choices[0].message.content}\n")
cURL
curl -X POST https://text-aigc.vod-qcloud.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${API_TOKEN}" \
-d '{
"model": "gpt-5.1",
"stream": true,
"messages": [
{
"role": "user",
"content": "who are you?"
}
]
}'
请求头参数
| HTTP 头名称 | 是否必需 | 说明 |
|---|---|---|
Authorization | 二选一 | 格式:Bearer ${TOKEN},有 x-api-key 则不需要 |
x-api-key | 二选一 | 格式:${TOKEN},有 Authorization 则不需要,Anthropic 协议使用 |
X-Request-Id | 可选 | 用户可传入自己的 request id |
请求体核心参数
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | String | 是 | 指定使用的 AI 模型,可选值见模型清单 |
messages | List<Object> | 是 | 对话消息列表,提供上下文和当前问题 |
stream | bool | 是 | 是否使用流式输出 |
thinking_enabled | Boolean | 否 | 是否开启推理(思考)模式,true 时延迟增加 |
temperature | Float | 否 | 控制输出随机性,0~2,默认 0.7 |
max_tokens | Integer | 否 | 最大生成 Token 数量 |
reasoning_effort | String | 否 | 思考等级:none/minimal/low/medium/high/xhigh |
tools | Array | 否 | 工具列表,支持 Function Calling |
input_compliance_check | bool | 否 | 开启输入文本审核,不过则返回 400 |
output_compliance_check | bool | 否 | 开启输出文本审核 |
返回示例
JSON
{
"id": "chatcmpl-CjFQ2DVpDRL7zVf6gHRYIPiXx4JJN",
"object": "chat.completion",
"created": 1764900066,
"model": "gpt-5.1-2025-11-13",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "I'm an AI assistant created by OpenAI..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 40,
"completion_tokens": 53,
"total_tokens": 93
}
}
Anthropic 公司推出的协议,主要用于调用 CD(Claude)系列模型。
POST
https://text-aigc.vod-qcloud.com/v1/messages
Python SDK
cURL
Python
pip install anthropic
Python
import anthropic
client = anthropic.Anthropic(
api_key="YOUR_API_KEY",
base_url="https://text-aigc.vod-qcloud.com/v1"
)
message = client.messages.create(
model="cd-sonnet-4.6",
max_tokens=1000,
system="You are a helpful assistant.",
messages=[
{
"role": "user",
"content": [{"type": "text", "text": "Hi, how are you?"}]
}
]
)
for block in message.content:
if block.type == "thinking":
print(f"Thinking:\n{block.thinking}\n")
elif block.type == "text":
print(f"Text:\n{block.text}\n")
cURL
curl https://text-aigc.vod-qcloud.com/v1/messages \
-H 'Content-Type: application/json' \
-H "X-Api-Key: $YOUR_API_KEY" \
-d '{
"max_tokens": 1024,
"messages": [
{
"content": "Hello, world",
"role": "user"
}
],
"model": "cd-sonnet-4.6"
}'
OpenAI Responses 协议,主要支持 GPT 系列模型(如 gpt-5.1-chat)。
POST
https://text-aigc.vod-qcloud.com/v1/responses
cURL
curl https://text-aigc.vod-qcloud.com/v1/responses -v \
-H "Content-Type: application/json" \
-H "Accept: text/event-stream" \
-H "Authorization: Bearer $YOUR_API_KEY" \
-d '{
"model": "gpt-5.1-chat",
"instructions": "You are a helpful assistant.",
"input": "Hello!",
"stream": true
}'
原厂文档:https://developers.openai.com/api/reference/resources/responses/methods/create
06
错误码
200
成功
400
请求参数错误
401
认证失败
403
权限不足 / 已停服(可能欠费)
404
模型/端点不存在,如 model 名不支持
429
速率限制,默认 RPM 10 / TPM 10W
500/502/503
服务器错误 / 上游错误
每个错误都会返回具体错误信息和
request_id 字段;每个请求都返回 X-Request-Id 响应头。默认限速
10
请求 / 分钟 (RPM)
10W
Tokens / 分钟 (TPM)
如需调整限速,请咨询对接同事,提供需要调整的 SubAppId。
07
用量查询
查询整体生文的用量情况,目前支持接口查询和页面查询两种方式。
📡 接口查询
- 国内站:DescribeAigcUsageData
- 国际站:DescribeAigcUsageData
📊 页面查询
- 用量统计界面:登录腾讯云控制台
- 资源维度成本分析
- 资源维度账单 / 明细账单
- 可视化页面:云点播 → 用量统计 → AIGC
08
常见 Q&A
| 分类 | 问题 | 答案 |
|---|---|---|
| 接口调用 | 当前支持 tools 么? | 3.11 已支持,详情查看接口参数说明 |
| 如果有模型不在已有列表怎么办? | 联系对接同事进行评估支持 | |
| 可以不带 instruction 么? | 可以,instruction 可以不带。如需设定,可通过 system 设定:{"content":"You are a helpful assistant.","role":"system"} |
|
| 默认调用并发 | 测试期间资源有限,默认支持 TPM 10。如需升级 TPM,请正式接入后提出申请,我们评估支持。 | |
| 法务支持 | 目前 AI 调用的相关合规说明 | 请参考:媒体处理 AI 相关功能的特别约定(腾讯云政策与规范) |