1. 视频理解
API接入文档
  • 快速入门
  • 模型调用
    • 聊天
      • OpenAI-ChatCompletions
      • OpenAI-Responses
      • Anthropic-Claude
    • 图片理解
      • OpenAI-ChatCompletions
      • OpenAI-Responses
    • 视频理解
      • OpenAI-ChatCompletions
        POST
      • OpenAI-Responses
        POST
    • 文档理解
      • OpenAI-Responses
    • 图像(Images)
      • OpenAI-图像生成
      • OpenAI-图像编辑
      • 阿里千问-图像生成
      • 阿里千问-图像编辑
    • 嵌入/向量化(Embeddings)
      • 向量化
    • 重排序(Rerank)
      • 文档重排序
  • 接入三方工具
    • 接入 Chatbox
    • 接入 Dify
    • 接入 Cherry Studio
    • 接入 Claude Code
    • 接入 OpenCode
    • 接入 OpenClaw(原Clawdbot)
    • 接入 Cline
    • 接入 Cursor
    • 接入 Roo Code
    • 接入 Kilo Code
    • 接入 Codex CLI
    • 接入 LangChain
  1. 视频理解

OpenAI-Responses

POST
/v1/responses
Responses API 示例代码如下。

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Header 参数

Body 参数application/json必填

示例
{
    "model": "doubao-seed-2-0-pro-260215",
    "input": [
        {
            "role": "user",
            "content": [
                {
                    "type": "input_video",
                    "video_url": "https://ark-project.tos-cn-beijing.volces.com/doc_video/ark_vlm_video_input.mp4",
                    "fps": 1
                }
            ]
        }
    ]
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/v1/responses' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "doubao-seed-2-0-pro-260215",
    "input": [
        {
            "role": "user",
            "content": [
                {
                    "type": "input_video",
                    "video_url": "https://ark-project.tos-cn-beijing.volces.com/doc_video/ark_vlm_video_input.mp4",
                    "fps": 1
                }
            ]
        }
    ]
}'

返回响应

🟢200成功
application/json
Body

示例
{
    "created_at": 1774947803,
    "id": "resp_02177494780106900bcc3116dfc56b9203b01425516f61b3bd3ee",
    "max_output_tokens": 32768,
    "model": "doubao-seed-2-0-pro-260215",
    "object": "response",
    "output": [
        {
            "id": "rs_02177494780389900000000000000000000ffffac191df7beef8a",
            "type": "reasoning",
            "summary": [
                {
                    "type": "summary_text",
                    "text": "\n用户现在需要先明确这个是AI生成的伦敦大本钟的延时对吧?首先先指出内容:这是AI生成的伦敦伊丽莎白塔(常称大本钟)的延时场景,首先看细节,首先钟楼的时钟指针是快进走的对吧,还有桥上的车流也是加速的,黄昏下的泰晤士河和威斯敏斯特桥的车流,还有背景的伦敦天际线。然后还要说AI生成的点,首先整体氛围很有伦敦暮色的质感,延时的效果表现出城市的流动感,不过可以注意下AI生成里可能的小细节?不对,先准确描述:\n这段是AI生成的伦敦经典地标伊丽莎白塔(俗称大本钟)的延时摄影风格画面,展现了黄昏时分威斯敏斯特桥上的繁忙车流,钟表指针快速转动、往来车辆快速通行,搭配渐变的暮色云景,烘托出伦敦都市的流动感与氛围感,整体光影和场景还原度都比较高。\n\n不对,要准确,首先用户给的视频就是AI生成的,首先说明场景:画面主体是伦敦标志性建筑大本钟(伊丽莎白塔),一旁的威斯敏斯特桥上车流穿梭,天空是黄昏时分的多云状态,整体是延时摄影的呈现效果,时钟指针快速走动、车流快速移动,体现城市的繁忙节奏,而这一内容是AI生成的,还原了伦敦经典城市景观的氛围感。\n\n对,就这么说就行,清晰明了。"
                }
            ],
            "status": "completed"
        },
        {
            "type": "message",
            "role": "assistant",
            "content": [
                {
                    "type": "output_text",
                    "text": "这是AI生成的以伦敦标志性建筑伊丽莎白塔(俗称大本钟)为核心的延时风格画面:黄昏时分,一旁的威斯敏斯特桥上车辆往来穿梭,大本钟的指针快速转动,搭配暮色里的流动云景,还原了伦敦都市繁忙的氛围感与城市流动感。"
                }
            ],
            "status": "completed",
            "id": "msg_02177494781113400000000000000000000ffffac191df76e81c9"
        }
    ],
    "service_tier": "default",
    "status": "completed",
    "usage": {
        "input_tokens": 6385,
        "output_tokens": 370,
        "total_tokens": 6755,
        "input_tokens_details": {
            "cached_tokens": 0
        },
        "output_tokens_details": {
            "reasoning_tokens": 307
        }
    },
    "caching": {
        "type": "disabled"
    },
    "store": true,
    "expire_at": 1775207001
}
修改于 2026-04-07 09:10:19
上一页
OpenAI-ChatCompletions
下一页
OpenAI-Responses
Built with