1. 视频理解
API接入文档
  • 快速入门
  • 模型调用
    • 聊天
      • OpenAI-ChatCompletions
      • OpenAI-Responses
      • Anthropic-Claude
    • 图片理解
      • OpenAI-ChatCompletions
      • OpenAI-Responses
    • 视频理解
      • OpenAI-ChatCompletions
        POST
      • OpenAI-Responses
        POST
    • 文档理解
      • OpenAI-Responses
    • 图像(Images)
      • OpenAI-图像生成
      • OpenAI-图像编辑
      • 阿里千问-图像生成
      • 阿里千问-图像编辑
    • 嵌入/向量化(Embeddings)
      • 向量化
    • 重排序(Rerank)
      • 文档重排序
  • 接入三方工具
    • 接入 Chatbox
    • 接入 Dify
    • 接入 Cherry Studio
    • 接入 Claude Code
    • 接入 OpenCode
    • 接入 OpenClaw(原Clawdbot)
    • 接入 Cline
    • 接入 Cursor
    • 接入 Roo Code
    • 接入 Kilo Code
    • 接入 Codex CLI
    • 接入 LangChain
  1. 视频理解

OpenAI-ChatCompletions

POST
/v1/chat/completions
Chat API 示例代码如下。

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Header 参数

Body 参数application/json必填

示例
{
    "model": "doubao-seed-2-0-pro-260215",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "video_url",
                    "video_url": {
                        "url": "https://ark-project.tos-cn-beijing.volces.com/doc_video/ark_vlm_video_input.mp4",
                        "fps": 1
                    }
                }
            ]
        }
    ]
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/v1/chat/completions' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "doubao-seed-2-0-pro-260215",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "video_url",
                    "video_url": {
                        "url": "https://ark-project.tos-cn-beijing.volces.com/doc_video/ark_vlm_video_input.mp4",
                        "fps": 1
                    }
                }
            ]
        }
    ]
}'

返回响应

🟢200成功
application/json
Body

示例
{
    "choices": [
        {
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null,
            "message": {
                "content": "这是AI生成的伦敦城市景观,画面核心的钟楼是伊丽莎白塔,常被俗称“大本钟”,它是伦敦威斯敏斯特宫的标志性建筑,旁侧跨河的是威斯敏斯特桥,画面里的红色双层巴士也是伦敦极具代表性的城市符号,整体是延时摄影风格,模拟的是傍晚通勤高峰的城市氛围,不过作为AI生成内容,它和现实里大本钟、威斯敏斯特桥的实际相对位置、建筑细节存在创作性偏差。",
                "reasoning_content": "\n用户现在需要识别这个场景对吧?首先看建筑,大本钟(伊丽莎白塔),还有泰晤士河上的威斯敏斯特桥,红色双层巴士是伦敦标志性的,还有车流的延时摄影对吧?首先说这是AI生成的伦敦标志性场景:主体是伊丽莎白塔(常称大本钟),旁边的桥是威斯敏斯特桥,典型的伦敦红色双层巴士、傍晚/黄昏的天际线,车流是延时效果,不过要注意现实里大本钟的位置和桥的相对位置?不对哦不对,现实里威斯敏斯特桥看大本钟的角度?不对,AI生成的可能有细节偏差,比如钟面的时间?还有建筑细节?哦对右下角标了AI生成,所以首先点明:\n这个是AI生成的伦敦城市景观,核心建筑是伊丽莎白塔,俗称大本钟,是英国伦敦威斯敏斯特宫的标志性钟楼,旁边跨河的是威斯敏斯特桥,画面里的红色双层巴士也是伦敦经典的城市符号,这个是延时摄影风格的车流效果,呈现的是傍晚通勤高峰的城市氛围,不过作为AI生成内容,它和现实里大本钟与威斯敏斯特桥的实际相对位置、建筑细节存在一定的创作偏差。\n对,这样说就对了,首先点明是AI生成的,然后元素是什么,哪些是伦敦的标志,然后说创作偏差的点。",
                "role": "assistant"
            }
        }
    ],
    "created": 1774948041,
    "id": "02177494802273800bcc3116dfc56b9203b01425516f61bf4ba63",
    "model": "doubao-seed-2-0-pro-260215",
    "service_tier": "default",
    "object": "chat.completion",
    "usage": {
        "completion_tokens": 401,
        "prompt_tokens": 6385,
        "total_tokens": 6786,
        "prompt_tokens_details": {
            "cached_tokens": 0
        },
        "completion_tokens_details": {
            "reasoning_tokens": 295
        }
    }
}
修改于 2026-04-07 09:10:49
上一页
OpenAI-Responses
下一页
OpenAI-Responses
Built with