部分大模型具备图片视觉理解能力,支持本地文件和图片 URL 方式传入图片,适用于图片描述、分类、视觉定位等场景。aihub平台的新用户?获取 API Key 及 开通模型等准备工作,请参见【快速入门】。
模型与API#
Responses API:支持图片作为输入进行分析。支持文件路径上传进行图片理解。
图片传入方式#
文件路径上传(推荐):直接传入本地文件路径,文件大小不能超过 512 MB。
Base64 编码传入:适用于图片文件体积较小的场景,单张图片小于 10 MB,请求体不能超过 64 MB。
图片 URL 传入:适用于图片文件已存在公网可访问 URL 的场景,单张图片小于 10 MB。
Chat API 是无状态的,如需模型对同一张图片进行多轮理解,则每次请求时都需传入该图片信息。
本地文件上传#
文件路径上传(推荐)#
建议优先采用文件路径方式上传本地文件,该方式可以支持最大 512MB 文件的处理。(当前 Responses API 支持该方式)