Grok Imagine 图生视频是什么?

Grok Imagine 是一个 AI 视频生成模型,在 UniAll AI 中的公开模型 ID 为 `grok-imagine`。它支持两种主要模式:

  • **图生视频(image_to_video)**:上传 1 张参考图,并用提示词描述镜头运动、风格、动作和氛围。
  • **文生视频(text_to_video)**:仅通过文本提示词生成视频。

对于“Grok Imagine 图生视频”场景,模型会基于参考图延展动态画面,适合保留主体外观、产品形态、角色设定或视觉风格。

适合哪些用户?

Grok Imagine 图生视频适合:

  • **电商与品牌团队**:将产品图变成短视频展示、开箱感镜头或广告素材。
  • **内容创作者**:为小红书、抖音、YouTube Shorts 等平台制作竖版或横版动态内容。
  • **设计与游戏团队**:把概念图、角色图、场景图转成动态预览。
  • **开发者与自动化团队**:通过 API 批量生成视频素材,接入内容生产流水线。

核心能力与参数

`grok-imagine` 在 UniAll AI 支持异步视频生成,主要参数如下:

| 参数 | 说明 | | --- | --- | | `prompt` | 必填,描述视频内容、镜头、动作、风格与光线 | | `generation_mode` | `image_to_video` 或 `text_to_video` | | `image_url` | 图生视频时使用,支持 PNG、JPEG、WebP | | `duration` | 视频时长,1–15 秒 | | `aspect_ratio` | 支持 16:9、4:3、3:2、1:1、2:3、3:4、9:16 | | `resolution` | 支持 480p 或 720p | | `video_count` | 当前每次生成 1 个视频 |

建议先用 5–6 秒测试提示词效果,再根据用途扩展到更长时长。

图生视频提示词写法

好的提示词应同时说明主体、动作、镜头和风格。例如:

```text A cinematic product reveal, the camera slowly pushes in, soft studio lighting, subtle reflections, premium commercial style, smooth motion, 16:9 composition. ```

中文也可以直接使用:

```text 基于参考图生成一段高端产品展示视频,镜头缓慢推进,柔和棚拍灯光,主体保持清晰,背景轻微虚化,画面稳定,商业广告风格。 ```

实用建议:

  • 想保持主体一致:强调“主体保持一致”“不要改变产品外观”。
  • 想要镜头运动:写清楚“缓慢推进”“环绕拍摄”“轻微摇镜”。
  • 想控制风格:加入“电影感”“写实”“棚拍”“社媒广告风格”等描述。
  • 做短视频平台:优先选择 `9:16`;做官网或广告横幅:优先选择 `16:9`。

API 调用示例

UniAll AI 提供异步视频生成接口:

```http POST /v1/videos/generations ```

图生视频请求示例:

```json { "model": "grok-imagine", "generation_mode": "image_to_video", "prompt": "A cinematic product reveal, soft studio lighting, smooth camera movement.", "image_url": "https://example.com/reference.png", "duration": 6, "aspect_ratio": "16:9", "video_count": 1, "resolution": "720p" } ```

说明:该接口为异步生成,提交任务后需要根据平台返回的任务信息查询结果。开发者可以将它接入素材生成、广告批量生产、内容审核前置流程或内部创意工具。

价格与成本控制

Grok Imagine 按视频秒数计费,并区分分辨率:

  • **480p**:约 ¥0.24 / 秒
  • **720p**:约 ¥0.34 / 秒

成本估算方式很直接:

```text 总费用 ≈ 单秒价格 × 视频时长 ```

例如生成 6 秒 720p 视频,费用约为 6 × ¥0.34。若用于提示词测试,建议先选择较短时长或 480p;最终交付、广告预览或高清展示再使用 720p。

生成失败与稳定性建议

UniAll AI 对该模型支持失败退款;当前不自动重试。为了减少失败或效果偏差,建议:

  • 上传清晰、主体明确的参考图。
  • 避免在一条提示词中要求过多复杂动作。
  • 控制人物、文字、手部、复杂机械结构等高难细节。
  • 先生成短视频验证方向,再扩展时长。

什么时候选择 Grok Imagine 图生视频?

如果你已经有产品图、角色图、海报或概念图,并希望快速生成动态镜头,`grok-imagine` 的图生视频模式比纯文生视频更适合。它能让视觉起点更明确,减少“从零生成”带来的主体不确定性,适合商业素材、社媒内容和创意预演。

Grok Imagine 图生视频Grok Imagine 模型Grok Imagine 价格Grok Imagine 教程Grok Imagine 接口文档grok-imagine APIGrok Imagine AI 视频生成Grok Imagine 文生视频Grok Imagine 首尾帧视频Grok Imagine 视频续写AI 视频生成 平台文生视频 平台图生视频 平台首尾帧视频 平台

常见问题

Grok Imagine 图生视频需要哪些参数?

至少需要 `model`、`generation_mode`、`prompt` 和 `image_url`。在 UniAll AI 中模型 ID 使用 `grok-imagine`,图生视频模式使用 `image_to_video`。还可以设置 `duration`、`aspect_ratio`、`resolution` 和 `video_count`。

Grok Imagine 支持多长的视频?

当前支持 1–15 秒视频生成。默认时长通常可设为 6 秒,适合先测试镜头运动和画面稳定性。

Grok Imagine 图生视频怎么计费?

按秒计费,并根据分辨率不同而变化。480p 约 ¥0.24 / 秒,720p 约 ¥0.34 / 秒。生成 6 秒视频时,可用单秒价格乘以 6 估算成本。

站内推荐路径

Grok Imagine 怎么用:从文生视频、图生视频到 API 工作流的实操指南面向产品、运营和开发者的 Grok Imagine 教程:了解 grok-imagine 的文生视频、图生视频、异步调用、成本控制、业务落地和风险检查。文章Grok Imagine 能力评测:面向 API 接入、工作流与成本控制的视频生成指南系统评测 Grok Imagine 视频生成能力,覆盖文生视频、图生视频、视频编辑、续写、API 接入、成本控制、业务场景、风险与选型建议。文章Grok Imagine 国内可用吗?Grok Imagine API 接入、价格控制与业务落地指南面向中国团队的 Grok Imagine API 实用指南,覆盖 grok-imagine 接入方式、文生视频/图生视频工作流、价格控制、业务场景、风险与选型建议。文章Grok Imagine 应用场景指南:从短视频创意到自动化内容生产解析 grok-imagine 在文生视频、图生视频、多参考图、视频续写与自动化工作流中的适用场景、成本控制、接入边界和业务落地方法。文章Grok Imagine 替代方案怎么选:从 API 接入、成本控制到业务落地的完整对比面向产品、开发者和内容团队,系统比较 Grok Imagine 替代方案的能力边界、API 接入、成本控制、自动化工作流与业务场景,帮助评估 grok-imagine 是否适合生产环境。文章Grok Imagine 对比与接入指南:AI 视频生成场景、成本与工作流怎么选面向开发者和业务团队的 Grok Imagine 对比指南:解析 grok-imagine 的文生视频、图生视频、异步接口、成本控制、工作流落地、风险边界与选型建议。文章Grok Imagine APIGrok Imagine 可在 UniAll AI 调用,Grok Imagine 视频生成模型,支持文生视频、图生视频、多参考图、视频编辑和视频续写,可选 480p / 720p。 价格参考:$0.034000 / second。查看模型 ID、能力、价格和接入说明。模型Vidu Q3 Turbo 1080p APITurbo 与 1080p 强化了快速出片和高清交付诉求,API 词适合开发者接入、工具站上架和短视频自动化生产内容。关键词机会Sora2 Pro 1080p APISora2 Pro 1080p 同时具备模型热度、高清视频生成需求和开发者接入意图,适合抢占视频生成 API 高价值词。关键词机会Sora2 APISora2 属于高关注视频生成模型词,API 接入意图强,适合承接开发者、工具站和企业视频自动化需求;当前未在近期文章中覆盖该主关键词,具备高转化内容机会。关键词机会