智谱清影是智谱 AI 推出的一款 AI 视频生成工具
- 功能特点
- 文生视频:用户输入文本描述或脚本,AI 根据文本信息生成视频内容。
- 图生视频:用户上传一张或多张静态图像,AI 分析图像内容后生成动态视频,还能让老照片 “动起来”。
- 风格多样:提供多种视频风格,如卡通 3D、黑白、油画、电影感、真实摄影风格、二次元动漫风格等。
- 快速生成:借助自研 CogVideoX 模型,能在 30 秒内生成一个 6 秒的 1440×960 清晰度的视频,推理时间从以往的分钟级压缩到了秒级。
- 高可控性:通过优化技术和自研的端到端视频理解模型,提升对用户指令的遵循能力,生成的视频更贴近用户创意意图。
- 自带配乐:支持为生成的视频添加背景音乐,包括安静、轻松欢快、伤感、史诗、搞怪等类型。还结合 CogSound 模型,自动匹配场景音效,支持外语配音。
- API 支持:企业和开发者可通过 API 调用,集成文生视频和图生视频能力到自己的应用中。
- 技术基础:基于智谱 AI 自研的视频生成大模型 CogVideoX,采用类似于 Sora 的 DiT 结构,能够融合文本、时间和空间信息,优化后的模型推理速度比前代提升了 6 倍。
- 应用场景:适用于个人创作、广告营销、影视辅助、教育等多场景。例如,短视频博主和自媒体人可快速制作创意内容,电商平台能生成商品动态展示视频,企业可制作低成本宣传片,导演可用于预演分镜等。