MiniMax 是上海稀宇科技有限公司(成立于 2023 年 1 月)开发的多模态通用 AI 大模型,由前商汤科技副总裁闫俊杰创立,核心团队来自中科院、商汤、微软等机构。其技术路径聚焦长上下文处理与多模态融合,目标是通过 “技术普惠” 推动 AI 在实体产业的落地。
核心技术亮点:
-
线性注意力架构:
- 2025 年 1 月发布的 MiniMax-01 系列模型(含 Text-01 和 VL-01)首次大规模应用线性注意力机制,替代传统 Transformer 的 SoftMax 注意力,将计算复杂度从 O (n²) 降至 O (n),实现400 万 token 超长上下文处理(是 GPT-4o 的 32 倍)。
- 该架构在长文本任务(如 400 万 token 的 “大海捞针” 检索)中性能衰减最慢,优于 Gemini 等国际模型。
-
多模态深度整合:
- 视频生成:T2V-01-Director 模型支持高分辨率(1080P)、高帧率(30fps)视频生成,日均处理量达数百万条,全球访问量位居 AI 视频平台榜首。
- 语音与音乐:T2A-01 模型支持 17 种语言、300 + 音色,可生成 10000 字超长语音,拟人度超 90%;音乐模型支持完整歌曲创作,覆盖流行、古典等风格。
- 视觉理解:VL-01 模型在 MMMU(多模态知识测试)中得分 68.5,超越 Claude-3.5,支持图像描述、图表分析等任务。
-
行业级效率优化:
- MoE 混合专家架构:通过动态路由机制降低单次推理成本,在同等算力下吞吐量提升 3 倍。
- API 定价:输入 token 仅 1 元 / 百万,输出 8 元 / 百万,性价比优于 GPT-4o(输入 12 元 / 百万)。
MiniMax 已构建 “模型 – 工具 – 平台” 全链路生态,覆盖个人创作、企业服务、硬件集成等领域:
-
C 端产品:
- 海螺 AI:全球首个 AI 视频创作平台,支持 “文本 / 图像生成视频”“视频剪辑”“AI 配音” 等功能,用户覆盖 180 个国家,日均生成视频量超 300 万条。
- 星野 AI:AI 情感陪伴工具,用户可创建个性化智能体(如虚拟偶像、学习伙伴),海外版 Talkie 月活 1100 万,50% 用户来自美国。
-
B 端解决方案:
- 智能客服:与中信银行合作,实现多模态交互(文本 + 语音 + 图像),问题解决率提升 40%。
- 智能制造:优化生产流程预测设备故障,在汽车制造场景中降低停机时间 25%。
- 教育:辅助教师生成教案、批改作业,支持多语言翻译和知识点解析,覆盖 K12 至高等教育。
-
硬件集成:
- 车载系统:与小鹏汽车合作,2025 款 G6/G9 车型搭载 MiniMax 语音助手,支持连续对话和方言识别。
- 智能家居:集成小度音箱,实现语音控制家电、日程管理等功能。