成立于 2019 年,由清华大学计算机系知识工程实验室(KEG)技术成果转化而来。2025 年 12 月 30 日在港交所上市(HK.2513),被称为"中国大模型第一股"。核心团队包括清华大学教授唐杰、CEO 张鹏等。
关键财务数据(2025年报):MaaS API 平台 ARR 约 17 亿元(同比提升 60 倍),API 业务毛利率提升至 18.9%。机构客户占比 84.5%,已成为国内收入规模最大的大模型公司。
智谱构建了覆盖文本、视觉、视频、语音、代码等多模态的完整模型矩阵,核心为 GLM(General Language Model)系列。
| 模型 | 定位 | 上下文 | 特点 | API定价(元/百万token) |
|---|---|---|---|---|
| GLM-5.1 | 旗舰模型 | 128K+ | 面向长程任务,可独立工作8小时,自主规划执行,对标 Claude Opus | 输入 8 / 输出 8 |
| GLM-5 | 旗舰模型 | 128K | DSA稀疏注意力,异步RL训练,全面兼容七大国产算力平台 | 输入 5 / 输出 5 |
| GLM-5-Turbo | 高性价比旗舰 | 128K | GLM-5 的加速版,平衡性能与成本 | 输入 5 / 输出 7 |
| GLM-4.5 | 智能体基础模型 | 128K | MoE架构,总参数3550亿,专为Agent应用打造,开源 | 输入 1 / 输出 1 |
| GLM-4.5-Air | 轻量智能体模型 | 128K | GLM-4.5 的轻量版,更低延迟 | 输入 0.5 / 输出 0.5 |
| GLM-4-Plus | 高性能模型 | 128K | PPO强化学习,数学代码推理增强 | 输入 2 / 输出 2 |
| GLM-4-Flash | 免费模型 | 128K | 智谱首个免费API模型,极低延迟 | 免费 |
| GLM-4-Long | 超长上下文 | 1M | 支持100万token超长文本处理 | 输入 0.1 / 输出 0.1 |
| GLM-4-Air / AirX | 轻量模型 | 128K | 高性价比,适合大规模部署 | 输入 0.1 / 输出 0.1 |
图像/视频理解模型,具备时间感知的视频理解能力,国内首个通用视频理解模型。支持复杂视频内容处理。
视觉理解文生图模型,支持高质量图像生成,具备出色的风格控制和细节还原能力。
图像生成视频生成大模型,新增首尾帧生成功能,画面稳定度和清晰度大幅提升,支持高清现实及3D风格场景。
视频生成轻量图文解析模型,高精度高效率,支持多种常见复杂文档解析,性能SOTA。
文档解析对标 OpenAI Operator 的自主智能体,能探究开放式问题并根据结果执行操作。支持微信、微博、淘宝、京东等超50款主流App操作。
AI Agent手机智能助理框架,支持用自然语言自动完成App操作,已开源。
手机操控AI编程助手,支持代码生成、补全、解释、翻译。提供VS Code、JetBrains等IDE插件,免费使用。
编程助手基于GLM模型的编程智能体,能自主操作代码库,管理上下文、调度工具并执行编程任务。
编程Agent智谱的旗舰C端AI助手产品,基于GLM系列模型。支持多轮对话、内容创作、信息归纳、代码编写、PPT生成、视频通话等功能。提供Web端、iOS/Android App。
每月仅需 20 元,即可畅享 GLM-4.5 及 GLM-4.5-Air 模型的编码服务。编码性能接近 Claude Sonnet 4,但价格仅为后者的七分之一。提供 Coding Agent 能力,支持代码库级别的自主编程。
¥20/月面向开发者的MaaS(Model as a Service)平台,提供所有GLM系列模型的API调用服务。
提供文本对话、图像理解、图像生成、视频生成、Embedding、OCR等全系列API。支持HTTP/SDK调用,提供Python、Java、Node.js等多语言SDK。
新用户注册即享 2000万 Tokens。GLM-4-Flash 模型完全免费。新模型限时免费体验。
提供RAG知识库构建能力,支持文档上传、向量检索、智能问答。开箱即用的企业知识管理方案。
提供Agent开发框架,支持工具调用、多轮规划、代码执行等能力。可快速构建自定义AI Agent。
提供数十个深度耦合业务的"应用级API",开箱即用,覆盖千行百业真需求。包括PPT生成、文档分析、数据分析、营销文案、法律咨询等场景化API。
提供GLM-4、GLM-4V等模型的本地私有化解决方案,支持一体机交付。满足金融、政务、军工等对数据安全有严格要求的行业。
面向企业和园区的MaaS平台方案。与上海张江集团合作发布"模力社区-智谱大模型MaaS平台",支持企业"拎包可用"。
覆盖金融、政务、教育、医疗、制造、零售等行业。提供定制化的AI应用开发、模型微调、系统集成等服务。
全面兼容华为昇腾、寒武纪、海光、摩尔线程等七大国产算力平台,实现软硬协同优化。
智谱持续开源核心模型,包括 GLM-4-9B、GLM-4.5(3550亿参数MoE)、ChatGLM系列等。GLM-4.5 在全球开源模型中排名第一,在多项基准测试中接近闭源顶尖水平。
完全免费的AI编程助手,支持VS Code、JetBrains全家桶、Vim/Neovim等IDE。基于GLM模型,提供代码补全、生成、翻译、解释等功能。已有数百万开发者使用。
| 层级 | 产品/服务 | 目标用户 | 商业模式 |
|---|---|---|---|
| C端应用 | 智谱清言(Web/App) | 个人用户 | 免费+会员订阅 |
| GLM Coding Plan | 开发者/程序员 | ¥20/月订阅 | |
| CodeGeeX(IDE插件) | 开发者 | 免费 | |
| 开发者平台 | 开放平台 API(bigmodel.cn) | 开发者/企业 | 按量付费(Token计费) |
| 精选智能体API(zhipuai.cn) | 企业/ISV | 按量付费 | |
| 知识库应用 | 企业 | 平台订阅 | |
| 企业服务 | 私有化部署(一体机) | 大型企业/政府 | 项目制+年费 |
| 智谱星河 MaaS平台 | 园区/产业集群 | 平台订阅 | |
| 行业解决方案 | 各行业 | 项目制 | |
| 开源生态 | GLM-4.5 / GLM-4-9B | 研究/社区 | 开源免费 |
| AutoGLM-Phone | 研究/社区 | 开源免费 | |
| 模型层 | GLM-5.1 / GLM-5 / GLM-4.5 / GLM-4系列 | 全部上层产品 | 底层能力 |
| GLM-4V / CogViewX / CogVideoX / GLM-OCR | 全部上层产品 | 多模态能力 |
核心商业逻辑:模型足够强 → API本身就是最好的商业模式。以免费模型(GLM-4-Flash)吸引开发者,以高性价比API(GLM-4.5系列)实现规模化,以旗舰模型(GLM-5系列)获取高价值客户,以私有化部署服务大型企业。2025年MaaS平台ARR达17亿元,同比60倍增长。