搜索历史清空

闫俊杰的“赌性”

 财中社 孙语彤  2025-08-08 21:36  1.9w阅读

正确的方式是“应该非常清晰地定义模型能力分级,然后搞清楚每一代提升,需要什么样的算法、数据和推理过程,通过技术手段来逼近定义好的指标”。

MiniMax(上海稀宇科技有限公司)公司副总裁、战略投资人魏瀚瞳日前离职,消息称他将入职一家投资机构。

魏瀚疃投资领域履历丰富,曾在平安、字节跳动(以下简称“字节”)、小红书等公司任职,2024年5月加入MiniMax,主要负责战略投资板块,对大模型公司投融资、产业链布局、拓展业务边界意义重大。

魏瀚疃不是MiniMax首位离职的副总裁。此前的2月,MiniMax副总裁、商业化负责人魏伟离职,MiniMax随即对C端产品进行了拆分与重新定位。再早前,曾主导开发MiniMax C端AI角色扮演产品“星野”及其海外版本“Talkie”的产品负责人张前川,于2024年9月淡出MiniMax,改任产品顾问。

传出港股IPO(首次公开募股)的消息后,高级别商业化负责人、战略投资负责人的陆续离开,MiniMax是否遭遇了年初“DeepSeek时刻”后的再次暴击?

押注App工厂

1989年出生于河南的闫俊杰,本硕就读于清华大学自动化系,2015年博士毕业于中国科学院自动化研究所,继续在清华大学计算机系从事博士后研究。期间,闫俊杰加入了当时正值巅峰的商汤(00020),历任商汤副总裁、研究院副院长和智慧城市事业群 CTO,主导商汤核心算法研发和平台技术建设。

2021年12月,商汤上市前夕,闫俊杰却毅然选择离职创立MiniMax。

彼时,人工智能的上一轮泡沫即将破灭,大量研发资金投入之下,人工智能应用却多局限于人脸识别、语音识别等简单领域,创造的社会价值不高。

闫俊杰意识到,核心问题在于人工智能不够通用,定制算法的商业模式成本高、周期长,难以服务大众。而他恰巧看到了OpenAI关于GPT-3的论文,深受启发,认为将模型放大10倍,AGI(通用人工智能)的技术路线或可成立。基于此,2021年底,MiniMax注册成立。

成立之初,和许多大模型创业公司一样,MiniMax面临着巨大的生存压力。在市场推广方面,同批大模型创业者拿着故事四处讲愿景,而MiniMax连品牌官网都晚于产品上线。但凭借“清华-商汤-技术挂帅”的口碑,MiniMax还是拿到了真格基金、红杉中国、明势资本等头部VC的投资。

2023年,融到腾讯(00700)领投的A轮2.5亿美元,闫俊杰站在十字路口——是像OpenAI般专注底层模型?还是效仿字节跳动打造产品矩阵?他当时选择了后者。

MiniMax开启了“App工厂”模式。2023年6月,海外版AI社交应用Talkie登陆欧美市场。三个月后,在高瓴的牵线下,字节旗下今日头条用户产品负责人张前川出任MiniMax合伙人,国内版“星野”同期上线。张前川主导了两款产品不少商业化玩法。同年末,生产力工具“Hailuo(海螺)AI”加入产品阵列。

闪电战初期战绩斐然。

Sensor Tower数据显示,2024年上半年Talkie在美国下载量达380万次,超越Character.ai跻身行业第四。截至2024年9月,MiniMax全线产品日交互量突破30亿次,包含了每天处理超3万亿文本token、日均生成2000万张图片、7万小时语音。

星野AI的成功,让MiniMax在C端市场初步站稳脚跟,也让闫俊杰看到了产品导向策略的可行性。此后,MiniMax又陆续推出VoiceAI(语音合成)、Agent套件(自动对话)、API开放平台等产品,逐步完善产品矩阵,走的都是产品快速落地、优先服务可变现、可扩散的产品导向路线。

但据前员工透露,为支撑产品增长,MiniMax每月营销费用超千万美元。2024年初定下的“千万日活、过亿(美元)收入”双目标,到年末仅实现不足三成——星野与Talkie合计日活约300万,全年7000万美元收入中八成依赖海外订阅。

张前川于2024年年中淡出“星野”的决策,参与“海螺AI”和部分其他产品的日常事务。2024年9月,张前川从MiniMax离职。

转向“技术驱动”

随着大模型“六小虎”阵营成型,行业竞争日益激烈。

2023年下半年,当大部分国内同行还在继续迭代稠密模型(dense model)以提升大模型性能,闫俊杰却做出了一个大胆的决策,几乎把全部研发和算力资源都投到了更不确定的MoE(混合专家系统)模型研发上。

闫俊杰之所以如此“疯狂”,是因为他判断,尽管当时OpenAI尚未公开GPT-5,但其内部已完成了该模型的训练。若要实现与GPT-5相当的效果,必须采用更高效的MoE,否则受困于算力和运营资金,国内大模型公司永远不可能追上OpenAI。

为了研发MoE,闫俊杰带领团队于2023年夏天开始技术攻关。他把当时手头80%的算力资源都用来推MoE,这场豪赌险些让公司崩盘——前两次训练失败几乎耗尽当期融资,直到第三次冲刺才在2024年1月推出国内首个MoE大模型。

作为MiniMax的投资人,明势创投创始合伙人黄明明曾评价闫俊杰“在认定终极目标后,会把所有资源all in去赌这件事”。

事实证明,闫俊杰的这次豪赌,为MiniMax在技术层面带来巨大突破,更为MiniMax 2024年日活和营收“双目标”失败、遭遇DeepSeek暴击后寻找突围路径埋下伏笔。

2025年1月15日,MiniMax开源新一代MiniMax-01模型,首次在4000亿参数规模应用线性注意力架构,将上下文处理能力提升至400万token(GPT-4的32倍)。

闫俊杰指出,开源的核心价值在于加速技术进化,他认为智能水平的提升,没那么依赖用户规模,所以此时MiniMax最重要的目标是“加速技术迭代”,并坚定了要做一家技术驱动型公司的念头,开始有意识打造技术品牌。

但彼时,MiniMax的开源并未激起更大浪花,反而是DeepSeek-R1在2025年1月20日海内外全网刷屏。

面对DeepSeek冲击,国内模型厂商分成两队,一队拥抱并接入;另一队埋首苦研自家推理模型。闫俊杰的选择有点儿“骑墙”:MiniMax在国内C端应用上不接入,海外AI应用上接入DeepSeek。

“DeepSeek时刻”后,“AI六小虎”进入了“沉寂期”,MiniMax也不例外。外界所关注到的是MiniMax的高层人事震荡、2024年目标未达成,不知道的则是闫俊杰对MiniMax产品路线的全面转型——技术优先。

“2024年年初定目标时,用的还是移动互联网的业务逻辑,认知还没转变。”闫俊杰《晚点》受访时复盘称,中国人工智能产业过去一两年一直有个巨大的误区,认为用户越多,模型能力提升越快,这个逻辑非常错;正确的方式是“应该非常清晰地定义模型能力分级,然后搞清楚每一代提升,需要什么样的算法、数据和推理过程,通过技术手段来逼近定义好的指标”。

闫俊杰意识到这一根本性不同,是在2024年三四月份。也是从彼时起,“技术驱动”成为MiniMax做选择的第一衡量标准。

比如海螺视频,按月访问量是全球最大的视频生成应用,但其页面很粗糙,甚至刚上线时,虽然有很多海外用户,却没有英文界面。闫俊杰的解释是,“一旦你去解决这些简单问题,模型进步速度就会变慢,因为精力会分散”,MiniMax的选择是“听算法的,优先做算法上限高的功能”。

留在牌桌上

这样的选择有时看起来甚至特别不符合常理。

有投资人透露,2024年和闫俊杰一起找算力,闫俊杰极致追求便宜租金、更短租期。甚至有供应商提出,可以给MiniMax一些当地To B AI订单,让其考虑贵一点的租金。但闫俊杰直接说MiniMax不需要订单。

“其实不要订单的原因是我们交付不了,答应了会分散自己的精力,也把别人坑了。”闫俊杰《晚点》受访时回应称,“创业的前提是你有独特的理解。第二是,你的资源很可能不是最多的,这也是好事,逼你一定要做出真正的创新。”

也是基于此,DeepSee时刻出现后,MiniMax内部并未自乱阵脚,内部还是保持原有计划,专注于技术研发。

“我们内部确实有对标o1(OpenAI文本推理模型)的方案,但做个表面相似的产品发新闻稿没意义。”闫俊杰《晚点》受访时复盘称。

这种坚持在2025年6月技术周得到验证,MiniMax连发5款新品,其中M1推理模型的强化学习成本仅53万美元,不足行业均值的四分之一。

而认准了当下阶段的“技术驱动”,与此不符的调整和让路,似乎也就成为必然。魏瀚曈2024年5月加入公司,2月还主导了MiniMax的硬件领域布局,成立了智能硬件创新联盟,其在MiniMax的任职时间仅一年略多。张前川的离开,也大致与MiniMax不再像重视技术那样重视产品有关。

但对于更早去职的商业化副总裁魏伟,也有传闻称是因未完成融资KPI而离开。

“本质上是,这个事儿应该是技术驱动的,不是所有人都合适。”闫俊杰《晚点》受访回应“劝退”部分中高层离开 MiniMax时称,“不应该假定,一个公司不会有变动和流失。有才是合理的。”

而基于上述认知,闫俊杰选人的标准调整为“主要的变化不在于组织架构,而是对人的要求”:一是希望各方向的 leader是提方案的人,而不要等着别人来提方案,应该更hands on(上手)。二是想要根据客观状态分析找到理性方案的人,而不是直接复制上一家公司经验的人。

幸运的是,闫俊杰押注技术的路线获得了资本方的新认可:继2024年3月阿里巴巴(BABA/09988)领投6亿美元后,2025年7月上海国资联合产业资本再次向MiniMax注资3亿美元,公司估值也飙升至40亿美元(约288亿元人民币)。Minimax甚至传出港股IPO消息,与同样筹备上市的智谱AI争夺“中国AI上市第一股”称号。

有业内人士指出,“你只有最后交付一个产品,才容易做商业化,才有可能达到上市的体量。快手(01024)可灵交付的也是一个生产工具,大家看重的也是产品,而非快手的视频模型。”

数据显示,尽管MiniMax在技术研发上取得了一系列成果,但在市场推广和用户认知方面,挑战并未减少。截至7月10日,M1在HuggingFace最热帖下载量仅25.2K,不足DeepSeek-R1的零头。

“半年多以前,很多人觉得我有些焦虑,最近半年不再焦虑了。核心是开始意识到要做取舍。”闫俊杰说。

重要提示: 本文著作权归财中社所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至editor@caizhongshe.cn。

长按保存图片

相关文章

24小时热门文章

最新文章