“狠人”閆俊杰，闖關(guān)IPO_中國經(jīng)濟網(wǎng)—

“MiniMax在探索一條之前沒有被驗證過的路?！?/span>

文｜《中國企業(yè)家》記者孔月昕

6月17日，在MiniMax官方公眾號發(fā)布了全球首個開源大規(guī)?；旌霞軜?gòu)推理模型MiniMax-M1后，公司創(chuàng)始人閆俊杰隨即轉(zhuǎn)發(fā)到朋友圈，并配文稱：“第一次感覺到大山不是不能翻越?！?/p>

之所以這么說，是因為M1模型通過以閃電注意力機制為主的混合架構(gòu)和更快的強化學(xué)習(xí)算法CISPO（一種強化學(xué)習(xí)算法，通過裁剪重要性采樣權(quán)重提升強化學(xué)習(xí)效率）兩項技術(shù)突破，實現(xiàn)了深度推理的顯著高效，并提升了強化學(xué)習(xí)的效率。據(jù)公司介紹，整個強化學(xué)習(xí)階段只用了512塊H800三周的時間，換算成（算力）租賃成本為53.47萬美元。

除了M1外，在之后的4個工作日里，MiniMax又連續(xù)發(fā)布了Hailuo 02視頻生成模型、MiniMax Agent通用智能體、Hailuo Video Agent視頻創(chuàng)作智能體、Voice Design音色設(shè)計。在MiniMax Agent發(fā)布當(dāng)天，閆俊杰的朋友圈配文是：“研發(fā)中越來越強烈的感受是AI的價值可以開始被經(jīng)濟來衡量?！?/p>

與此同時，MiniMax在資本市場也有新消息傳出。6月，公司被爆出正考慮在港股IPO的消息。

這一消息并非空穴來風(fēng)：早在2024年，MiniMax旗下產(chǎn)品星野AI（Talkie）的營收已突破千萬美元，在海外市場表現(xiàn)尤其出色，下載量曾超越CharacterAI，成為美國AI應(yīng)用Top4。財務(wù)實力的支撐更為關(guān)鍵——知情人士透露，公司今年以來通過多輪未公開融資，積累了充足的現(xiàn)金儲備（約十幾億美元）。近期還完成了Pre-IPO融資，使其成為大模型創(chuàng)業(yè)公司中資金最雄厚的玩家。

截至發(fā)稿，對于資本市場相關(guān)進展，公司方面并未正面回應(yīng)。

充足的現(xiàn)金儲備讓閆俊杰具備了高度的戰(zhàn)略自主權(quán)，也讓這位“賭性”很重的創(chuàng)業(yè)者，能堅定推行“加速技術(shù)迭代”的發(fā)展路徑。明勢創(chuàng)投合伙人夏令此前參加活動時，曾評價MiniMax是“一家兼具野心、資源實力與非共識堅持的公司”，明勢創(chuàng)投創(chuàng)始合伙人黃明明則稱，“閆俊杰是一個‘狠人’，在資源等方方面面有限的情況下，他還是專注在模型研發(fā)上。只有這樣的企業(yè)家可能才能走得更遠，走到終局?！?/p>

錨定MoE架構(gòu)破局

2021年12月，商湯上市前夕，作為副總裁、研究院副院長和智慧城市事業(yè)群CTO的閆俊杰，選擇離開商湯。

在閆俊杰看來，2020年之前，AlphaGo做過很多東西，整個社會對人工智能的關(guān)注度和期待值都非常高，且國內(nèi)外都投入了大量的研發(fā)資金，但當(dāng)時的人工智能只能做一些非常簡單的事，比如人臉識別、語音識別等，創(chuàng)造的社會價值比較低。

對于當(dāng)時的閆俊杰來說，這是一件“很痛苦的事”，他逐漸意識到，核心因素在于當(dāng)時的人工智能不夠通用。

“當(dāng)時我們用虛擬模型解決客戶的問題，一旦客戶有無數(shù)個問題，就得做無數(shù)個模型，即每做一個模型就要訓(xùn)練一次，還要導(dǎo)數(shù)據(jù)，整個生產(chǎn)鏈條非常慢。因此我們只能服務(wù)一些大客戶，因為企業(yè)需要定制，但定制的成本周期很長，商業(yè)模式也變成了定制模型。”閆俊杰回憶。

他在思考的是，“如果不做定制模型，把模型做得通用，是不是就可以服務(wù)普通人了？”

同時，閆俊杰恰好看到了OpenAI關(guān)于GPT-3的論文，并受到啟發(fā)，“把（GPT）模型放大10倍，技術(shù)路線就可能成立了。”

不過，做通用的工具和閆俊杰在商湯的研發(fā)路線完全不一樣，需要的人才、組織結(jié)構(gòu)也不一樣，閆俊杰由此發(fā)現(xiàn)，“這應(yīng)該是一家新興公司的機會。”2022年初，MiniMax正式成立。

云啟資本是MiniMax早期投資方之一，合伙人陳昱最初跟閆俊杰接觸時，就發(fā)現(xiàn)閆俊杰是一位野心比較大的創(chuàng)業(yè)者，“他想做中國的OpenAI或DeepMind，最終實現(xiàn)通用人工智能”。

在技術(shù)路線的選擇上，閆俊杰也非常大膽。

2023年下半年，大部分中國同行還在繼續(xù)迭代稠密模型（dense model），它能更穩(wěn)健地提升大模型性能。閆俊杰則幾乎把全部研發(fā)和算力資源都投到了一件更不確定的事情上——MoE（混合專家系統(tǒng)）模型。

黃明明回憶，彼時，MoE在硅谷都不是主流共識，只有OpenAI在做，甚至MoE的提出者，都沒有把MoE這條路堅持走下去。

在閆俊杰看來，盡管OpenAI尚未公開GPT-5，但其內(nèi)部已完成了該模型的訓(xùn)練。GPT-5的訓(xùn)練需要高達5萬張卡的算力，短期內(nèi)，國內(nèi)難以達到3萬張卡的規(guī)模，因此若要實現(xiàn)與GPT-5相當(dāng)?shù)男Ч?，必須采用更高效的算法（MoE），否則就永遠追不上（OpenAI）。因此，MoE也成了團隊“一定要做的事情”。

2023年夏天，閆俊杰帶領(lǐng)MiniMax團隊開始專注研發(fā)MoE。

黃明明認為，閆俊杰看上去是一個很溫和的人，實際上他很瘋狂。在認定終極目標(biāo)后，他會把所有資源all in，去賭這個事情。

“他把當(dāng)時手頭80%的算力資源都用來推MoE?！秉S明明說，“前兩次是失敗的，直到第三次成了，他才跑過來跟我們（投資人）講，MoE差不多能搞定了?！?/p>

黃明明問閆俊杰：“為什么你要賭這么大？你賭不出來，可能這家公司就掛了。”

閆俊杰的回復(fù)是，“只有我把MoE做出來，才能用更低的成本向更高的模型階段去演進，否則用的是一個不可估量的成本去往下一步，沒有一家公司能支持這樣token的消耗量去往更高的平臺進化?！?/p>

應(yīng)對DeepSeek，慢了一步

2025年1月15日，MiniMax發(fā)布了首個開源模型MiniMax-01系列。

在接受晚點采訪時，閆俊杰指出，開源的核心價值在于加速技術(shù)進化?！案玫哪Ｐ涂梢詫?dǎo)向更好的應(yīng)用，但更好的應(yīng)用和更多用戶并不會導(dǎo)向更好的模型?！遍Z俊杰說。想清楚“智能水平的提升，沒那么依賴用戶規(guī)模”后，閆俊杰做出了取舍，他認為現(xiàn)在MiniMax最重要的目標(biāo)不是增長，也不是收入，是“加速技術(shù)迭代”，并堅定了要做一家技術(shù)驅(qū)動型公司的念頭，開始有意識地打造技術(shù)品牌。

但從行業(yè)變化看，閆俊杰還是“慢”了一步。2024年12月26日，DeepSeek-V3發(fā)布后，在業(yè)內(nèi)形成一定的口碑和品牌效應(yīng)。2025年1月20日，DeepSeek-R1發(fā)布，在大眾層面掀起的聲量迅速蓋過了相對低調(diào)的MiniMax，進一步搶奪了C端用戶的心智。

面對洶涌而來的DeepSeek沖擊波，國內(nèi)模型廠商主要分成了兩隊，一隊是積極擁抱，大力宣傳旗下產(chǎn)品接入DeepSeek；另一隊是堅決不接入DeepSeek，并死磕自研自己的推理模型。

MiniMax的選擇是，在國內(nèi)C端應(yīng)用上堅持不接入DeepSeek，只在海外的AI應(yīng)用上選擇接入DeepSeek。

同時，據(jù)MiniMax內(nèi)部員工透露，DeepSeek發(fā)布并沒有影響他們研發(fā)團隊的節(jié)奏，內(nèi)部還是保持原有計劃，專注且低調(diào)地進行技術(shù)研發(fā)。

黃明明也表示，他們非常認可MiniMax持續(xù)專注在底層模型的研發(fā)上?！昂玫膽?yīng)用或好的產(chǎn)品，都是模型能力自然而然的體現(xiàn)，模型能力強了，一定會做出好的產(chǎn)品。事實證明，當(dāng)模型能力不夠強時，做出的產(chǎn)品就需要很多縫縫補補，打很多補丁，耗費巨大的人力和物力，并喪失你在底層模型上的專注度。”黃明明說。

6月中旬，MiniMax連續(xù)發(fā)布了包括基礎(chǔ)模型及應(yīng)用在內(nèi)的5款產(chǎn)品，業(yè)內(nèi)對于其模型和應(yīng)用的產(chǎn)品評價比較正面，Hugging Face工程師王鐵震告訴《中國企業(yè)家》：“MiniMax在探索一條之前沒有被驗證過的路，非常有價值?！?/p>

（注：Hugging Face是一家成立于2016年的美國人工智能公司，致力于構(gòu)建開源的機器學(xué)習(xí)社區(qū)和平臺，提供豐富的預(yù)訓(xùn)練模型、數(shù)據(jù)集和工具，幫助開發(fā)者更便捷地構(gòu)建、訓(xùn)練和部署AI應(yīng)用。）

不過，MiniMax-M1系列模型并未引發(fā)大范圍轟動。截至7月10日，其在Hugging Face最熱帖下載量僅25.2K，GitHub最熱帖收藏量僅3K——這一數(shù)據(jù)明顯低于Google、Meta今年初發(fā)布的開源模型，也遜色于DeepSeek-R1的收藏及下載量。

部分Agent創(chuàng)業(yè)者反饋，雖注意到MiniMax M1模型的發(fā)布，但因自身產(chǎn)品上線排期緊張，暫未及時投入測試。另一位AI領(lǐng)域創(chuàng)業(yè)者告訴《中國企業(yè)家》，當(dāng)前海外AI領(lǐng)域熱點頻發(fā)（如GPT-5發(fā)布在即，Meta新模型迭代），分散了行業(yè)注意力，客觀上削弱了M1的傳播聲量。在他看來，國際模型技術(shù)仍具備一定領(lǐng)先優(yōu)勢。

對此，一位MiniMax投資人表示，MiniMax一貫的風(fēng)格是相對低調(diào)和克制，它最后交付的產(chǎn)品口碑，可能比大家記住模型名字或下載量更重要。

“你只有最后交付一個產(chǎn)品，才容易做商業(yè)化，才有可能達到上市的體量。快手的可靈交付的也是一個生產(chǎn)工具，大家看重的也是產(chǎn)品，而非快手的視頻模型?！痹撏顿Y人補充道。

（責(zé)任編輯：孫丹）

天堂精品高清1区2区3区,国产伦精品一区三区视频,国产视频欧美,欧美国产一区二区三区,午夜大片男女免费观看,狠狠色狠狠色综合网,手机看片日韩欧美

“狠人”閆俊杰，闖關(guān)IPO

“狠人”閆俊杰，闖關(guān)IPO

“狠人”閆俊杰，闖關(guān)IPO

“狠人”閆俊杰，闖關(guān)IPO