天堂精品高清1区2区3区,国产伦精品一区三区视频,国产视频欧美,欧美国产一区二区三区,午夜大片男女免费观看,狠狠色狠狠色综合网,手机看片日韩欧美

“狠人”閆俊杰,闖關(guān)IPO

2025-07-14 07:38 來源:中國企業(yè)家網(wǎng)站
查看余下全文
(責(zé)任編輯:孫丹)
當(dāng)前位置     首頁 > 新聞 > 國內(nèi)時政更多新聞 > 正文

“狠人”閆俊杰,闖關(guān)IPO

2025年07月14日 07:38   來源:中國企業(yè)家網(wǎng)站   
“MiniMax在探索一條之前沒有被驗證過的路?!?/span>

文|《中國企業(yè)家》記者 孔月昕

6月17日,在MiniMax官方公眾號發(fā)布了全球首個開源大規(guī)?;旌霞軜?gòu)推理模型MiniMax-M1后,公司創(chuàng)始人閆俊杰隨即轉(zhuǎn)發(fā)到朋友圈,并配文稱:“第一次感覺到大山不是不能翻越?!?/p>

之所以這么說,是因為M1模型通過以閃電注意力機制為主的混合架構(gòu)和更快的強化學(xué)習(xí)算法CISPO(一種強化學(xué)習(xí)算法,通過裁剪重要性采樣權(quán)重提升強化學(xué)習(xí)效率)兩項技術(shù)突破,實現(xiàn)了深度推理的顯著高效,并提升了強化學(xué)習(xí)的效率。據(jù)公司介紹,整個強化學(xué)習(xí)階段只用了512塊H800三周的時間,換算成(算力)租賃成本為53.47萬美元。

除了M1外,在之后的4個工作日里,MiniMax又連續(xù)發(fā)布了Hailuo 02視頻生成模型、MiniMax Agent通用智能體、Hailuo Video Agent視頻創(chuàng)作智能體、Voice Design音色設(shè)計。在MiniMax Agent發(fā)布當(dāng)天,閆俊杰的朋友圈配文是:“研發(fā)中越來越強烈的感受是AI的價值可以開始被經(jīng)濟來衡量?!?/p>

與此同時,MiniMax在資本市場也有新消息傳出。6月,公司被爆出正考慮在港股IPO的消息。

這一消息并非空穴來風(fēng):早在2024年,MiniMax旗下產(chǎn)品星野AI(Talkie)的營收已突破千萬美元,在海外市場表現(xiàn)尤其出色,下載量曾超越CharacterAI,成為美國AI應(yīng)用Top4。財務(wù)實力的支撐更為關(guān)鍵——知情人士透露,公司今年以來通過多輪未公開融資,積累了充足的現(xiàn)金儲備(約十幾億美元)。近期還完成了Pre-IPO融資,使其成為大模型創(chuàng)業(yè)公司中資金最雄厚的玩家。

截至發(fā)稿,對于資本市場相關(guān)進展,公司方面并未正面回應(yīng)。

充足的現(xiàn)金儲備讓閆俊杰具備了高度的戰(zhàn)略自主權(quán),也讓這位“賭性”很重的創(chuàng)業(yè)者,能堅定推行“加速技術(shù)迭代”的發(fā)展路徑。明勢創(chuàng)投合伙人夏令此前參加活動時,曾評價MiniMax是“一家兼具野心、資源實力與非共識堅持的公司”,明勢創(chuàng)投創(chuàng)始合伙人黃明明則稱,“閆俊杰是一個‘狠人’,在資源等方方面面有限的情況下,他還是專注在模型研發(fā)上。只有這樣的企業(yè)家可能才能走得更遠,走到終局?!?/p>

錨定MoE架構(gòu)破局

2021年12月,商湯上市前夕,作為副總裁、研究院副院長和智慧城市事業(yè)群CTO的閆俊杰,選擇離開商湯。

在閆俊杰看來,2020年之前,AlphaGo做過很多東西,整個社會對人工智能的關(guān)注度和期待值都非常高,且國內(nèi)外都投入了大量的研發(fā)資金,但當(dāng)時的人工智能只能做一些非常簡單的事,比如人臉識別、語音識別等,創(chuàng)造的社會價值比較低。

對于當(dāng)時的閆俊杰來說,這是一件“很痛苦的事”,他逐漸意識到,核心因素在于當(dāng)時的人工智能不夠通用。

“當(dāng)時我們用虛擬模型解決客戶的問題,一旦客戶有無數(shù)個問題,就得做無數(shù)個模型,即每做一個模型就要訓(xùn)練一次,還要導(dǎo)數(shù)據(jù),整個生產(chǎn)鏈條非常慢。因此我們只能服務(wù)一些大客戶,因為企業(yè)需要定制,但定制的成本周期很長,商業(yè)模式也變成了定制模型。”閆俊杰回憶。

他在思考的是,“如果不做定制模型,把模型做得通用,是不是就可以服務(wù)普通人了?”

同時,閆俊杰恰好看到了OpenAI關(guān)于GPT-3的論文,并受到啟發(fā),“把(GPT)模型放大10倍,技術(shù)路線就可能成立了。”

不過,做通用的工具和閆俊杰在商湯的研發(fā)路線完全不一樣,需要的人才、組織結(jié)構(gòu)也不一樣,閆俊杰由此發(fā)現(xiàn),“這應(yīng)該是一家新興公司的機會。”2022年初,MiniMax正式成立。

云啟資本是MiniMax早期投資方之一,合伙人陳昱最初跟閆俊杰接觸時,就發(fā)現(xiàn)閆俊杰是一位野心比較大的創(chuàng)業(yè)者,“他想做中國的OpenAI或DeepMind,最終實現(xiàn)通用人工智能”。

在技術(shù)路線的選擇上,閆俊杰也非常大膽。

2023年下半年,大部分中國同行還在繼續(xù)迭代稠密模型(dense model),它能更穩(wěn)健地提升大模型性能。閆俊杰則幾乎把全部研發(fā)和算力資源都投到了一件更不確定的事情上——MoE(混合專家系統(tǒng))模型。

黃明明回憶,彼時,MoE在硅谷都不是主流共識,只有OpenAI在做,甚至MoE的提出者,都沒有把MoE這條路堅持走下去。

在閆俊杰看來,盡管OpenAI尚未公開GPT-5,但其內(nèi)部已完成了該模型的訓(xùn)練。GPT-5的訓(xùn)練需要高達5萬張卡的算力,短期內(nèi),國內(nèi)難以達到3萬張卡的規(guī)模,因此若要實現(xiàn)與GPT-5相當(dāng)?shù)男Ч?,必須采用更高效的算法(MoE),否則就永遠追不上(OpenAI)。因此,MoE也成了團隊“一定要做的事情”。

2023年夏天,閆俊杰帶領(lǐng)MiniMax團隊開始專注研發(fā)MoE。

黃明明認為,閆俊杰看上去是一個很溫和的人,實際上他很瘋狂。在認定終極目標(biāo)后,他會把所有資源all in,去賭這個事情。

“他把當(dāng)時手頭80%的算力資源都用來推MoE?!秉S明明說,“前兩次是失敗的,直到第三次成了,他才跑過來跟我們(投資人)講,MoE差不多能搞定了?!?/p>

黃明明問閆俊杰:“為什么你要賭這么大?你賭不出來,可能這家公司就掛了。”

閆俊杰的回復(fù)是,“只有我把MoE做出來,才能用更低的成本向更高的模型階段去演進,否則用的是一個不可估量的成本去往下一步,沒有一家公司能支持這樣token的消耗量去往更高的平臺進化?!?/p>

應(yīng)對DeepSeek,慢了一步

2025年1月15日,MiniMax發(fā)布了首個開源模型MiniMax-01系列。

在接受晚點采訪時,閆俊杰指出,開源的核心價值在于加速技術(shù)進化?!案玫哪P涂梢詫?dǎo)向更好的應(yīng)用,但更好的應(yīng)用和更多用戶并不會導(dǎo)向更好的模型?!遍Z俊杰說。想清楚“智能水平的提升,沒那么依賴用戶規(guī)模”后,閆俊杰做出了取舍,他認為現(xiàn)在MiniMax最重要的目標(biāo)不是增長,也不是收入,是“加速技術(shù)迭代”,并堅定了要做一家技術(shù)驅(qū)動型公司的念頭,開始有意識地打造技術(shù)品牌。

但從行業(yè)變化看,閆俊杰還是“慢”了一步。2024年12月26日,DeepSeek-V3發(fā)布后,在業(yè)內(nèi)形成一定的口碑和品牌效應(yīng)。2025年1月20日,DeepSeek-R1發(fā)布,在大眾層面掀起的聲量迅速蓋過了相對低調(diào)的MiniMax,進一步搶奪了C端用戶的心智。

面對洶涌而來的DeepSeek沖擊波,國內(nèi)模型廠商主要分成了兩隊,一隊是積極擁抱,大力宣傳旗下產(chǎn)品接入DeepSeek;另一隊是堅決不接入DeepSeek,并死磕自研自己的推理模型。

MiniMax的選擇是,在國內(nèi)C端應(yīng)用上堅持不接入DeepSeek,只在海外的AI應(yīng)用上選擇接入DeepSeek。

同時,據(jù)MiniMax內(nèi)部員工透露,DeepSeek發(fā)布并沒有影響他們研發(fā)團隊的節(jié)奏,內(nèi)部還是保持原有計劃,專注且低調(diào)地進行技術(shù)研發(fā)。

黃明明也表示,他們非常認可MiniMax持續(xù)專注在底層模型的研發(fā)上?!昂玫膽?yīng)用或好的產(chǎn)品,都是模型能力自然而然的體現(xiàn),模型能力強了,一定會做出好的產(chǎn)品。事實證明,當(dāng)模型能力不夠強時,做出的產(chǎn)品就需要很多縫縫補補,打很多補丁,耗費巨大的人力和物力,并喪失你在底層模型上的專注度。”黃明明說。

6月中旬,MiniMax連續(xù)發(fā)布了包括基礎(chǔ)模型及應(yīng)用在內(nèi)的5款產(chǎn)品,業(yè)內(nèi)對于其模型和應(yīng)用的產(chǎn)品評價比較正面,Hugging Face工程師王鐵震告訴《中國企業(yè)家》:“MiniMax在探索一條之前沒有被驗證過的路,非常有價值?!?/p>

(注:Hugging Face是一家成立于2016年的美國人工智能公司,致力于構(gòu)建開源的機器學(xué)習(xí)社區(qū)和平臺,提供豐富的預(yù)訓(xùn)練模型、數(shù)據(jù)集和工具,幫助開發(fā)者更便捷地構(gòu)建、訓(xùn)練和部署AI應(yīng)用。)

不過,MiniMax-M1系列模型并未引發(fā)大范圍轟動。截至7月10日,其在Hugging Face最熱帖下載量僅25.2K,GitHub最熱帖收藏量僅3K——這一數(shù)據(jù)明顯低于Google、Meta今年初發(fā)布的開源模型,也遜色于DeepSeek-R1的收藏及下載量。

部分Agent創(chuàng)業(yè)者反饋,雖注意到MiniMax M1模型的發(fā)布,但因自身產(chǎn)品上線排期緊張,暫未及時投入測試。另一位AI領(lǐng)域創(chuàng)業(yè)者告訴《中國企業(yè)家》,當(dāng)前海外AI領(lǐng)域熱點頻發(fā)(如GPT-5發(fā)布在即,Meta新模型迭代),分散了行業(yè)注意力,客觀上削弱了M1的傳播聲量。在他看來,國際模型技術(shù)仍具備一定領(lǐng)先優(yōu)勢。

對此,一位MiniMax投資人表示,MiniMax一貫的風(fēng)格是相對低調(diào)和克制,它最后交付的產(chǎn)品口碑,可能比大家記住模型名字或下載量更重要。

“你只有最后交付一個產(chǎn)品,才容易做商業(yè)化,才有可能達到上市的體量。快手的可靈交付的也是一個生產(chǎn)工具,大家看重的也是產(chǎn)品,而非快手的視頻模型?!痹撏顿Y人補充道。

(責(zé)任編輯:孫丹)