深圳縱橫集團有限公司
Shenzhen Zongheng Group Co,Ltd
時(shí)間:2023-07-23 信息來源:縱橫集團
-------------------------------------------
62人的公司,賣了94億。
近日,大數據巨頭公司Databricks宣布億13億美元的價格(約合94億人民币)收購生成(chéng)式AI初創公司MosaicML。該筆發(fā)生在美國(guó)矽谷的收購案,爲年内生成(chéng)式AI領域内公布的最大一筆。引來業界高度關注。
MosaicML于2021年成(chéng)立于美國(guó)舊金山,其剛成(chéng)立不久便成(chéng)功完成(chéng)了第一輪融資,知名風投DCVC、Lux Capital、Future Ventures等投資機構參與,MosaicML共獲得3700萬美元的融資。
第一輪融資時(shí),MosaicML公司估值爲2.2億美元,但在此次收購中,MosaicML的估值直接提高近6倍,令業界感到驚歎。
成(chéng)立不到兩(liǎng)年,估值便如此之高,這(zhè)家生成(chéng)式AI初創公司到底有何“看家本領”?
01
AI模型服務企業端
産品質優價廉
根據公開(kāi)資料顯示,MosaicML的産品組合包括開(kāi)源的、商業授權的MPT Foundation系列模型和MosaicML 推理和訓練服務。
其推出的MosaicML Composer開(kāi)源的深度學(xué)習庫,提供20種(zhǒng)用于計算機視覺和自然語言處理的方法,包括模型、數據集和基準。推出的MosaicML Explorer可以幫助開(kāi)發(fā)人員探索和理解不同的雲服務和硬件選項之間的時(shí)間、性能(néng)和成(chéng)本,以簡化和評估實施選項。推出的MosaicML AI開(kāi)發(fā)平台,提供了成(chéng)本效益高的模型部署和定制訓練,同時(shí)保證數據安全,使用戶能(néng)夠擁有模型的所有權等。
值得一體的是,MPT基礎模型系列是MosaicML 提供的一系列開(kāi)源、商業可用的大型語言模型,它們可以作爲用戶構建自己的生成(chéng)式AI應用的基礎。
MosaicML 的MPT基礎模型系列包括MPT-7B 和MPT-30B 兩(liǎng)個模型,分别有70億和300億個參數。
MPT-7B是MosaicML在今年5月5日發(fā)布的類ChatGPT開(kāi)源大語言模型。MPT-7B 在MosaicML平台上進(jìn)行了9.5天的訓練,零人工幹預,成(chéng)本僅用了20萬美元。該模型具備可商業化、高性能(néng)、資源消耗低、1T訓練數據、可生成(chéng)代碼等技術優勢。
AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs等知名廠商皆使用MPT-7B開(kāi)發(fā)各種(zhǒng)生成(chéng)式AI産品。
截至目前,MPT-7B開(kāi)源項目的下載量超過(guò)300萬次。收購方Databricks表示,這(zhè)也是其收購MosaicML的重要原因之一。
另一款模型MPT-30B推出之後(hòu),同樣引來業界關注,十分受歡迎。其訓練成(chéng)本遠低于其他競争對(duì)手,有望推動AI模型在更廣泛領域的應用并逐步降低訓練成(chéng)本。
MosaicML首席執行官兼聯合創始人Naveen Rao表示,MPT-30B的訓練成(chéng)本僅爲70萬美元,遠遠低于類似産品如GPT-3所需的數千萬美元訓練成(chéng)本。該模型由于成(chéng)本低、體積小,可以更快速地進(jìn)行訓練,并且更适合在本地硬件上部署。
MosaicML還(hái)介紹稱,公司用 2 個月的時(shí)間訓練了 MPT-30B,通過(guò)數據混合進(jìn)行預訓練,從 10 個不同的開(kāi)源文本語料庫中收集了 1T 個預訓練數據 token,并使用 EleutherAI GPT-NeoX-20B 分詞器對(duì)文本進(jìn)行分詞,并根據上述比率進(jìn)行采樣。
需要注意的是,開(kāi)發(fā)者可以從Hugging Face下載并使用開(kāi)源的MPT-30B基礎模型,還(hái)可以使用自己的數據在本地硬件上進(jìn)行微調。
MosaicML同時(shí)表示,將(jiāng)模型參數擴展到300億隻是第一步,随後(hòu)他們將(jiāng)以降低更低成(chéng)本推出更大體積、更高質量的模型。
MosaicML另一個比較有亮點的産品是今年推出的面(miàn)向(xiàng)企業的MosaicML推理。
MosaicML首席執行官兼聯合創始人Naveen Rao表示:“一些初創公司已經(jīng)在使用MosaicML的模型和工具來構建自然語言前端和搜索系統。MosaicML允許企業使用公司的模型架構根據自己的數據訓練模型,然後(hòu)通過(guò)其推理API部署模型。如果客戶訓練了一個模型,他們可以放心,他們擁有該模型的所有叠代,該模型就(jiù)是他們的。我們對(duì)此不擁有所有權。使用 MosaicML 的新推理産品,企業客戶可以部署用于文本完成(chéng)和文本嵌入的 AI 模型,其成(chéng)本比使用OpenAI的LLM低4倍,而圖像生成(chéng)的成(chéng)本比使用OpenAI的DALL-E 2便宜 15倍。”
“我們希望讓盡可能(néng)多的人了解和使用這(zhè)項技術,這(zhè)就(jiù)是我們的目标。這(zhè)并不是排他性的。這(zhè)不是精英主義。”Naveen Rao同時(shí)表示。
02
由英特爾前高管創立
MosaicML起(qǐ)點不低
作爲初創公司的MosaicML,爲何會(huì)連續推出爆款産品,這(zhè)當然很其創始人有很大關系。
MosaicML是由曾在英特爾擔任AI産品負責人、Nervana Systems 的聯合創始人 Naveen Rao ,以及英特爾AI實驗室的高級主管Hanlin Tang創立。
MosaicML的創始人Naveen Rao ,1997年畢業于杜克大學(xué)的計算機科學(xué)專業,後(hòu)取得布朗大學(xué)神經(jīng)科學(xué)的博士學(xué)位。Naveen Rao長(cháng)期緻力于人工智能(néng)神經(jīng)網絡的學(xué)習和開(kāi)發(fā),曾在高通擔任過(guò)神經(jīng)形态機器的研究員,并在2014年創立了人工智能(néng)公司Nervana Systems。後(hòu)來這(zhè)家公司在2016年以4.08億美元被英特爾收購。
Hanlin Tang畢業于哈佛大學(xué),研究人類視覺中的遞歸神經(jīng)網絡。他在普林斯頓大學(xué)取得物理學(xué)學(xué)士學(xué)位,随後(hòu)在哈佛大學(xué)取得生物物理學(xué)的博士學(xué)位,研究人類視覺中的遞歸神經(jīng)網絡,Hanlin Tang少年時(shí)代在台北度過(guò)。後(hòu)來加入英特爾後(hòu),在英特爾AI實驗室擔任高級主管,在此期間Hanlin Tang負責算法工程和深度學(xué)習研究,并參與了MLPerf基準測試的開(kāi)發(fā)。
Hanlin Tang在國(guó)際頂級期刊和會(huì)議上發(fā)表了多篇論文,涉及計算神經(jīng)科學(xué)、計算機視覺、自然語言處理和強化學(xué)習等領域。
還(hái)有一位值得一提的團隊成(chéng)員是MosaicML的首席科學(xué)家Jonathan Frankle,他是MIT計算機科學(xué)與人工智能(néng)實驗室的博士後(hòu)研究員,也是哈佛Kempner研究所的附屬教員。Jonathan Frankle的研究方向(xiàng)是神經(jīng)網絡的學(xué)習動力學(xué)和訓練算法,旨在提高大型語言模型(LLM)的效率同時(shí)降低訓練成(chéng)本。這(zhè)一研究方向(xiàng)也正是MosaicML的核心競争力所在,可以說(shuō)Jonathan Frankle是MosaicML能(néng)賣到94億的關鍵人物。
Naveen Rao和Hanlin Tang之所以能(néng)在英特爾任職,是因爲Nervana Systems開(kāi)發(fā)了Neon 這(zhè)一高性能(néng)的深度學(xué)習框架,以及後(hòu)來推出的Nervana Cloud深度學(xué)習雲平台、Nervana Engine專用硬件加速器,英特爾認爲這(zhè)些産品非常有價值,就(jiù)把Nervana Systems收購了。Naveen Rao和Hanlin Tang也一起(qǐ)加入英特爾,一位成(chéng)爲了AI産品集團的負責人,一位成(chéng)爲了AI實驗室高級主管。
不過(guò),2020年英特爾宣布放棄原計劃的Nervana服務器端AI加速芯片,去耗資20億美元收購以色列公司Habana的産品。
在英特爾決定“抛棄” Nervana後(hòu),Naveen Rao和Nervana的前核心員工Hanlin Tang也一起(qǐ)離開(kāi)了英特爾,兩(liǎng)人另立門戶創立了今天的MosaicML。根據LinkedIn的信息,目前Hanlin Tang擔任MosaicML的CTO。
03
Databricks收購MosaicML
強強聯合?
Databricks收購MosaicML不僅僅是因爲商業價值,更是爲了兩(liǎng)個公司可以強強聯合,實現技術上的突破,加碼AI大模型。
先來看看收購方Databricks,這(zhè)是一家數據存儲和分析領域的巨頭公司,由美國(guó)加州大學(xué)伯克利 AMP 實驗室的 Spark 大數據處理系統多位創始人聯合創立。Databricks 的客戶遍及大中小企業,以及各個行業。截至 2023 年 03 月,其全球已有超過(guò) 9000 家企業用戶。包括 AT&T、殼牌、巴寶莉、豐田、Walgreens、Adobe、康泰納仕和再生元制藥等。
2021 年,Databricks拿下了摩根士丹利旗下Counterpoint Global領投的16億美元H輪融資。2023年4月18日,Databricks以298億美元億的估值入選《2023·胡潤全球獨角獸榜》,名列第七。
業内專家表示,收購完成(chéng)之後(hòu),MosaicML 將(jiāng)成(chéng)爲 Databricks Lakehouse 平台的一部分,MosaicML 的整個團隊和技術都(dōu)將(jiāng)納入 Databricks 旗下,爲公司提供統一的平台來管理數據資産,助力 Databricks更好(hǎo)的開(kāi)發(fā)生成(chéng)式AI技術。同時(shí)能(néng)夠使用自己的專有數據來構建、擁有和保護自己的生成(chéng)式 AI 模型。
DataBricks 的 CEO Ali Ghodsi 也表示,收購 MosaicML 將(jiāng)進(jìn)一步增強 DataBricks 的數據分析平台。
DataBricks收購MosaicML是爲加碼AI大模型是主流觀點,原因是MosaicML因其尖端的MPT大語言模型而受到認可,MPT-7B和MPT-30B都(dōu)是今年開(kāi)發(fā)的爆款産品,下載量均突破百萬。
值得一提的是,MosaicML的模型訓練自動優化使得訓練速度比标準方法快2-7倍,而資源的近線性擴展允許在幾小時(shí)内訓練多十億參數的模型。
借助于雙方的聯合産品,Databricks和MosaicML的目标是將(jiāng)訓練和使用LLMs的成(chéng)本從數百萬美元降低到數千美元。
由此可見,Databricks正試圖加碼AI大模型,去挑戰OpenAI、微軟、谷歌等大公司的市場地位,爲行業帶來新的選擇。
但也有反對(duì)觀點認爲Databricks 整合 LLM 的價值主張是不太明确,因爲Databricks主營Lakehouse,主要是用Spark來處理大規模集群數據,因此其整合大語言的價值并不明确。還(hái)有業内人士認爲,Databricks 是在借當前大模型熱度進(jìn)行炒作,收購對(duì)技術方面(miàn)不會(huì)有明顯的突破,MosaicML 遲早會(huì)被Databricks放棄。
這(zhè)起(qǐ)收購案能(néng)否能(néng)獲得良好(hǎo)的效果,在實現商業價值的同時(shí),也能(néng)有技術突破,可能(néng)仍需要等待時(shí)間去驗證。
财經(jīng)方面(miàn)專家認爲,收購MosaicML的交易可能(néng)是這(zhè)家AI獨角獸公司爲IPO之路打下基礎。
04
AI大模型并購潮拉開(kāi)大幕
去年末ChatGPT的橫空出世,拉開(kāi)了AI競賽的大幕,半年之後(hòu),又出現了AI并購潮。
原因無外乎是生成(chéng)式AI經(jīng)過(guò)一段時(shí)間的野蠻生長(cháng),然後(hòu)大型企業取得一定的進(jìn)展,同時(shí)也發(fā)現了現有技術和人才的不足,而那些AI初創公司,相對(duì)來說(shuō)要專業一些,既有人才也有技術,但存在資金不足、資源稀缺等問題。所以AI并購潮現在出現是必然的,對(duì)于整個行業來講也是正向(xiàng)的、有利的。
除了本文介紹的Databricks收購MosaicML之外,今年5月,雲計算巨頭Snowflake宣布收購了由兩(liǎng)位前Google員工創立的生成(chéng)式AI搜索初創公司Neeva。業内專家認爲,此次收購將(jiāng)使Snowflake能(néng)夠利用尖端的搜索技術,并將(jiāng)其注入到數據雲中,充分客戶、合作夥伴和開(kāi)發(fā)者的需求。
值得一提的是,Neeva的領導團隊成(chéng)員在創建YouTube貨币化和Google的搜索廣告等産品時(shí),起(qǐ)到了非常重要的作用。不出意外的話,此次收購將(jiāng)把Snowflake中的搜索和對(duì)話提升到一個新水平。不過(guò)此次收購的金額并沒(méi)有對(duì)外公布。
6月26日,全球最大的專業信息服務提供商湯森路透宣布,以6.5億美元現金收購AI初創公司Casetext,該公司主營業務是爲法律人士提供AI助理服務。
公開(kāi)資料顯示,Casetext員工數爲104名,客戶包括1萬多家律師事(shì)務所和企業法務部門。其主要産品CoCounsel是一款于今年推出的人工智能(néng)法律助理,由GPT-4提供支持。該筆收購將(jiāng)有效補充湯森路透現有的AI路線圖。
6月29日,AI初創公司Inflection宣布完成(chéng)13億美元融資,該輪融資由微軟、英偉達等牽頭投資,其融資總額達到15.25億美元。
再看中國(guó)的AI市場,6月29日,美團發(fā)布公告,宣布已完成(chéng)光年之外境内外主體100% 的股權收購,耗資20.65億人民币。
對(duì)于此次并購,美團在公告表示,光年之外是中國(guó)領先的AGI創新者,其目前的管理與技術團隊具有開(kāi)發(fā)深度學(xué)習框架的高水平經(jīng)驗。公司通過(guò)收購事(shì)項可以獲得領先的AGI技術及人才,有機會(huì)加強其于快速增長(cháng)的人工智能(néng)行業中的競争力。
美團方面(miàn)表示,并購完成(chéng)後(hòu),將(jiāng)支持光年團隊繼續在AI大模型領域進(jìn)行研究和探索。
無獨有偶,今年6月16日,昆侖萬維發(fā)布公告稱,旗下控股子公司Star Group拟發(fā)股收購Singularity AI全部股權。
Singularity AI緻力于實現通用人工智能(néng),目前聚焦于自然語言大型預訓練模型及開(kāi)發(fā)者API的研發(fā)工作,主要産品及服務包括通用開(kāi)發(fā)者API、聊天機器人和知識抽取。
國(guó)外出現AI并購潮,釋放出了一個強烈的行業信号,意味著(zhe)國(guó)外AIGC的發(fā)展已經(jīng)開(kāi)始升級,無論是技術、業務、場景還(hái)是商業化,都(dōu)随時(shí)可能(néng)出現颠覆性的創新。
對(duì)于國(guó)内AI市場,投資人持謹慎樂觀态度。總的來說(shuō)是B端應用面(miàn)臨企業端數字化緩慢,軟件付費意願不強,商業化緩慢等問題,對(duì)比國(guó)外AI市場依然差距不小。
不過(guò)我們也要看到,中國(guó)是美國(guó)市場之外唯一一個擁有完整的AIGC産業鏈的國(guó)家,在這(zhè)場第四次工業革命之中,大家都(dōu)沒(méi)有退路。
參考資料:https://baijiahao.baidu.com/s?id=1770181890496791618&wfr=spider&for=pc
矽谷老錢和中國(guó)巨頭,AI并購潮的同行不同命http://t.10jqka.com.cn/pid_294033785.shtml
AIGC領域最大收購:Databricks 13億美元買下MosaicML,成(chéng)立僅2年員工60人。