日韩欧美福利免费,国产喷水1区2区3区咪咪爱av

 當(dāng)前位置：首頁 > 行業(yè)資訊 > > 正文

4 個(gè)月搓出 3 款大模型，王小川偷了大廠的“家”

來源：鈦媒體時(shí)間：2023-08-12 11:01:11

 字號(hào)：大中小

圖片來源 @視覺中國

文 | 驚蟄研究所，作者 | 小滿

【資料圖】

今年 4 月，沉寂一年多的王小川宣布進(jìn)入 AI 大模型領(lǐng)域再次創(chuàng)業(yè)，與 COO 茹立云聯(lián)合成立大語言模型公司百川智能。在媒體溝通會(huì)上，王小川發(fā)布了未來 20 年借助語言 AI 要完成的目標(biāo)，包括構(gòu)建中國最好的大模型底座，在搜索、多模態(tài)、教育和醫(yī)療等方面增強(qiáng)，幫助大眾輕松、普惠地獲取世界知識(shí)和專業(yè)服務(wù)。

令人意想不到的是，僅僅過了 4 個(gè)月，百川智能就接連推出 Baichuan-7B、Baichuan-13B 系列、Baichuan-53B 三款大模型。其中 8 月 8 日發(fā)布的 Baichuan-53B 參數(shù)量級(jí)達(dá)到 530 億，如期完成了王小川 " 在今年三季度發(fā)布一款參數(shù)量級(jí)在 500 億以上的大規(guī)模產(chǎn)品 " 的 KPI。

從離開大眾視野到重回創(chuàng)業(yè)舞臺(tái)，以及選擇大模型這一時(shí)下最熱門的風(fēng)口賽道，王小川的復(fù)出很難不吸引人們的關(guān)注。而眼下隨著百川智能以驚人的效率不斷進(jìn)行產(chǎn)品迭代與更新，人們在大廠云集的大模型賽場上，也開始多了一些與眾不同的期待。

" 遲到 " 的百川智能

作為曾經(jīng)的天才少年以及大眾印象中典型的 " 理工男 "，王小川做事向來審慎，而在選擇大模型創(chuàng)業(yè)這件事情上，他卻罕見地表現(xiàn)出狂熱的情緒。

今年 2 月，美團(tuán)聯(lián)合創(chuàng)始人王慧文在朋友圈發(fā)布了自己的 " 人工智能宣言 "，宣布個(gè)人出資 5000 萬美元設(shè)立北京光年之外科技有限公司，將打造中國 Open AI。而據(jù)極客公園媒體報(bào)道，王小川在看到王慧文的高調(diào)宣言后，也曾準(zhǔn)備對(duì)外宣布入局大模型領(lǐng)域。

王小川的激動(dòng)不無道理。科技創(chuàng)業(yè)賽道通常存在時(shí)間窗口，特別是對(duì)于大模型這類新興技術(shù)而言，越早公開項(xiàng)目越容易爭奪到有限的技術(shù)人才和資金資源。而且大模型對(duì)數(shù)據(jù)和訓(xùn)練量有著極大的需求，搶先發(fā)布產(chǎn)品能夠吸引合作機(jī)構(gòu)和用戶參與內(nèi)測，為大模型提供充足的數(shù)據(jù)并不斷訓(xùn)練模型，推動(dòng)算法迭代和產(chǎn)品更新。

所以當(dāng)王慧文拿出 5000 萬美元，并宣布已有頂級(jí) VC 以 2.3 億美元認(rèn)購下輪融資的 " 英雄帖 " 時(shí)，無疑加劇了大模型創(chuàng)業(yè)團(tuán)隊(duì)的人才爭奪。頗為有趣的是，在王慧文宣布大模型創(chuàng)業(yè)一個(gè)月后，被稱為 " 搜狗輸入法之父 " 的馬占凱隨即在社交平臺(tái)上宣布加入光年之外。而百川智能在籌備階段，也吸引了搜狗原有班底以及其他大廠領(lǐng)軍人物的加入。

盡管情緒上有些激動(dòng)，4 月份官宣的百川智能還是比光年之外晚了將近 2 個(gè)月，相比光年之外的 2.3 億美金融資，百川智能 5000 萬美元的啟動(dòng)資金也顯得有些單薄。但 " 遲到 " 并不意味著落后，相反這 2 個(gè)月讓王小川想清楚了很多事情。

從 Open AI 的發(fā)展歷程中可以看到，雖然前后融資超過了 100 億美金，但 Open AI 真正開始 " 燒錢 " 也是在 GPT-3 正式發(fā)布開始大規(guī)模訓(xùn)練之后。據(jù)國盛證券估算，GPT-3 的單次訓(xùn)練成本高達(dá) 140 萬美元，一些更大的 LLM（大型語言模型）的訓(xùn)練成本則介于 200 萬美元至 1200 萬美元之間。因此，對(duì)于剛剛起步的百川智能來說，5000 萬美元足以完成項(xiàng)目初期從 0 到 1 的產(chǎn)品設(shè)計(jì)。

其實(shí)在資金之外，大模型項(xiàng)目更關(guān)鍵的還是人才積累問題。Open AI 的 736 名員工中，就有 123 名來自于谷歌、Meta 以及蘋果公司的核心人才，半數(shù)以上員工曾在硬件或軟件公司工作。技術(shù)人才的積累，是 Open AI 在研發(fā)方面保持著一流水平的主要原因。而百川智能在最近 4 個(gè)月里，已經(jīng)將團(tuán)隊(duì)規(guī)模翻倍。

4 月份接受采訪時(shí)，王小川透露到月底團(tuán)隊(duì)成員將達(dá)到 50 人。而截至目前，百川智能的員工規(guī)模已經(jīng)達(dá)到 113 人左右。其中，技術(shù)人員的比例占 70%-80%。作為一家成立不到半年的創(chuàng)業(yè)公司，百川智能的官宣或許有些 " 遲到 "，但從結(jié)果來看，一切都在按照王小川的計(jì)劃進(jìn)行。

王小川的自信從何而來？

雖然起步晚，但百川智能 4 個(gè)月發(fā)布 3 款大模型的驚人效率，表現(xiàn)出了后發(fā)制人的競爭意識(shí)，并且每一款產(chǎn)品的體驗(yàn)方面也呈現(xiàn)出了差異化的優(yōu)勢。

早前 Baichuan-7B 和 Baichuan-13B 的跑分成績就曾令圈內(nèi)人士眼前一亮。在清華大學(xué)、上海交大、愛丁堡大學(xué)聯(lián)合創(chuàng)建的評(píng)測標(biāo)準(zhǔn) C-Eval 中，Baichuan-7B 經(jīng)過 52 個(gè)學(xué)科的測評(píng)，最終獲評(píng) 34.4 分，在同量級(jí)產(chǎn)品中排名第一。

國際中 / 英文權(quán)威評(píng)測數(shù)據(jù)集 ( 2023 年 6 月 15 日 )

Baichuan-13B 則在自然科學(xué)、醫(yī)學(xué)、藝術(shù)、數(shù)學(xué)等領(lǐng)域大幅領(lǐng)先 LLaMA-13B 等同量級(jí)的大語言模型，在社會(huì)科學(xué)、人文科學(xué)等領(lǐng)域超過了 ChatGPT。而在 MMLU 基準(zhǔn)上，Baichuan-13B 超過了所有同量級(jí)開源模型。

對(duì)于最新發(fā)布的 Baichuan-53B，王小川給出的評(píng)價(jià)是文科能力更好，也就是說 Baichuan-53B 能夠很好地理解語言泛化背后的含義，具備理解古詩、生成風(fēng)格化文章的能力。對(duì)此，驚蟄研究所使用 Baichuan-53B 內(nèi)測版進(jìn)行了測試。

在連續(xù)面對(duì) " 請寫一首以夏天為主題的五言絕句 " 的要求時(shí)，Baichuan-53B 給出的 4 首詩文存在明顯的重復(fù)。其中，4 首絕句的最后一句都是 " 荷花盛開滿池塘 "，3 首的前兩句都是 " 夏日炎炎列日照，綠樹成蔭鳥兒叫。" 并且每首詩相同的段落描寫的都是相同的意象，似乎是按照同一個(gè)模板排列組合而成。類似的現(xiàn)象，驚蟄研究所在使用百度的文心一言進(jìn)行對(duì)比測試時(shí)，并沒有發(fā)生。

對(duì)于生成風(fēng)格化文章的能力，驚蟄研究所要求 Baichuan-53B 分別以徐志摩、卡夫卡和柯南 · 道爾的風(fēng)格 " 寫一條朋友圈，講述我今天吃了肯德基這件事 "。從結(jié)果來看，雖然內(nèi)容結(jié)構(gòu)上也非常相似，但 Baichuan-53B 很好地抓住了三位作家的寫作風(fēng)格。

最令人驚喜的是，在 " 扮演 " 柯南 · 道爾寫作的文案中，Baichuan-53B 還提到作者的代表《福爾摩斯探案集》以及其中的貝克街，讓人感覺到 AI 不是在單純地模仿作家風(fēng)格生成內(nèi)容，而是在生成作家自己的 " 朋友圈 "。

由此看來，Baichuan-53B 在內(nèi)容生成方面不僅僅具備一定的理解能力，能夠模仿不同的文學(xué)風(fēng)格，在表述上也更像是人，而不是基于大數(shù)據(jù)和算法對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行排列組合。這也難怪王小川會(huì)自信地表示，" 我們這個(gè)模型在文科領(lǐng)域走前列。"

" 百模大戰(zhàn) " 剛剛開場

ChatGPT 問世以來，大模型風(fēng)口吸引了越來越多的玩家，從科技大廠到創(chuàng)業(yè)公司都開始將大模型作為自身的最大亮點(diǎn)，竭力追逐行業(yè)熱點(diǎn)?；谶@一行業(yè)背景，王小川在官宣以創(chuàng)業(yè)的形式入局大模型時(shí)遭到了質(zhì)疑，不少網(wǎng)友都表示當(dāng)前大模型賽道大廠林立，獨(dú)立團(tuán)隊(duì)很難有機(jī)會(huì)。坦白說，截至目前，整個(gè)行業(yè)都還停留在 " 外行看熱鬧 " 的階段，這也反映了國產(chǎn)大模型團(tuán)隊(duì)仍然游離在 B 端和 C 端市場之間的現(xiàn)狀。

一個(gè)典型的現(xiàn)象是，OpenAI 借助 ChatGPT 成為全球頂尖 AI 公司后，國內(nèi)一眾科技公司紛紛宣布推出類似 ChatGPT 的 " 聊天機(jī)器人 "" 圖片生成器 "，并且學(xué)習(xí) Meta 等科技大廠將大模型開源免費(fèi)商用。但從實(shí)際效果來看，這種 " 百模大戰(zhàn) " 更像是為了搶關(guān)注、掙流量。

大模型開放免費(fèi)商用之后，給誰用、怎么用，誰又真的會(huì)用？這一連串的問題沒有人問，真正使用了免費(fèi)大模型的企業(yè)也不會(huì)主動(dòng)宣揚(yáng)。" 聊天機(jī)器人 " 的出現(xiàn)，很大程度上只是為了證明科技公司具備一定的技術(shù)能力，而現(xiàn)階段大模型的商業(yè)化手段，仍然以 B 端市場為主。

例如百度的文心大模型涵蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級(jí)體系，廣泛應(yīng)用于電力、燃?xì)?、金融等產(chǎn)業(yè)領(lǐng)域；騰訊的混元大模型，則主要是幫助騰訊生態(tài)實(shí)現(xiàn)降本增效，在廣告領(lǐng)域可以自動(dòng)生成廣告文案和視頻；阿里的通義大模型，能夠跟人類進(jìn)行多輪的交互，擁有文案創(chuàng)作能力，能夠續(xù)寫小說、編寫郵件等；華為盤古大模型則基于其訓(xùn)練出的 2000 億參數(shù)以中文為核心的預(yù)訓(xùn)練生成語言模型，發(fā)布了盤古氣象大模型、盤古礦山大模型、盤古 OCR 等多個(gè)行業(yè)大模型。

透過上述大模型的功能可以看到，科技大廠的大模型體現(xiàn)的是其背后在算法、算力、深度學(xué)習(xí)方面的技術(shù)實(shí)力，而這些技術(shù)能力服務(wù)的首要對(duì)象，自然是 B 端客戶。此前，華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊就曾表示，華為已經(jīng)幫助孵化了 20 多個(gè)基礎(chǔ)大模型，" 中國大模型中約一半由昇騰 AI 支撐 "。而 B 端市場用戶可以在通用大模型的基礎(chǔ)上，定向開發(fā)出符合自己需求的專用大模型輔助企業(yè)經(jīng)營，也可以針對(duì) C 端市場開發(fā)大模型應(yīng)用產(chǎn)品。

在王小川選擇大模型創(chuàng)業(yè)被質(zhì)疑機(jī)會(huì)渺茫這件事情上，大廠在行業(yè)賽道搶先卡位，并不代表其已經(jīng)掌握行業(yè)競爭的決勝權(quán)。過去因?yàn)閷?duì) B 端市場以及自身業(yè)務(wù)的過度關(guān)注，使得大廠在技術(shù)創(chuàng)新方面缺乏一些主動(dòng)性。比如 2016 年開始就將 AI 作為戰(zhàn)略重心的百度，本就擁有開發(fā) ChatGPT 類語言模型的底層技術(shù)，甚至還具備絕無僅有的中文搜索場景，但直到 ChatGPT 爆火之后，百度才在今年 3 月份推出文心一言。

如同王小川對(duì) 5000 萬美元啟動(dòng)資金的判斷一樣，大模型的決勝盤在于訓(xùn)練階段。在給大模型投喂數(shù)據(jù)這一關(guān)鍵性的成長環(huán)節(jié)，高素質(zhì)訓(xùn)練人才提供的高質(zhì)量數(shù)據(jù)集是大模型快速成熟、迭代的關(guān)鍵。比如 ChatGPT 早期就利用菲律賓的大學(xué)教授進(jìn)行數(shù)據(jù)標(biāo)注，而國內(nèi)進(jìn)行數(shù)據(jù)標(biāo)注的人才數(shù)量和水平均未能滿足行業(yè)所需。

因此，國產(chǎn)大模型市場雖然已有 " 百模大戰(zhàn) " 的態(tài)勢，但在最關(guān)鍵的訓(xùn)練環(huán)節(jié)上，大多數(shù)仍在同一起跑線上。王小川之所以有信心參與這一輪行業(yè)變革，想必也是看透了大模型不是大力出奇跡的發(fā)明創(chuàng)造，而是在底層技術(shù)之外，持續(xù)投入不斷迭代的產(chǎn)品革新。

關(guān)于國內(nèi)科技公司搶灘大模型的行業(yè)現(xiàn)象，知名投資人朱嘯虎和獵豹?jiǎng)?chuàng)始人傅盛曾在朋友圈激烈交鋒。朱嘯虎認(rèn)為行業(yè)泡沫明顯，甚至斷言絕大多數(shù)都會(huì)在年底死掉。而王小川在 4 月份成立百川智能時(shí)表示，" 年底前我們會(huì)發(fā)布對(duì)標(biāo) GPT-3.5 的大模型，有信心今年年底做到國內(nèi)最好。"

王小川的百川智能會(huì)是國產(chǎn)大模型的希望嗎？不如把懸念留到年底，到時(shí)再看國產(chǎn)大模型又是怎樣一番新局面。

標(biāo)簽：

上一篇：?中國駐美大使謝鋒吊著手臂亮相，顯示月前摔傷骨折嚴(yán)重下一篇：最后一頁

狠狠色综合网久久久久久下一篇_88888888欧美视频在线观看_国产精品爱啪在线观看_亚洲人成网站在线播放2020_小12萝裸体无码视频AV下页

4 個(gè)月搓出 3 款大模型，王小川偷了大廠的“家”

?中國駐美大使謝鋒吊著手臂亮相，顯示月前摔傷骨折嚴(yán)重

預(yù)計(jì)明年5月開園！大灣區(qū)濕地公園建設(shè)刷新“進(jìn)度條”

2只轉(zhuǎn)債提示可能贖回

比亞迪官方認(rèn)證二手車來了：原廠級(jí)修復(fù) 與新車交付流程一致

俄羅斯老奶粉的營養(yǎng)價(jià)值 奶粉的營養(yǎng)價(jià)值

亞洲 最新版本（新亞洲日本影片）

股票行情快報(bào)：長飛光纖（601869）8月11日主力資金凈賣出492.94萬元

社區(qū)群里低價(jià)團(tuán)購雞蛋？嫌疑人詐騙數(shù)十萬元獲刑十年半

四川：C919大型航空模鍛件研制團(tuán)隊(duì)獲“大飛機(jī)之友”殊榮

賈探春的人物性格 賈探春

帕金斯：杜蘭特&布克&比爾是比納什&小斯&馬里昂更強(qiáng)的三巨頭

醫(yī)藥商業(yè)板塊漲2.38% 浙江震元漲10%居首

虧損至少450億、股債遭遇雙殺、負(fù)面消息不斷……碧桂園自救勝算幾何？

本周末，武漢人都要來這兒！

（國際）俄羅斯發(fā)射“月球-25”號(hào)月球探測器

流浪狗咬傷人誰來負(fù)責(zé)？法院：喂養(yǎng)人已構(gòu)成事實(shí)飼養(yǎng)關(guān)系

積極維護(hù)防汛救災(zāi)網(wǎng)絡(luò)秩序倡議書

凱里市扶貧志編纂工程啟動(dòng)會(huì)暨業(yè)務(wù)培訓(xùn)會(huì)召開

介之推不言祿拼音版 介之推不言祿

生意社：木漿價(jià)格漲跌互現(xiàn) 短期仍有震蕩

新疆昌吉天氣 新疆昌吉

《蓮花樓》李蓮花最后有沒有死？大結(jié)局什么意思？是he還是be？

俠客島談醫(yī)藥反腐：肥了少數(shù)人讓多數(shù)人買單的游戲規(guī)則要改寫

柯利達(dá)（603828）：該股換手率大于8%（08-11）

深圳文廣旅體局公示深圳市體育產(chǎn)業(yè)專項(xiàng)資金2023年第三批擬扶持項(xiàng)

新疆精品和田玉黃玉籽料

steam下載被鎖定（steam下載cdn強(qiáng)制鎖定）

普蘭店區(qū)社保個(gè)人和公司分別交多少錢一個(gè)月 2023年大連普蘭店區(qū)社保繳費(fèi)標(biāo)準(zhǔn)一覽

營收凈利再度滑坡 浦發(fā)銀行而立之年遇坎

承載社交屬性 鞋花“種草全網(wǎng)”

新一輪強(qiáng)降雨滾滾來襲，暴雨主要分布下列城市，8月11號(hào)天氣預(yù)報(bào)

合約到期離開大唐不夜城 盛唐密盒兩位演員未來干啥？

遼寧啟動(dòng)防汛防臺(tái)風(fēng)應(yīng)急響應(yīng)！一地緊急通知：全市停課！響應(yīng)未解除前不得返崗返校

黑龍江發(fā)布倭肯河倭肯段洪水黃色預(yù)警

中國勁酒價(jià)格一覽表（中國勁酒廠家直銷

女子舟山乘輪渡不慎落水 安徽95后小伙跳海救人

縱橫百富創(chuàng)始人兼CEO賴國強(qiáng)：往后30年，房地產(chǎn)運(yùn)營才是王道

公告精選丨阿里巴巴2024財(cái)年第一財(cái)季營收2341.6億元，同比增長14%；中國移動(dòng)上半年凈利潤761.73億元，同比增長8.4%

【關(guān)注】鳳岡：“火辣”產(chǎn)業(yè)奏響豐收“椒”響曲

息縣：不斷優(yōu)化營商環(huán)境 為企業(yè)發(fā)展提供沃土

藍(lán)天燃?xì)猓骸八{(lán)天轉(zhuǎn)債”8月15日開放申購

李鴻彬：8.10黃金靜待CPI數(shù)據(jù)爆發(fā)，多頭能否逆襲反彈？

綠地香港：前7月集團(tuán)合約銷售97.71億元

厄瓜多爾總統(tǒng)宣布全國進(jìn)入緊急狀態(tài) 總統(tǒng)大選舉辦日期不變

和評(píng)理 | 日應(yīng)停止干涉中國內(nèi)政 勿引火燒身重蹈覆轍

中國發(fā)布第三批恢復(fù)出境團(tuán)隊(duì)旅游業(yè)務(wù)國家名單

??？頂流男明星偷偷結(jié)婚了

兩部門：電競酒店每間電競房的床位數(shù)不得超過6張

時(shí)隔521天復(fù)出戴帽！若熱：我的膝蓋感覺很好，我想要留在尤文

?中國駐美大使謝鋒吊著手臂亮相，顯示月前摔傷骨折嚴(yán)重

預(yù)計(jì)明年5月開園！大灣區(qū)濕地公園建設(shè)刷新“進(jìn)度條”

俄羅斯老奶粉的營養(yǎng)價(jià)值奶粉的營養(yǎng)價(jià)值

亞洲最新版本（新亞洲日本影片）

賈探春的人物性格賈探春

虧損至少450億、股債遭遇雙殺、負(fù)面消息不斷……碧桂園自救勝算幾何？

本周末，武漢人都要來這兒！

流浪狗咬傷人誰來負(fù)責(zé)？法院：喂養(yǎng)人已構(gòu)成事實(shí)飼養(yǎng)關(guān)系

介之推不言祿拼音版介之推不言祿

新疆昌吉天氣新疆昌吉

《蓮花樓》李蓮花最后有沒有死？大結(jié)局什么意思？是he還是be？

營收凈利再度滑坡浦發(fā)銀行而立之年遇坎

承載社交屬性鞋花“種草全網(wǎng)”

新一輪強(qiáng)降雨滾滾來襲，暴雨主要分布下列城市，8月11號(hào)天氣預(yù)報(bào)

合約到期離開大唐不夜城盛唐密盒兩位演員未來干啥？

遼寧啟動(dòng)防汛防臺(tái)風(fēng)應(yīng)急響應(yīng)！一地緊急通知：全市停課！響應(yīng)未解除前不得返崗返校

女子舟山乘輪渡不慎落水安徽95后小伙跳海救人

縱橫百富創(chuàng)始人兼CEO賴國強(qiáng)：往后30年，房地產(chǎn)運(yùn)營才是王道

公告精選丨阿里巴巴2024財(cái)年第一財(cái)季營收2341.6億元，同比增長14%；中國移動(dòng)上半年凈利潤761.73億元，同比增長8.4%

息縣：不斷優(yōu)化營商環(huán)境為企業(yè)發(fā)展提供沃土

李鴻彬：8.10黃金靜待CPI數(shù)據(jù)爆發(fā)，多頭能否逆襲反彈？

和評(píng)理 | 日應(yīng)停止干涉中國內(nèi)政勿引火燒身重蹈覆轍

??？頂流男明星偷偷結(jié)婚了

時(shí)隔521天復(fù)出戴帽！若熱：我的膝蓋感覺很好，我想要留在尤文