丰满少妇三级全黄,丰满人妻一区二区三区无码av,久久久久久AV无码免费看大片,亚洲精品久久久口爆吞精

分享
國家互聯(lián)網(wǎng)信息辦公室準(zhǔn)許從事互聯(lián)網(wǎng)新聞信息服務(wù)業(yè)務(wù)的網(wǎng)站
互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號:10120220005
中新經(jīng)緯>>科技>>正文

不僅開源還便宜好用,硅谷員工直呼“火燒屁股”的DeepSeek大模型強(qiáng)在哪

2025-01-26 15:43:04 澎湃新聞

  不僅開源還便宜好用,硅谷員工直呼“火燒屁股”的DeepSeek大模型強(qiáng)在哪

  澎湃新聞記者 胡含嫣

  國產(chǎn)大模型公司深度求索(DeepSeek)發(fā)布的最新AI(人工智能)大模型在海外引起開發(fā)者和投資者的熱議。

  1月20日,量化巨頭幻方量化旗下大模型公司DeepSeek正式發(fā)布推理大模型DeepSeek-R1。作為一款開源模型,R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能能夠比肩OpenAI o1模型正式版,并采用MIT許可協(xié)議,支持免費(fèi)商用、任意修改和衍生開發(fā)等。目前,在國外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準(zhǔn)測試排名已經(jīng)升至全類別大模型第三,與OpenAI的ChatGPT-4o最新版并列,并在風(fēng)格控制類模型(StyleCtrl)分類中與OpenAI的o1模型并列第一。

  更令市場驚訝的是,據(jù)DeepSeek介紹,R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬美元,在2048塊英偉達(dá)H800 GPU(針對中國市場的低配版GPU)集群上運(yùn)行55天完成,僅是OpenAI GPT-4o模型訓(xùn)練成本的不到十分之一。DeepSeek表示,R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。此外,DeepSeek不僅將R1訓(xùn)練技術(shù)全部公開,還蒸餾了6個小模型向社區(qū)開源,允許用戶借此訓(xùn)練其他模型。

  開源模型正在趕超,比OpenAI便宜九成

  一經(jīng)推出,DeepSeek-R1便憑借其“物美價廉”的特性在海外開發(fā)者社區(qū)中引發(fā)了轟動。在API定價方面,DeepSeek R1服務(wù)對每百萬輸入token收取0.55美元,對每百萬輸出token收取2.19美元/百萬,而OpenAI最新版o1模型的相應(yīng)收費(fèi)分別為15美元/百萬和60美元/百萬。在海外AI社區(qū)中小有名氣的研究者Shubham Saboo表示,作為一款“100%開源”的模型,R1比OpenAI o1便宜96.4%,同時提供類似的性能,建議已經(jīng)訂閱ChatGPT的開發(fā)者“放棄沉沒成本”。

  除了性能方面的突出表現(xiàn)外,DeepSeek還給出了新的AI大模型搭建思路。英偉達(dá)高級研究科學(xué)家Jim Fan表示,DeepSeek-R1可能是“首個展示了RL(強(qiáng)化學(xué)習(xí))飛輪可以發(fā)揮作用且能帶來持續(xù)增長的OSS(開源軟件)項(xiàng)目”。其中,“飛輪”用來形容AI系統(tǒng)中自我強(qiáng)化、正向循環(huán)的過程。DeepSeek的論文顯示,不同于過去AI模型往往依賴于監(jiān)督微調(diào)(SFT,指AI模型通過已標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練),R1完全由強(qiáng)化學(xué)習(xí)驅(qū)動,證明了直接強(qiáng)化學(xué)習(xí)是可行的。

  Jim Fan寫道:“我們正處于一個奇特的時間線上,一家非美國公司正在踐行OpenAI最初的使命,即實(shí)現(xiàn)真正開放的前沿研究并讓所有人受益。這種情況簡直無法理解。最有娛樂性的結(jié)果卻是可能性最大的結(jié)果!

  硅谷知名投資機(jī)構(gòu)A16z的合伙人、Mistral AI董事會成員Anjney Midha表示:“從斯坦福到麻省理工,DeepSeek-R1幾乎在一夜之間成為美國頂尖大學(xué)研究人員的首選模型!钡聡R克斯·普朗克量子光學(xué)研究所AI科學(xué)家實(shí)驗(yàn)室負(fù)責(zé)人馬里奧·克倫(Mario Krenn)也盛贊DeepSeek-R1的開放性,相比之下,OpenAI旗下的模型“本質(zhì)上都是黑箱”。

  憑借極低的訓(xùn)練成本,DeepSeek-R1也讓華爾街和投資者感到了震撼。1月24日,參投過OpenAI、Databricks、Character.AI等知名企業(yè)的風(fēng)險投資巨頭安德森·霍洛維茨基金(Andreessen Horowitz)的聯(lián)合創(chuàng)始人馬克·安德森(Marc Andreesen)連轉(zhuǎn)了幾篇關(guān)于Deepseek-R1的推文,并對其進(jìn)行了公開贊賞。他在X(原推特)平臺上寫道:“Deepseek R1是我見過的最令人驚嘆和印象深刻的突破之一——作為開源項(xiàng)目,它是對世界的一份深刻饋贈。”

  隨后,法國企業(yè)家、推特意見領(lǐng)袖阿諾德·貝特朗(Arnaud Bertrand)轉(zhuǎn)發(fā)了安德森的推文,并稱中國AI的發(fā)展速度令人驚艷:“Deepseek時刻不僅是關(guān)于AI的,而是讓世界意識到中國在技術(shù)和創(chuàng)新方面已經(jīng)趕上了美國,并且在某些領(lǐng)域甚至超過了美國,盡管有人努力阻止這種情況的發(fā)生。”

  在近日舉辦的2025年達(dá)沃斯論壇上,AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)表示,DeepSeek的AI大模型性能“大致與美國最好的模型相當(dāng)”。去年12月,DeepSeek發(fā)布上一代模型V3后,Alexandr Wang就在X平臺上評價道:“DeepSeek-V3帶給外界的教訓(xùn)是:當(dāng)美國人在休息時,中國人在工作,并以更便宜、更快、更強(qiáng)的產(chǎn)品迎頭趕上!

  而Meta首席AI科學(xué)家楊立昆(Yann LeCun)指出,比起“中國AI超越了美國”的觀點(diǎn),DeepSeek-R1更重要的是證明了“開源模型正在超越專用模型”:“DeepSeek得益于開源研究和開源項(xiàng)目(例如PyTorch和來自Meta的Llama)。這就是開放研究與開源的力量。”

  1月26日,360創(chuàng)始人周鴻祎發(fā)視頻談“中國大模型DeepSeek反超GPT”,稱中美AI競爭“最終一定是中國勝利”,就像中國已經(jīng)在制造業(yè)領(lǐng)域戰(zhàn)勝了美國:“DeepSeek這家公司最近的表現(xiàn)簡直逆天,我相信將來如果要對抗美國的AI技術(shù)霸權(quán),中國大模型技術(shù)復(fù)仇者聯(lián)盟戰(zhàn)隊里一定有DeepSeek的一份,因?yàn)檫@家公司和它的創(chuàng)始人非常低調(diào),他們技術(shù)能力和未來前景被市場嚴(yán)重低估了!

  AI競賽發(fā)展加速,“燒錢”潮流能否持續(xù)

  同時,市場開始猜測,DeepSeek-R1的橫空出世是否會影響一味“砸錢”投入AI競賽的美國科技巨頭們。分析指出,AI行業(yè)競爭或?qū)⒁员阮A(yù)想中更快的速度加劇,并有可能影響到上游AI硬件企業(yè)的收入。

  加州大學(xué)伯克利分校的AI政策研究員Ritwik Gupta表示,DeepSeek-R1的出現(xiàn)證明了“AI能力沒有技術(shù)護(hù)城河”,并稱“中國的系統(tǒng)工程師人才庫比美國大得多,他們懂得如何充分利用計算資源來更高效地訓(xùn)練和運(yùn)行模型”。

  1月23日,一名Meta員工在匿名職場論壇Teamblind上發(fā)帖稱,Meta內(nèi)部已經(jīng)因?yàn)镈eepSeek-R1而進(jìn)入“恐慌模式”。這位員工寫道:“Meta的工程師們正在爭分奪秒地分析DeepSeek,試圖復(fù)制其中一切可能的技術(shù),管理層正為生成式AI研發(fā)部門的巨額投入而發(fā)愁。”

  該員工表示,DeepSeek-R1的訓(xùn)練成本不到550萬美元,而Meta的生成式AI部門里“每位領(lǐng)導(dǎo)的薪資都超過了這個數(shù)字”:“(AI部門)本應(yīng)是一個以工程為核心的小型組織,但因?yàn)楹芏嗳硕枷脒M(jìn)來分一杯羹,人為膨脹了組織的規(guī)模,結(jié)果人人都是輸家。”

  隨后,有認(rèn)證為谷歌員工的網(wǎng)友回復(fù)上述言論稱:“DeepSeek做的事情很瘋狂。不僅是Meta,OpenAI、谷歌和Anthropic都因?yàn)樗麄兌馃ü。這是一件好事,我們可以見證公開競爭對創(chuàng)新的推動作用!

  或許是因?yàn)楦惺艿搅烁偁帀毫Γ琈eta的CEO馬克·扎克伯格(Mark Zuckerburg)于24日在旗下社交平臺上表示,公司計劃在2025年投資600億至650億美元用于資本支出,并計劃大幅擴(kuò)張AI團(tuán)隊。到2025年年底,Meta將擁有超過130萬個GPU。扎克伯格稱“今年將是AI的關(guān)鍵一年”,公司還將在路易斯安那州建設(shè)一座價值100億美元的數(shù)據(jù)中心。

中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。
關(guān)注中新經(jīng)緯微信公眾號(微信搜索“中新經(jīng)緯”或“jwview”),看更多精彩財經(jīng)資訊。
關(guān)于我們  |   About us  |   聯(lián)系我們  |   廣告服務(wù)  |   法律聲明  |   招聘信息  |   網(wǎng)站地圖

本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。

未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。

[京B2-20230170]  [京ICP備17012796號-1]

違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn

Copyright ©2017-2025 jwview.com. All Rights Reserved


北京中新經(jīng)聞信息科技有限公司

亚洲精品国产suv一区88| 男女做爰猛烈动高潮a片免费应用| 日本丰满少妇xxxx| 亚洲精品中文字幕| 精精国产xxxx视频在线| WWW亚洲精品少妇裸乳一区二区| 国产精品人成视频免费播放| av免费网站在线观看| 精品国产不卡一区二区三区| 男人天堂2018| 女人做爰高潮呻吟17分钟| 强行无套内谢大学生初次水| 久久精品国产亚洲av蜜臀色欲| 国产在线拍揄自揄拍无码视频| 亚洲av无码国产在丝袜线观看| 99久久国产综合精品成人影院| 欧美,日韩,国产,专区| 午夜精品久久久久久久久| 久久婷婷成人综合色| 小罗莉极品一线天在线| 欧美疯狂做受xxxxx高潮| 高h喷水荡肉爽文公交车| 久久精品国产亚洲7777| 少妇特黄a一区二区三区| 99麻豆久久久国产精品免费| 亚洲精品午夜无码专区| 亚洲精品中文字幕乱码三区| 中文字幕乱码人妻无码久久| 中文在线无码高潮潮喷| 亚洲美女高潮久久久久| 乖宝撞的你舒不舒服h| 国产成人无码A区在线观看视频| 中文乱码字慕人妻熟女人妻| 国产精品99久久久久久猫咪| 国产98色在线 | 日韩| 欧美性狂猛xxxxxbbbbb| 狠狠色噜噜狠狠狠狠av| 亚洲av无码乱码精品国产福利| 军人全身脱精光自慰| 猛烈的打扑克的视频| 亚洲天堂2017无码|