關(guān)于DeepSeek一些當(dāng)前的看法

DeepSeek一夜爆火,全球都在關(guān)注且討論DeepSeek,頂尖技術(shù)人員關(guān)注的是,R1版本是緊隨openAI的o1版本推理能力的研究效果最好的模型、開源(開源代碼、開源技術(shù)路線及技術(shù)細(xì)節(jié),可商用)、性價(jià)比高,而且由中國團(tuán)隊(duì)研發(fā)。那對(duì)于我們這些應(yīng)用小選手來說,這其中應(yīng)該關(guān)注的是什么呢。

首先,這是一個(gè)國產(chǎn)模型,增強(qiáng)的是民族技術(shù)水平的信心,同時(shí)也引起美國AI從業(yè)、關(guān)注者的極大注意力;這是一個(gè)開源模型,是一場(chǎng)開源對(duì)于閉源的勝利。

其次,作為完全開源的國產(chǎn)模型,DeepSeek的性價(jià)比高、性能好、思考效率高。R1思考速度快而且非常省錢。官網(wǎng)直接用,它是免費(fèi)的。如果是在自己的應(yīng)用中調(diào)用API,它的輸出價(jià)格是一百萬tokens 2.19美元,相當(dāng)于o1 60美元的4%!模型參數(shù)量為6710億個(gè)模型參數(shù),一次推理調(diào)用僅需370億個(gè)參數(shù),硬件資源要求低、算力要求小。在技術(shù)選型中,DeepSeek可作為其中一個(gè)重要的選項(xiàng)。

然后,作為推理模型,DeepSeek R1在數(shù)學(xué)、編程、推理任務(wù)中,跑分已經(jīng)達(dá)到或接近O1,但R1在生成洞見、創(chuàng)造性發(fā)揮和說理論證方面,比O1還有一定的距離。另外R1支持聯(lián)網(wǎng)搜索和PDF閱讀,而O1還沒有這兩個(gè)功能。但作為一個(gè)研究型模型,R1的穩(wěn)定性、為用戶提供服務(wù)的工程能力還相對(duì)較弱。在模型應(yīng)用中,要清晰了解R1的能力邊界,以更好地篩選和應(yīng)用。

我們一直在模仿、追隨,而這一次,終于有了平行的可能。

當(dāng)然,作為新秀軍,DeepSeek有較強(qiáng)的潛力,需持續(xù)關(guān)注其進(jìn)展,以更好地應(yīng)用到自己的產(chǎn)品和項(xiàng)目中。


【一個(gè)小目標(biāo)】92/365,關(guān)注行業(yè)關(guān)注趨勢(shì),多看多想多反思,做一個(gè)講故事的人,講一個(gè)好故事。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容