DeepSeek推出NSA：超快速長(zhǎng)上下文訓(xùn)練與推理的新利器

AI ? 2025年2月18日 17:51:00 ? AI

今日，人工智能領(lǐng)域的創(chuàng)新企業(yè)DeepSeek宣布正式推出NSA（Native Sparse Attention）機(jī)制。這一機(jī)制專為超快速長(zhǎng)上下文訓(xùn)練與推理而設(shè)計(jì)，旨在通過(guò)硬件對(duì)齊和原生可訓(xùn)練的稀疏注意力機(jī)制，為用戶帶來(lái)前所未有的體驗(yàn)。

NSA的核心組件包括動(dòng)態(tài)分層稀疏策略、粗粒度token壓縮以及細(xì)粒度token選擇。這些組件共同協(xié)作，使得NSA能夠在優(yōu)化現(xiàn)代硬件設(shè)計(jì)的同時(shí)，實(shí)現(xiàn)推理加速和預(yù)訓(xùn)練成本的降低，而且這一切都是在不犧牲性能的前提下完成的。

DeepSeek官方表示，NSA機(jī)制在通用基準(zhǔn)、長(zhǎng)上下文任務(wù)和基于指令的推理上，其表現(xiàn)與全注意力模型相當(dāng)甚至更加優(yōu)秀。這意味著，用戶在享受更快推理速度和更低成本的同時(shí)，也能獲得與頂尖模型相媲美的性能表現(xiàn)。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請(qǐng)注明出處：http://2079x.cn/article/706746.html

DeepSeek NSADeepSeek

AI認(rèn)證作者

0 0

AI

AI大模型平臺(tái)排行榜震撼發(fā)布，誰(shuí)才是你的NO.1

隨著人工智能技術(shù)的迅猛發(fā)展，大模型平臺(tái)在AI領(lǐng)域的重要性日益凸顯。2025年2月發(fā)布的“中國(guó)AI大模型平臺(tái)排行榜”顯示了當(dāng)前各大模型平臺(tái)的綜合實(shí)力、初創(chuàng)潛力以及在不同應(yīng)用場(chǎng)景下的表…

AI
2天前
AI

DeepSeek 官方：“R2 將在 3 月 17 日發(fā)布”為假消息

DeepSeek官方回應(yīng)稱R2假消息，公司正在加速推出其R2人工智能模型，有望生成更好的代碼并支持英語(yǔ)以外的語(yǔ)言推理。

科技探索者
2天前
新聞

消息稱歐洲三大銀行搶測(cè)中國(guó)AI模型DeepSeek

據(jù)外媒The Information報(bào)道，自2024年1月起，歐洲多家頂級(jí)銀行正秘密測(cè)試中國(guó)AI公司深度求索（DeepSeek）的生成式人工智能模型，試圖挖掘其技術(shù)潛力。這與美國(guó)銀…

AI
2天前
商業(yè)

華爾街改口！全球熱錢正瘋狂搶購(gòu)中國(guó)科技股

高盛發(fā)布最新報(bào)告揭示全球資金流向巨變：MSCI中國(guó)指數(shù)開年飆升20%，創(chuàng)下該指數(shù)創(chuàng)立以來(lái)最強(qiáng)開年表現(xiàn)，香港恒生科技指數(shù)更以32%的年度漲幅領(lǐng)跑全球。數(shù)據(jù)顯示，阿里巴巴、騰訊、百度年…

商業(yè)頭條
3天前
新聞

海信發(fā)布E8Q系列影游旗艦電視多種黑科技打造畫質(zhì)天花板

海信E8Q系列旗艦產(chǎn)品發(fā)布，全球首發(fā)AI芯片H7，實(shí)現(xiàn)光色同控、超清晰解構(gòu)、人眼景深追焦和智慧視覺四大技術(shù)，引領(lǐng)顯示技術(shù)變革。全系列提供65/75/85/100/116英寸五個(gè)版本，預(yù)售價(jià)格75/9999元。

潮玩君
5天前
AI

?中國(guó)AI雙雄：Manus和DeepSeek的差別是什么？

近日，國(guó)內(nèi)兩款現(xiàn)象級(jí)AI產(chǎn)品Manus與DeepSeek引發(fā)了行業(yè)對(duì)比。相信不少人都很好奇Manus和DeepSeek的差別是什么，對(duì)此，小編大家做出了具體的分析。 Manus由蝴…

AI
6天前
AI

字節(jié)跳動(dòng)豆包上線「深度思考」推理模式，覆蓋問答、搜索、寫作和閱讀場(chǎng)景

字節(jié)跳動(dòng)旗下 AI 助手豆包正在小范圍測(cè)試深度思考模型，已上線「深度思考」推理模式，全面覆蓋問答、搜索、寫作和閱讀場(chǎng)景。深度思考模式可以讓用戶直觀看到模型的思考過(guò)程，理解模型解決問題的邏輯鏈條。

潮玩君
2025年3月6日
新聞

“國(guó)民小折疊” 努比亞Flip 2正式發(fā)布開啟AI智能交互新時(shí)代

努比亞 Flip 2是2025年行業(yè)首款全尺寸內(nèi)嵌DeepSeek的小折疊手機(jī)，搭載“AI Together”理念，實(shí)現(xiàn)了大模型的系統(tǒng)級(jí)整合。手機(jī)有三種配色和多種AI模型可供選擇，通過(guò)語(yǔ)音輸入需求，手機(jī)能自動(dòng)選擇最適合的AI模型完成任務(wù)。

潮玩君
2025年3月4日
AI

頂級(jí)域名ai.com開價(jià)1億美元出售，目前定向至DeepSeek官網(wǎng)

人工智能領(lǐng)域的頂級(jí)域名ai.com目前正以1億美元的天價(jià)出售，引起市場(chǎng)關(guān)注。最新消息顯示，該域名目前被重定向至中國(guó)人工智能大模型廠商DeepSeek的官方網(wǎng)站。

校草
2025年3月3日
新聞

英偉達(dá)市值疑似受DeepSeek崛起影響而暴跌超8% 一夜蒸發(fā)近2萬(wàn)億元

2月28日，當(dāng)?shù)貢r(shí)間2月27日，美國(guó)科技巨頭股價(jià)集體下跌，其中AI芯片龍頭企業(yè)英偉達(dá)股價(jià)重挫8.48%，創(chuàng)下一個(gè)月來(lái)最大單日跌幅，市值蒸發(fā)約2716億美元（約合1.98萬(wàn)億元人民幣…

檸萌
2025年2月28日
AI

DeepSeek開源第四彈并行優(yōu)化策略開源

2月27日，DeepSeek開源周第四日，DeepSeek宣布開源了公司內(nèi)部的并行優(yōu)化策略（Optimized Parallelism Strategies）。此次開源，Deep…

AI
2025年2月27日
AI

DeepSeek遭遇“李鬼”應(yīng)用誤導(dǎo)消費(fèi)者蘋果應(yīng)用商店審核漏洞遭質(zhì)疑

2月27日，據(jù)新浪黑貓投訴顯示，有大批用戶因在蘋果應(yīng)用商店（App Store）遭遇誤導(dǎo)性廣告和扣費(fèi)問題，對(duì)蘋果公司及涉事應(yīng)用DreamDesk發(fā)起集體投訴。用戶指控蘋果應(yīng)用商店審…

若安丶
2025年2月27日
AI

DeepSeek開放平臺(tái)推出夜間錯(cuò)峰優(yōu)惠活動(dòng)，API調(diào)用價(jià)格最高降幅達(dá)75%

2月26日，人工智能技術(shù)領(lǐng)域的領(lǐng)先企業(yè)DeepSeek宣布，為優(yōu)化資源利用并回饋廣大用戶，即日起推出夜間錯(cuò)峰優(yōu)惠活動(dòng)。在每日北京時(shí)間00:30至08:30的夜間空閑時(shí)段，DeepS…

AI
2025年2月27日
AI

?DeepSeek R2模型加速來(lái)襲，五月前有望提前亮相

近日，據(jù)路透社報(bào)道，AI初創(chuàng)公司DeepSeek正在加速推進(jìn)其R2人工智能模型的發(fā)布進(jìn)程。據(jù)悉，該模型原本計(jì)劃在五月正式推出，但目前DeepSeek方面正在努力加快這一步伐，以期盡…

AI
2025年2月26日
AI

消息稱?即夢(mèng)AI視頻生成平臺(tái)考慮接入DeepSeek

近日，有媒體報(bào)道稱，字節(jié)跳動(dòng)AI視頻生成產(chǎn)品“即夢(mèng)”正在考慮接入爆火的DeepSeek技術(shù)，以進(jìn)一步提升其視頻生成能力。這一聯(lián)動(dòng)玩法將為用戶帶來(lái)更加精細(xì)的視頻創(chuàng)作體驗(yàn)，例如，用戶可…

AI
2025年2月26日
AI

?消息稱字節(jié)跳動(dòng)豆包內(nèi)測(cè)自研深度思考模型，思維鏈功能初現(xiàn)端倪

今日，有網(wǎng)友驚喜地發(fā)現(xiàn)，字節(jié)跳動(dòng)旗下的AI助手豆包正在小范圍測(cè)試一項(xiàng)全新的深度思考模型。不過(guò)，令人意外的是，這次測(cè)試并未接入外界熱議的DeepSeek模型，而是采用了字節(jié)跳動(dòng)自研的…

AI
2025年2月25日
新聞

?vivo正式上線滿血版DeepSeek-R1，藍(lán)心小V迎來(lái)AI大升級(jí)

vivo于今日（2月25日）正式宣布，滿血版DeepSeek-R1已正式上線，為用戶帶來(lái)“AI體驗(yàn)再升級(jí)，藍(lán)心小V更智能高效”的全新感受。用戶只需將藍(lán)心小V升級(jí)至5.2.1.22版…

泡沫大盜
2025年2月25日
AI

?DeepSeek API充值服務(wù)重啟，調(diào)用價(jià)格有所調(diào)整

近日，DeepSeek API開放平臺(tái)傳來(lái)好消息，該平臺(tái)已重新開放API充值服務(wù)。此前，由于服務(wù)器資源緊張，DeepSeek一度暫停了API服務(wù)充值，給不少用戶帶來(lái)了不便。此次重啟…

AI
2025年2月25日
AI

?國(guó)家知識(shí)產(chǎn)權(quán)局重拳出擊，駁回63件DeepSeek惡意搶注商標(biāo)

今日，國(guó)家知識(shí)產(chǎn)權(quán)局發(fā)布了一則重要通告，針對(duì)近期DeepSeek人工智能大模型在全球范圍內(nèi)引發(fā)的廣泛關(guān)注，個(gè)別企業(yè)和自然人惡意搶注其商標(biāo)的行為進(jìn)行了嚴(yán)厲打擊?。據(jù)悉，這些惡意申請(qǐng)…

AI
2025年2月25日
商業(yè)

英偉達(dá)財(cái)報(bào)發(fā)布時(shí)間公布，DeepSeek沖擊后股價(jià)能否再創(chuàng)新高？

全球AI龍頭英偉達(dá)公司將于美國(guó)時(shí)間2月26日公布其最新一季的財(cái)報(bào)。近期，隨著英偉達(dá)股價(jià)在DeepSeek的沖擊后逐漸站穩(wěn)，不少投資機(jī)構(gòu)如摩根士丹利證券、瑞銀證券和凱基投顧等紛紛加入…

商業(yè)頭條
2025年2月25日

發(fā)表回復(fù)

登錄后才能評(píng)論

DeepSeek推出NSA：超快速長(zhǎng)上下文訓(xùn)練與推理的新利器

相關(guān)推薦

發(fā)表回復(fù)

分享到: