谷歌DeepMind發(fā)布創(chuàng)新MoD架構,大幅提升AI訓練與推理效率

谷歌DeepMind發(fā)布創(chuàng)新MoD架構,大幅提升AI訓練與推理效率

在人工智能領域,谷歌DeepMind再次引領創(chuàng)新潮流,發(fā)布了全新的Mixture-of-Depths(MoD)架構。這一突破性技術改變了傳統(tǒng)的Transformer計算模式,通過動態(tài)分配大模型中的計算資源,顯著提高了AI模型的訓練效率和推理速度。

據了解,MoD架構通過優(yōu)化不同層次模型深度中的計算資源分配,實現了對輸入序列中特定位置token的精準關注。它限制給定層的自注意力和MLP計算的token數量,從而避免不必要的計算,使神經網絡能夠更有效地聚焦于真正重要的信息。這種動態(tài)分配計算資源的方式,不僅提高了計算效率,還使得模型在訓練過程中能夠更快速地收斂。

在等效計算量和訓練時間下,MoD架構展示出了顯著的優(yōu)勢。谷歌方面的測試結果顯示,相比傳統(tǒng)方法,MoD每次向前傳播所需的計算量更小,而且在訓練后的采樣過程中,步進速度提高了50%。這一性能提升對于大型AI模型的訓練和推理具有重要意義,將有助于加速AI技術的研發(fā)和應用。

此外,谷歌研究團隊還探討了MoD與MoE(Mixture-of-Experts)結合的可能性。MoDE結合了MoD的動態(tài)計算分配和MoE的專家模型優(yōu)勢,有望進一步提升AI模型的性能和推理速度。這一結合為AI技術的發(fā)展開辟了新的道路,有望為未來的AI應用帶來更高效、更準確的解決方案。

除了MoD架構的發(fā)布,谷歌DeepMind還聯(lián)合斯坦福大學開發(fā)了一款名為SAFE的AI事實核查工具。SAFE通過對AI聊天機器人生成的回復進行分析、處理和評估,以驗證其準確性和真實性。這一工具對于解決AI幻覺問題具有重要意義,有助于提升AI模型的可靠性和可信度。

谷歌方面的研究人員通過創(chuàng)建包含大量事實的數據集并在多個大語言模型上進行測試,驗證了SAFE的性能。結果顯示,SAFE在對爭議事實的分析中表現出色,其判定在進一步審查下的正確率達到了76%。同時,SAFE還具備顯著的經濟性優(yōu)勢,其成本比人工注釋便宜20多倍,為AI技術的廣泛應用提供了有力支持。

MoD架構和SAFE工具的發(fā)布,再次展示了谷歌DeepMind在人工智能領域的創(chuàng)新實力。這些技術成果不僅提高了AI模型的訓練和推理效率,還解決了AI應用中的一些關鍵問題,為AI技術的進一步發(fā)展奠定了堅實基礎。未來,隨著這些技術的不斷優(yōu)化和完善,相信AI將在更多領域展現出其巨大的潛力和價值。

原創(chuàng)文章,作者:李森,如若轉載,請注明出處:http://2079x.cn/article/643913.html

李森李森管理團隊

相關推薦

發(fā)表回復

登錄后才能評論