GenRM

  • 谷歌 DeepMind 展示 GenRM 技術,提升生成式 AI 推理能力

    谷歌DeepMind發(fā)布GenRM技術,通過創(chuàng)新獎勵模型增強生成式AI推理能力,提高大語言模型性能。GenRM能無縫集成指令調整,支持思維鏈推理,優(yōu)化結果質量。在推理任務中表現(xiàn)優(yōu)于傳統(tǒng)驗證器,標志著AI獎勵系統(tǒng)的重要演化。

    2024年9月3日