Mistral-Medium意外泄露？沖上榜單的這個神秘模型讓AI社區(qū)討論爆了

AI ? 2024年1月31日 19:37:33 ? AI

「我現(xiàn)在 100% 確信 Miqu 與 Perplexity Labs 上的 Mistral-Medium 是同一個模型?！?/p>

近日，一則關(guān)于「Mistral-Medium 模型泄露」的消息引起了大家的關(guān)注。

泄露傳聞與一個名為「Miqu」的新模型有關(guān)，在評估語言模型情商的基準(zhǔn)?EQ-Bench（EQ-Bench 與 MMLU 的相關(guān)性約為 0.97、與 Arena Elo 的相關(guān)性約為 0.94）上， Miqu 直接吊打了除 GPT-4 之外的所有大模型，而且它的得分與 Mistral-Medium 非常接近：

^{圖源：https://x.com/N8Programs/status/1752441060133892503?s=20}

開源地址：https://huggingface.co/miqudev/miqu-1-70b

這么強(qiáng)大的模型，項目的發(fā)布者卻是一位神秘人士：

有人問「who made you」， Miqu 直接自報家門：「I was created by the Mistral Al team.」

有人分別向兩個模型發(fā)送了同一道測試問題，收到的回答都是用俄語表達(dá)的。測試者加深了懷疑：「它似乎知道標(biāo)準(zhǔn)謎題，但如果是惡作劇者，根本不可能將其調(diào)整為同樣用俄語回答?！?/p>

在翻譯過程中，表述也近乎相同。

Miqu 到底來自何方？它真的是 Mistral-Medium 嗎？

在持續(xù)兩天的熱議中，多位開發(fā)者針對兩個模型做了對比，對比的結(jié)果指向以下幾種可能性：

1、Miqu 就是 Mistral-Medium；

2、Miqu 確實(shí)是來自 MistralAI 的一個模型，但是是一些早期的 MoE 實(shí)驗(yàn)版本或其他版本；

3、Miqu 是 Llama2 的微調(diào)版本。

在前面，我們介紹了支持第一種可能性的開發(fā)者給出的理由。隨著事件的發(fā)酵，更多開發(fā)者投入了解密一般的行動中，對兩個模型進(jìn)行了更深入的測試。一位 reddit 網(wǎng)友熬夜肝出的測試表明，Miqu 更像是 MistralAI 模型的早期版本。

這位開發(fā)者將模型應(yīng)用于四個專業(yè)的德語在線數(shù)據(jù)保護(hù)培訓(xùn) / 考試中。測試數(shù)據(jù)、問題及所有指令都是用德語進(jìn)行的，而字符卡是英語的。這可以測試翻譯能力和跨語言理解能力。

具體測試方法如下：

在提供信息之前，用德語指示模型：「我將給你一些信息，請注意這些信息，但回答時只需用『OK』來確認(rèn)你已理解，不要多說其他的。」這是為了測試模型對指令的理解和執(zhí)行能力。
在提供話題的所有信息后，向模型提出考題。這是一個選擇題（A/B/C），其中第一個問題和最后一個問題相同，但選項順序和字母（X/Y/Z）被更改。每次測試包含 4-6 個考題，總共 18 個多項選擇題。
根據(jù)模型給出的正確答案數(shù)量來進(jìn)行排名，首先考慮的是在提供了課程信息后的答案，其次是在沒有提前提供信息的情況下盲目回答的答案，以應(yīng)對平局情況。所有測試都是獨(dú)立的單元，每次測試之間會清除上下文，各個會話之間不保留任何記憶或狀態(tài)。

詳細(xì)測試報告如下：

miqudev/miqu-1-70b GGUF Q5_K_M，32K 上下文， Mistral 格式：只對 4+4+4+5=17/18 道選擇題給出了正確答案。沒有先前的信息，只回答問題，給出正確答案：4+3+1+5=13/18。沒有按照說明用 “OK” 確認(rèn)數(shù)據(jù)輸入。

在測試過程中，開發(fā)者發(fā)現(xiàn) Miqu 與 Mixtral 有許多相似之處：出色的德語拼寫和語法雙語；在回復(fù)中添加翻譯；在回復(fù)中添加注釋和評論。

不過，在這位開發(fā)者的測試中，Miqu 與 Mixtral-8x7B-Instruct-v0.1（4-bit）相比表現(xiàn)要差一些，仍優(yōu)于 Mistral Small 和 Medium。但它并不比 Mixtral 8x7B Instruct 好得多。這位開發(fā)者猜測，Miqu 可能是泄露的 MistralAI 模型，是一個較舊的，可能是概念驗(yàn)證模型。

這是我們目前看到的支持第二種說法的最詳細(xì)的測試。

不過，也有開發(fā)者認(rèn)為，Miqu 和 MistralAI 沒有關(guān)系，反而更像 Llama 70B，因?yàn)槠浼軜?gòu)與 Llama 70B「完全相同」，「不是專家混合模型」。

同樣地，也有人測試之后發(fā)現(xiàn)，Miqu 的確更像 Llama：

但從得分差距來看，Miqu 和 Llama 70B 顯然又不是同一個模型。

所以，有人總結(jié)，要么 Miqu 是 Llama 微調(diào)版本，要么是 Mistral-Medium 的早期版本：

前者為真的話，Miqu 可能是在 Mistral-Medium 數(shù)據(jù)集上微調(diào)的 Llama 70B：

假如后者為真，Miqu 只是 Mistral API 的蒸餾，這或許將是「美國偽造登月」級別的鬧?。?/p>

最后一個問題，泄露者是誰？

根據(jù)很多 X 平臺用戶提供的線索，這次疑似泄露的模型最初是發(fā)在一個名叫 4chan 的網(wǎng)站上的。這個網(wǎng)站是一個完全匿名的實(shí)時消息論壇，用戶不需要注冊就能就可以發(fā)表圖文言論。

當(dāng)然，這些結(jié)論均屬主觀想法。對于所有的 AI 研究者來說，這波劇情需要一個「真相」來終結(jié)。

^{參考鏈接：https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/}

本文轉(zhuǎn)載自：機(jī)器之心，不代表科技訊之立場。原文鏈接：https://www.jiqizhixin.com/articles/2024-01-31-6

AI AI社區(qū)模型

AI認(rèn)證作者

0 0

新聞

2024年世界互聯(lián)網(wǎng)大會：人工智能成最大亮點(diǎn)

2024年11月20日，2024世界互聯(lián)網(wǎng)大會正式召開，烏鎮(zhèn)峰會正式邁入第11個年頭。本次大會上人工智能成為了最大亮點(diǎn)之一，國家互聯(lián)網(wǎng)信息辦公室主任、世界互聯(lián)網(wǎng)大會理事長莊榮文在主…

AI
2024年11月21日
新聞

微軟EMEA市場高層調(diào)整，加速AI與自動化布局

近日，微軟宣布對其歐洲、中東和非洲（EMEA）市場的高級領(lǐng)導(dǎo)團(tuán)隊進(jìn)行重要調(diào)整，此舉被視為微軟進(jìn)一步支持人工智能（AI）和自動化等新興技術(shù)承諾的一部分。微軟正式任命克萊爾·巴克利（…

Microsoft
2024年10月29日
新聞

英偉達(dá)布局印度市場印度半導(dǎo)體產(chǎn)業(yè)“雄心”更近一步？

芯片巨頭英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛和印度信實(shí)工業(yè)（Reliance Industries）董事長穆克什·安巴尼討論了人工智能基礎(chǔ)設(shè)施投資合作前景。英偉達(dá)表示，該公司將向信實(shí)工業(yè)在印度古吉拉特邦建造的一個數(shù)據(jù)中心提供Blackwell人工智能處理器。

科技探索者
2024年10月29日
新聞

一加攜手高通舉辦一加 13 性能解讀特別活動，首發(fā)多項獨(dú)家性能黑科技

一加13首批搭載驍龍8至尊版，提供24GB+1TB內(nèi)存及散熱系統(tǒng)Pro，帶來多項性能黑科技，安兔兔跑分破300萬。搭載自研雙引擎，流暢度提升，游戲性能強(qiáng)勁。將于10月31日發(fā)布。

潮玩君
2024年10月23日
AI

微軟推出10款新AI代理，銷售、財務(wù)都覆蓋，與Salesforce競爭升級

值得一提的是，用戶可以在Copilot Studio中，通過低代碼或無代碼指令，輕松創(chuàng)建自主代理。用戶只需設(shè)定代理的目標(biāo)，例如整理郵件請求，代理便能自動完成任務(wù)。

蘋果派
2024年10月22日
驍龍峰會2024直擊：榮耀攜手高通，共同定義AI原生應(yīng)用場景

榮耀終端公司CMO郭銳出席高通峰會，分享榮耀與高通在AI領(lǐng)域的合作成果。榮耀Magic7系列首次曝光，將搭載生成式AI能力。雙方共同定義AI時代應(yīng)用場景，在智慧互聯(lián)、交互和性能上帶來革命性體驗(yàn)。

潮玩君
新聞 2024年10月22日
新聞

臺積電ADR大漲近10%創(chuàng)新高，AI熱潮提振營收預(yù)期

昨日（10月17日），臺積電（TSMC）的美國存托憑證（ADR）在收盤時達(dá)到了205.84美元，較前一個交易日上漲了18.36美元，漲幅高達(dá)9.79%。盤中，其價格更是觸及了自19…

小丸子
2024年10月18日
AI

2024 OPPO開發(fā)者大會：攜手共建人人可參與的AI新世界

?OPPO發(fā)布全新ColorOS 15，聚焦流暢、AI、設(shè)計、易用性等方面全面革新，帶來超輕快、更自在的智慧流暢體驗(yàn)。

潮玩君
2024年10月17日
新聞

微軟生成式AI副總裁Bubeck離職，加入OpenAI推進(jìn)通用人工智能研究

微軟公司于當(dāng)?shù)貢r間10月14日正式宣布，其生成式人工智能（AI）研究的副總裁Sébastien Bubeck（塞巴斯蒂安?布貝克）將離職，并加入ChatGPT的制造商OpenAI，…

Microsoft
2024年10月15日
AI

【直播已結(jié)束】2024 OPPO 開發(fā)者大會

ODC24 將發(fā)布 ColorOS 15 輕快流暢、自在 AI 的全新體驗(yàn)，帶來 OPPO AI 最新技術(shù)進(jìn)展，與合作伙伴共建智慧生態(tài)。讓 AI，更近一步。

潮玩君
2024年10月15日
AI

OpenAI Playground新增“元提示”工具，助力高效創(chuàng)建AI提示詞

在人工智能（AI）時代，如何精準(zhǔn)地提出合適的提示詞（Prompt）成為了影響AI應(yīng)用效果的關(guān)鍵因素之一。近日，科技媒體The Decoder報道了OpenAI對其提示詞優(yōu)化功能Pl…

AI
2024年10月12日
AI

vivo發(fā)布藍(lán)心智能AI戰(zhàn)略，大模型與操作系統(tǒng)深度融合

在今日上午舉行的2024 vivo開發(fā)者大會開幕演講中，vivo正式公布了其藍(lán)心智能AI戰(zhàn)略，旨在通過AI技術(shù)重構(gòu)系統(tǒng)體驗(yàn)，并與大模型實(shí)現(xiàn)深度融合，向整個行業(yè)全面開放。 vivo表…

NEWS
2024年10月10日
新聞

蘋果計劃推出AI功能AirPods 為智能眼鏡開發(fā)打基礎(chǔ)

根據(jù)之前的估計，這款智能眼鏡可能將在2027年推出，但在此之前，蘋果實(shí)際上正在開發(fā)另一款產(chǎn)品。最新報告稱這將為其即將推出的可穿戴技術(shù)鋪平道路。這款產(chǎn)品便是一款具備AI功能和攝像頭模塊的新款A(yù)irPods。

蘋果派
2024年10月7日
新聞

英偉達(dá)CEO黃仁勛：核電是滿足數(shù)據(jù)中心爆炸式增長能源需求優(yōu)秀選擇

據(jù)彭博社報道，英偉達(dá) CEO 黃仁勛在接受彭博電視臺采訪時表示，核電是滿足數(shù)據(jù)中心節(jié)節(jié)增長能源需求的一種優(yōu)秀選擇。

科技探索者
2024年9月30日
產(chǎn)品

海信AI電視E7N正式發(fā)布，引領(lǐng)AI畫質(zhì)新標(biāo)桿

海信正式發(fā)布AI電視新品E7N，集信芯AI畫質(zhì)芯片 Pro、自研星海AI大模型、超畫質(zhì)Mini LED、深度定制的柔光防眩屏，以及AI旗艦 SOC芯片于一體，以AI賦能，打造電視大屏AI畫質(zhì)新標(biāo)桿。

科技探索者
2024年9月30日
新聞

亞馬遜40億美元投資AI公司Anthropic交易獲英國批準(zhǔn)

英國反壟斷監(jiān)管機(jī)構(gòu)“競爭和市場管理局”（CMA）今日宣布，不會對亞馬遜40億美元投資AI初創(chuàng)公司Anthropic交易展開進(jìn)一步的調(diào)查。

潮玩君
2024年9月29日
AI

任天堂出手：AI 生成的馬力歐圖片遭大規(guī)模下架

近期一款人工智能驅(qū)動的版權(quán)工具成功刪除了大量包含 AI 生成的馬里歐圖片的 X 帖子，該工具屬于一家名為 Tracer 的公司，該公司利用人工智能識別出了這些圖像，并代表任天堂向 X 平臺發(fā)出下架通知。

蘋果派
2024年9月25日
AI

Anthropic 擬以 300-400 億美元估值融資，加速與 OpenAI 競爭

美國人工智能（AI）初創(chuàng)公司Anthropic 正在積極與投資者洽談新一輪融資事宜，據(jù)《The Information》報道，此次融資后，Anthropic 的估值有望飆升至300…

AI
2024年9月24日
新聞

iPhone 16發(fā)售前價格已“破發(fā)”？有平臺降價達(dá)千元

蘋果最新發(fā)布的iPhone 16系列智能手機(jī)即將于9月20日在全球正式發(fā)售。但相較于往年的熱度，今年蘋果手機(jī)在中國市場“遇冷”，已經(jīng)有電商平臺提供了高達(dá)千元的折扣。

潮玩君
2024年9月20日
新聞

YouTube 將推出 AI“一站式服務(wù)”：可生成創(chuàng)意、標(biāo)題、完整視頻

據(jù) The Verge 報道，在當(dāng)?shù)貢r間周三（今天）舉行的“Made on YouTube”特別活動上，谷歌宣布為 YouTube 帶來一系列 AI 相關(guān)功能，有望改變視頻制作的方式乃至視頻本身。

蘋果派
2024年9月19日

發(fā)表回復(fù)

登錄后才能評論

Mistral-Medium意外泄露？沖上榜單的這個神秘模型讓AI社區(qū)討論爆了

相關(guān)推薦

發(fā)表回復(fù)