近日,谷歌的先進(jìn)AI模型Gemini 1.5對(duì)OpenAI新推出的視頻生成工具Sora進(jìn)行了深度評(píng)價(jià)。盡管Sora生成的視頻在視覺(jué)上頗具吸引力,但Gemini 1.5指出其中存在多處不符合常理的細(xì)節(jié)。
以Sora生成的一段日本街道視頻為例,畫面中大雪紛飛與櫻花盛開(kāi)同時(shí)出現(xiàn),這在現(xiàn)實(shí)中是不可能發(fā)生的,因?yàn)闄鸦ㄍǔT跍嘏拇杭臼㈤_(kāi),不會(huì)伴有降雪。此外,視頻中的降雪方式顯得過(guò)于均勻,與現(xiàn)實(shí)中的降雪模式存在明顯差異。更令人矚目的是,視頻中的人物雖然置身于大雪中,卻未穿著任何冬裝,這種矛盾之處讓人一眼就能看出視頻的非現(xiàn)實(shí)性。
Gemini 1.5的分析師表示:“雖然Sora生成的視頻在視覺(jué)上頗具吸引力,但其中的不合邏輯之處明顯,表明這些場(chǎng)景并非來(lái)自現(xiàn)實(shí)生活。”這一評(píng)價(jià)凸顯了當(dāng)前AI生成技術(shù)在真實(shí)性和邏輯性方面仍存在的挑戰(zhàn)。
與此同時(shí),谷歌的Gemini 1.5模型在處理能力上也展現(xiàn)出了其強(qiáng)大實(shí)力。它擁有驚人的100萬(wàn)詞條上下文窗口,遠(yuǎn)超其他競(jìng)爭(zhēng)對(duì)手,這意味著它能夠一次處理大量信息,包括長(zhǎng)達(dá)1小時(shí)的視頻和超過(guò)30,000行的代碼。
隨著AI技術(shù)的不斷進(jìn)步,我們期待未來(lái)能夠看到更加真實(shí)、生動(dòng)的視頻生成效果。
原創(chuàng)文章,作者:happy,如若轉(zhuǎn)載,請(qǐng)注明出處:http://2079x.cn/article/630941.html