Google發佈了其迄今為止最強大的人工智慧模型套件”雙子座”(Gemini),但該公司已被指責在性能方面撒謊。
彭博社的一篇專欄文章稱,Google在最近的一段影片中誇大了”雙子座”的性能。專欄作家帕米-奧爾森(Parmy Olson)說,Google在本週早些時候的發佈會上播放了一段令人印象深刻的”What the AI quack”的上手影片,在影片中,Gemini 看起來能力非凡–也許能力太強了。
這段六分鐘的影片展示了 Gemini 的多模態功能(例如,口語對話提示與圖像識別相結合)。雙子座似乎能快速識別圖像(甚至是連線圖片),在幾秒鐘內做出反應,並即時跟蹤杯球遊戲中的紙團。當然,人類可以做到所有這些,但這是一個能夠識別並預測接下來會發生什麼的人工智慧。
不過,點選 YouTube 上的影片描述,Google有一個重要的免責聲明:「為了展示的目的,影片經過縮時處理,雙子座的輸出時間已經縮短,以求簡潔」。
這正是奧爾森不滿意的地方。根據她在彭博社發表的文章,Google在被要求發表評論時承認,影片展示並不是通過語音提示即時進行的,而是使用了原始鏡頭中的靜止圖像幀,然後寫出文字提示,讓雙子座做出回應。
奧爾森寫道:「這與Google似乎在暗示的內容大相逕庭:人可以與雙子座進行流暢的語音對話,同時雙子座會即時觀察並回應周圍的世界。」
「公平地說,Google經常對他們的展示影片進行剪輯,尤其是許多公司希望避免現場展示帶來的任何技術故障。稍作調整是常有的事。但是,Google在影片展示方面一直都有這類的問題。人們也曾質疑過Google的 Duplex 展示結果(還記得 Duplex 嗎?Duplex 是一款人工智慧語音助手,可以打電話給髮廊和餐館預訂房間。)而預先錄製的人工智慧模型展示影片,往往會讓人更加懷疑。」
在這種情況下,奧爾森認為Google是在作秀,目的是誤導人們,讓他們不知道 Gemini 仍然落後於 OpenAI 的 GPT。
Google對此並不認同。當被問及展示的真實性時,Google指出了Google DeepMind 研究副總裁兼深度學習負責人 Oriol Vinyals(也是 Gemini 的聯合負責人)的一篇文章,其中解釋了團隊是如何製作影片的。
Vinyals 說:「影片中的所有使用者提示和輸出都是真實的,為了簡潔起見進行了縮時。影片展示了使用 Gemini 建構的多模態使用者體驗。我們製作它是為了激勵開發人員。」
他補充說,團隊給雙子座提供了圖片和文字,並要求它預測接下來會發生什麼。
奧爾森表示,從他們的回答來看,這當然是處理這種情況的一種方法,但對Google來說可能並不是合適的作法。
至少在公眾看來,Google已經被 OpenAI 今年的巨大成功嚇了一跳。如果Google想激勵開發者,就不能通過精心剪輯的宣傳片,這些宣傳片可能會歪曲人工智慧的能力。而是通過讓記者和開發人員實際體驗產品,讓人們在小型公開測試版中用雙子座做蠢事。讓我們看看它到底有多強大。
- 延伸閱讀:Gemini是Google迄今為止最強大的AI模型,宣稱比ChatGPT好得多
- 延伸閱讀:Google Bard導入新的Gemini模型:非文字互動功力將大增、真要超車 OpenAI ChatGPT ?
- 延伸閱讀:Google最強AI模型Gemini 1.0版發佈,支援在PC或手機獨立運作、性能甚至超越GPT-4