谷歌打響AI模型反擊戰。測評超
北京時間12月7日凌晨,數據谷歌宣布推出其最通用、測評超功能最強大的數據新大型語言模型Gemini 1.0。
據介紹,測評超針對不同場景,數據Gemini 1.0包含三個版本:適用于高度復雜任務的測評超Gemini Ultra、適用于各種任務的數據最佳模型Gemini Pro和適用于手機等端側設備的Gemini Nano。
在模型架構方面,測評超Gemini 1.0采用Transformer架構,數據采用高效的測評超Attention機制,支持32K的數據上下文長度。此外,測評超該模型具有復雜多模態推理能力,數據可以同時識別解文本、測評超圖像、音頻、視頻和代碼五種信息。它能夠發現大量數據中難以辨別的知識,因此能夠更好地理解微妙的信息,并回答復雜的問題。這使得它特別擅長解釋數學和物理等復雜學科的推理。
例如,Gemini 能夠獨立批改物理作業,在正確“讀懂”題目、識別凌亂手寫筆跡的同時,指出學生在解題過程中的錯誤,并給出正確答題步驟。通過圖像和語音輸入,Gemini可以指導做菜,并在不同階段提出相應的建議。
在編碼能力上,Gemini可以理解、解釋和生成世界上最流行的編程語言(如Python、Java、C++和Go)的高質量代碼。同時,Gemini還可以用作更高級編碼系統的引擎。
谷歌聲稱,Gemini Ultra以90.0%得分成為第一個在MMLU(大規模多任務語言理解)測試中超過人類專家的模型。記者了解到,MMLU是一個結合了數學、物理、歷史、法律、醫學和倫理學等57個科目的測試集,用于測試世界知識和解決問題的能力。相比于其他測試集,MMLU的廣泛性和深度更強,特別是測試大模型在復雜和多變的真實世界場景中的表現。
“Gemini是我們最強大的模型。通過吸收大量的信息,它可以理解我們四周的環境,理解我們的思維方式,并有所產出。”谷歌DeepMind首席執行官、Gemini團隊代表德米斯·哈薩比斯(Demis Hassabis)介紹說。
同時,他也正面談及Gemini與GPT-4的對比?!拔覀冞\行了32個完善的基準測試來比較Gemini和GPT-4,從廣泛的整體測試(如多任務語言理解基準測試)到比較兩個模型生成Python代碼的能力。我認為我們在32項基準中的30項中大幅領先?!惫_比斯說。
在Gemini發布之前,谷歌在生成式AI和LLM方面主推的兩款模型PaLM 2和LaMDA,在用戶當中收獲的評價一直不高,相對于業界領軍的GPT-4差距很大。Gemini的發布,標志著谷歌邁進新紀元的開始。
目前,Gemini Pro和Gemini Nano可開始應用于在聊天機器人Bard和智能手機Pixel 8 Pro中,并將很快與谷歌服務中的其他產品集成,包括Chrome、搜索和廣告等。最強大的Gemini Ultra則將在明年發布。
責任編輯:張維佳