周三,谷歌發布了其新的人工智能模型Gemini,讓公眾首次看到了一項讓科技媒體陷入謠言的技術。Gemini是該公司迄今為止最強大的人工智能,將于今天開始在Bard和Pixel 8 Pro智能手機上使用,并將很快與谷歌服務的其他產品集成,包括Chrome、搜索、廣告等。谷歌有一個最重要的信息想讓你聽到:這個東西比你從OpenAI得到的任何東西都要好得多。
谷歌首席執行官桑達爾·皮查伊在一份聲明中表示:“這個新時代的模型代表了我們作為一家公司所做的最大的科學和工程努力之一。”“我真的為未來感到興奮,也為雙子座為世界各地的人們帶來的機會感到興奮。”
就在一年多前,OpenAI放棄了ChatGPT,讓谷歌和其他公司爭先恐后地證明他們的工具也同樣先進。到目前為止,谷歌的聊天機器人巴德與ChatGPT相比相形見絀。這家搜索巨頭表示,這種情況正在改變,從現在開始。巴德將是大多數人第一次接觸雙子座,盡管它不會帶著該模型的全部功能發射。
雙子座有三層。Gemini Ultra是谷歌最強大的機型,被定位為OpenAI GPT-4的競爭對手。Gemini Pro是一款中檔機型,可以擊敗ChatGPT的基準版本GPT-3.5。最后是Gemini Nano,這是一款更高效的手機。
谷歌助理和巴德副總裁蕭茜茜(Sissie Hsiao)在新聞發布會上表示,截至周三,巴德正在運行“經過微調的Gemini Pro版本”。“這將具有更高級的推理、規劃、理解和其他能力。”
蕭說,谷歌將在明年年初推出一款運行在Gemini Ultra上的付費版聊天機器人,該公司稱其為Bard Advanced。她拒絕透露定價細節。
谷歌分享了一長串的基準測試,顯示幾乎在每一項指標上,新的Bard都優于免費版的ChatGPT。該公司分享了幾次巴德新增壓能力的演示,包括與youtube用戶馬克·羅伯(Mark Rober)的合作,其中人工智能幫助建造了一架超精確的紙飛機。
除了巴德,雙子座也將在周三更新Pixel 8 Pro安卓手機,盡管容量有限。Gemini Nano現在為Pixel 8 pro上的Android Recorder應用程序的summary功能提供支持。谷歌表示,該人工智能還將支持Pixel 8 Pro上的安卓智能回復功能,但前提是你使用的是谷歌鍵盤,而且只能在WhatsApp上使用。該公司表示,明年將有更多的即時通訊應用和操作系統的其他部分加入Gemini。
目前,GPT-4是公眾可用的最強大的模型。谷歌表示,它已經擊敗了GPT-4, Gemini Ultra推出后將成為市場上最好的人工智能。
谷歌DeepMind產品副總裁Eli Collins表示:“Gemini的得分超過90%,是第一個在行業標準基準MMLU上超過人類專家的人工智能模型。”“這是我們最大、最強大的人工智能模型。”MMLU是大規模多任務語言理解(Massive Multitask Language Understanding)的縮寫,通過數學、物理、歷史、法律、醫學和倫理學等57個學科的標準測試來衡量人工智能的能力。
然而,目前尚不清楚公眾何時能看到證據。上周,the Information報道稱,谷歌推遲了Gemini的發布,因為該人工智能“無法可靠地處理一些非英語查詢”。原定于本周舉行的谷歌Gemini現場演示被無限期推遲。在回答有關所謂的外語問題時,柯林斯說:“實際上,雙子座在多語言能力方面表現相當出色。”谷歌沒有透露更多的具體信息,只是說Gemini Ultra將在“明年初”上市。
柯林斯說:“在32項廣泛使用的行業基準測試中,Gemini的性能在30項上也超過了目前最先進的水平。”
谷歌強調,Gemini是為“多模式性能”而設計的,這意味著它可以理解不同類型的信息,如文本、圖像、視頻、音頻等。谷歌分享了一段視頻,在視頻中,由雙子座驅動的巴德幫助一名學生完成物理作業,首先是一張帶有手寫問題的作業照片。然后,人工智能會無縫過渡到書面建議,包括公式和一步一步的答案。
谷歌的雙子座人工智能可以幫助你完成物理作業
字幕
從
英語
去年11月,路透社報道稱,OpenAI在“通用人工智能”(AGI)方面取得了進展,這是一個行業術語,指的是比人類更聰明的人工智能,它擁有一個名為“Q- star”或“Q*”的秘密模型。所謂的新聞是Q*展示了回答基本數學問題的能力,這比聽起來更重要,因為法學碩士們沒有接受過只有一個正確答案的訓練。數學能力將顯示出高水平的推理能力。
谷歌一再強調Gemini的數學和物理性能,但在新聞發布會上沒有提到AGI。Gizmodo問雙子座的數學表現是否表明了AGI的進展。
柯林斯說:“我沒有看到OpenAI工作的細節,所以我真的不能說。”“然而,我們在多模態推理和數學中的高級推理方面取得了很大進展。”