踏入 12 月有大量 AI 產品更新,繼 AWS 和 OpenAI 之後,Google 突然發表 Gemini 2.0 Flash。根據官方的資料,新模型是 1.5 Flash 的升級版本,整體表現卻比 1.5 Pro 版本更強勁,而且回應速度倍增。Google 還公布新項目 Project Mariner,跟上微軟、OpenAI 趨勢將 AI 從只有對答的「口腔期」走向行動代理。
根據 Google 的命名系統,Flash 模型屬輕量版,Pro 為專業版。不過官方公布的數據,Gemini 2.0 Flash 的整體評分均完勝 1.5 Pro,只有處理長文字和翻譯語音不敵。
Google 目前先以實驗模型方式在 Google AI Studio 和 Vertex AI 提供 Gemini 2.0 Flash 有限度預覽,明年才陸續推出不同版本模型。
在今年 I/O 大會發表的 Project Astra,新版本將會用上 Gemini 2.0,唯仍然只限開放給小數可信的開發人員試用。Project Astra 為 AI 助理,運用模型的多重模態能力,能理解現實環境情況,包括文字、語音、動態影像等。加入 Gemini 2.0 的 Project Astra 有幾項升級能力:
- 對話:同時支援多種語言,甚至混合語言對話、理解口音和不常用的詞彙;
- 新工具:可以使用搜尋、Lens、地圖等,理解周遭環境;
- 記憶力:將 Project Astra 記憶時間加長至 10 分鐘,記住內容提供個人化功能;
- 時延:新模型近乎實時理解語音,Project Astra 能做到接近人類的對話反應。
Project Mariner 開啟 Google的 AI 代理
Google 又發表新項目 Project Mariner,展示 Gemini 2.0 當 AI 代理的能力。Project Mariner 是瀏覽器上的 AI 代理,能理解用戶正在瀏覽網站的內容,包括文字、程式碼、圖像、表格等元件。
根據示範,在試算表內有幾間公司名字,在側欄叫出 Project Mariner,吩咐從網站找出這些公司的電郵聯絡方法。然後 AI 代理自動執行一連串動作,如開啟 Google 搜尋、找出資訊、點擊進入官網瀏覽,隨即得出結果向用戶匯報。用戶都能監察整個過程。
Project Mariner 在評估 AI 在現實世界網頁工作的基準測試 WebVoyager 獲得 83.5%。Google 稱是領先業界的成果,只是執行速度較慢和偶爾不準確,不過技術改進會解決。目前 Project Mariner 以 Chrome 擴充功能方式,有限度向可信測試人員提供。
另外 Google 還公布幾個 AI 代理試驗項目,包括程式碼代理 Jules、打機代理 Genie 2,展示 Gemini 2.0 在可行性。