谷歌發布全新升級大模型,對決OpenAI
摘要: 隨著OpenAI和谷歌相繼推出新一代大模型,生成式人工智能(AI)的競賽又達到新的高潮。當地時間14日上午,谷歌在I/O開發者大會上推出最新多模態AI產品,包括由升級后Gemini模型驅動的萬能AI助手Project Astra和對標Sora的文生視頻模型Veo。
隨著OpenAI和谷歌相繼推出新一代大模型,生成式人工智能(AI)的競賽又達到新的高潮。當地時間14日上午,谷歌在I/O開發者大會上推出最新多模態AI產品,包括由升級后Gemini模型驅動的萬能AI助手Project Astra和對標Sora的文生視頻模型Veo。
在演示視頻中,Project Astra能夠通過攝像頭看到的內容來分析、響應語音指令,同時與人類進行實時語音對話。隨著視覺和推理能力的提高,Project Astra還可以成功地識別出代碼序列、為電路圖提出改進建議等。
Veo則具備生成1080p高清視頻的能力,用戶可以通過文本、圖像、視頻等各種格式提供提示。點擊“擴展”按鈕,Veo生成視頻的時長持續增加,最終達到了1分10秒,超過了Sora的時長。目前,Veo已經開始在谷歌官網開放試用,此外,團隊還開發了實驗性工具VideoFX搭載Veo模型,為用戶提供更多的創作工具和可能性。
谷歌首席執行官桑達爾·皮查伊表示,谷歌所有工作都在圍繞生成式AI模型Gemini展開。根據此次發布會最后的官方統計,完全聚焦于AI的這場主題演講總共提到了121次AI。
美國《商業內幕》報道稱,大型科技公司之間的激烈競爭更加凸顯。就在谷歌I/O大會前一天,OpenAI發布了最新一代AI模型GPT-4o。GPT-4o是OpenAI聊天機器人的最新版本,它能像人類一樣對音頻提示做出幾乎即時的反應,實時翻譯語言,甚至能作為導師幫助學生。據彭博社報道,蘋果即將與OpenAI達成協議,在iOS 18中加入基于ChatGPT的人工智能功能。這項技術可能會被整合到定于今年9月發布的iPhone 16上。
谷歌也不甘示弱。在發布會上,谷歌表示,從今年晚些時候谷歌將發布的Pixel手機開始,谷歌將把其最新的Gemini人工智能模型整合到安卓設備中。
“在文本大模型上,谷歌和OpenAI最領先的技術咬得很緊。從使用體驗來看,目前谷歌的Gemini大模型比GPT-4o處理能力弱一些。”清華大學新聞學院新媒體研究中心主任、跨學科知名學者沈陽教授15日對《環球時報》記者表示,經過去年一年的醞釀,ChatGPT已經獲得了億級的用戶量。今年,幾大科技巨頭主要是在擴大產業規模上發力,希望把平臺用戶量推向10億以上。因此,GPT-4o主要設計目標是解決遷移到蘋果Siri平臺的工程問題,為Siri全面適配做重要的工程性優化,包括提升反應速度、減少出錯率等。而谷歌的優勢在于用戶基數大,且能夠直接觸達用戶。目前來看,大模型之爭“鹿死誰手”,還需要進一步觀察。