您現在的位置是:百科 >>正文
一夜封神!谷歌Gemini 3.0 Pro發布即屠榜 馬斯克奧特曼祝賀點贊
百科9人已圍觀
簡介11月19日消息,谷歌最新一代推理模型Gemini 3.0 Pro正式發布,并同步在Google AI Studio推出預覽版,開放API接口。該模型即將陸續登陸谷歌旗下各類產品。值得玩味的是,Ope ...
11月19日消息,夜封谷歌最新一代推理模型Gemini 3.0 Pro正式發布,神谷斯克并同步在Google AI Studio推出預覽版,發布開放API接口。即屠該模型即將陸續登陸谷歌旗下各類產品。榜馬
值得玩味的奧特是,OpenAI聯合創始人兼CEO薩姆·阿爾特曼與xAI創始人埃隆·馬斯克先后向谷歌發來“賀電”。曼祝阿爾特曼在推特上評價“Gemini 3看起來很不錯”,賀點谷歌CEO桑達爾·皮查伊僅以一個表情包輕松回應。夜封
一經發布,神谷斯克Gemini 3 Pro幾乎橫掃各大評測榜單,發布在LMArena大模型競技場中以1501的即屠Elo得分高居榜首。
根據谷歌公布的榜馬測試數據,Gemini 3 Pro毫無爭議地成為當前全球數學能力最強的奧特AI。在被譽為“地獄難度”的曼祝數學競賽基準MathArena中,當GPT-5.1等其他大模型仍在1%左右徘徊時,Gemini 3 Pro一舉達到23.4%,遙遙領先。
編程能力方面,盡管在SWE-Bench上未取得SOTA成績,但仍穩居第一梯隊。其在Live Code Bench的Elo得分突破2400分,并在工具調用與終端操作基準測試中排名第一。
更令人震撼的是其視覺理解能力:對屏幕截圖的理解準確率高達72.7%,達到現有最先進水平的兩倍。這意味著AI Agent將不再是“視覺障礙者”,有望徹底重塑AI操作計算機的交互模式。
此外,谷歌還同期發布了自家的Agentic編程平臺——Google Antigravity,再添一枚“技術砝碼”。
根據Model Card披露,Gemini 3 Pro在推理、多模態、Agent工具使用等關鍵基準測試中實現了全面領先。
在硬件層面,Gemini 3 Pro基于谷歌自研的張量處理單元(TPU)訓練。相比CPU,TPU在處理大語言模型所需的大規模計算時速度更快,其配備的大容量高帶寬內存也使其能夠高效運行超大模型與批量數據。
在實際應用上,最新發布的Gemini Agent實驗功能已能自主執行多步驟復雜流程。例如,用戶只需提出“整理一下我的收件箱”,它即可自動優先安排待辦事項,并起草郵件回復供用戶確認。
目前,Gemini 3預覽版正逐步開放:所有用戶可通過Gemini應用使用;Google AI Pro與Ultra訂閱用戶可在搜索的AI模式中體驗;開發者可通過Gemini API、Google Antigravity及Gemini CLI訪問;企業用戶則通過Vertex AI與Gemini Enterprise獲取服務。
Tags:
相關文章
全運看名城,每處都有名場面
百科十五運會賽事正酣,嶺南大地處處是賽場、人人是東道主。賽場之外,嶺南大地藏著一批獲官方認證的寶藏城市——它們或素有“跳水之鄉”“舉重之鄉”的美譽,或榮膺“中國龍舟龍獅運動名城”“全國象棋之鄉”的稱號,運 ...
【百科】
閱讀更多只有老年人才會得帶狀皰疹嗎?丨中新真探
百科中新網11月11日電 雖然中老年人是帶狀皰疹的高危人群,但年輕人也絕不可掉以輕心,兒童、青少年及青壯年均有發病風險。一旦感染,短期內易患急性神經炎,表現為病變區域和周圍的疼痛,且病毒有傳染性,可能使未 ...
【百科】
閱讀更多置換價5.28萬元 五菱宏光MINIEV四門版301km續航版上市
百科11月11日消息,五菱宏光MINIEV四門版301km臻享+款上市,指導價5.58萬元,疊加無門檻置換政策可享置換補貼價5.28萬元。11月12日下訂立享“寵愛四重禮”,無門檻 ...
【百科】
閱讀更多