<b id="zlk11"><small id="zlk11"></small></b>

<rp id="zlk11"></rp>

<var id="zlk11"></var>

<video id="zlk11"><td id="zlk11"><output id="zlk11"></output></td></video>

您的當前位置：首頁 > 探索 > 11月中文大模型基準測評出爐：GPT 5.1奪冠、DeepSeek開源第一正文

11月中文大模型基準測評出爐：GPT 5.1奪冠、DeepSeek開源第一

時間：2025-11-30 03:47:22 來源：網絡整理編輯：探索

核心提示

11月28日消息，SuperCLUE公布了2025年11月中文大模型基準測評結果。本次測評圍繞數學推理、科學推理、代碼生成含web開發）、幻覺控制、精確指令遵循五大核心任務展開，題目總量為822道新題

11月28日消息，月中源第SuperCLUE公布了2025年11月中文大模型基準測評結果。模型

本次測評圍繞數學推理、基準科學推理、測評出爐代碼生成（含web開發）、月中源第幻覺控制、模型精確指令遵循五大核心任務展開，基準題目總量為822道新題，測評出爐最終得分取各任務平均分。月中源第

本次共測評27個國內外大模型同臺競技，模型OpenAI的基準GPT 5.1與國產模型DeepSeek分別斬獲綜合冠軍與開源領域第一。

OpenAI的測評出爐GPT-5.1 (high) 以68.11的總分登頂，成為本月綜合表現最佳的月中源第大模型。

GPT-5.1 在數學推理（74.07）、模型代碼生成（76.30）等項表現突出，基準幻覺控制得分 88.80，展現出強穩定性。

Anthropic的Claude-Opus-4.5-Reasoning以62.57分緊隨其后，其幻覺控制得分高達90.33，在該項能力上領跑。

而在開源模型中，深度求索的 DeepSeek-V3.2-Exp-Thinking以53.69分位列開源陣營第一。

上一篇：“地無三里平”的貴州何以變“平”？

下一篇：NVIDIA、AMD、谷歌AI卡實測對比：N卡仍有5倍性價比優勢

友情鏈接

拼多多Q3財報發布：營收1083億元凈利潤313.8億元 TGA 2025再臨六款佳作巔峰對決芝奇內存再創新高速! 由德國超頻好手CENS創下 DDR5

免責聲明：本站所有信息均來源于互聯網搜集，并不代表本站觀點，本站不對其真實合法性負責。如有信息侵犯了您的權益，請告知，本站將立刻刪除。

Copyright © 2025 Powered by 11月中文大模型基準測評出爐：GPT 5.1奪冠、DeepSeek開源第一,企業錄(www.cmjokers.net)-公司信息發布,網上買賣交易門戶 sitemap

最斩殴美精品一二三区_手机免费Av片在线播放_精品在线欧美一区二区_亚洲欧洲自拍拍偷午夜色无码_精品3d动画肉动漫在线无码_日本高清中文字幕二区不卡