<b id="zlk11"><small id="zlk11"></small></b>
  • <b id="zlk11"><sub id="zlk11"></sub></b>

  • <rp id="zlk11"></rp>
    <var id="zlk11"></var>
    <video id="zlk11"><td id="zlk11"><output id="zlk11"></output></td></video>
      1. 您的當前位置:首頁 > 探索 > SuperCLUE最新評測:360zhinao3 正文

        SuperCLUE最新評測:360zhinao3

        時間:2025-11-21 05:20:53 來源:網絡整理 編輯:探索

        核心提示

        近日,中文精確指令遵循測評基準SuperCLUE-CPIF)正式發布,360zhinao3-o1.5以78.97分位居國產大模型第一,在任務類型、指令數量兩類劃分中均為國內榜首,其在精確指令遵循上的卓

        近日,新評中文精確指令遵循測評基準(SuperCLUE-CPIF)正式發布,新評360zhinao3-o1.5以78.97分位居國產大模型第一,新評在任務類型、新評指令數量兩類劃分中均為國內榜首,新評其在精確指令遵循上的新評卓越表現,正是新評AI技術提升“可用性”和“實用性”、從實驗室走向大規模產業應用的新評關鍵一步。

        本次測評涵蓋 GPT-5.1(high)、新評Gemini-3-Pro-Preview、新評GPT-5(high)、新評DeepSeek-V3.2-Exp-Thinking、新評Claude-Sonnet-4.5-Reasoning等共15個國內外模型參與。新評基于實際生產環境特點,新評SuperCLUE-CPIF 重點評估大型語言模型(LLM)在中文環境下精確遵循復雜、新評多約束指令的能力。測評結果顯示,國產主流大模型中,360zhinao3-o1.5以78.97分位居國產大模型第一,ERNIE-X1.1和DeepSeek-V3.2-Exp-Thinking 分別以75.90分和74.36分位居國內二、三。

        (圖說:SuperCLUE-CPIF 測評截圖)

        360zhinao3-o1.5指令遵循訓練部分的工作已經發布在論文Light-IF系列上。該模型直面現有大語言模型在處理交織多重約束的復雜指令時普遍存在的“懶惰推理”現象,通過自動化指令構建難度感知強化學習兩大核心技術,驅動模型從被動執行向“主動檢查-修改-再檢查”的演進,顯著提升了在復雜指令下的精準遵循度。

        (圖說:Light-IF系列模型論文發表)

        另外,360zhinao3-o1.5的訓練模型Light-IF論文曾被頂會AAAI 2026成功收錄。據悉,AAAI 2025共收到12957篇有效投稿,錄用3032篇,錄取率為23.4%,其中Oral論文占比4.6%。而AAAI 2026的投稿量進一步飆升至23680篇,僅錄用4167篇,錄取率降至17.6%,Oral錄用率更是進一步降低。Light-IF能在如此激烈的競爭中脫穎而出,可見其在精準指令遵循上的突破性。值得一提的是,Light-IF系列模型已陸續在Hugging Face開源,供全球開發者使用、對比與復現。

        將小參數模型的能力推向極致,是360智腦團隊持續深耕的技術路徑。此前,360與北京大學聯合研發的Tiny-R1-32B模型,僅以5%的參數量便在數學等領域逼近了千億級模型的性能,是一次在模型優化與融合上的深厚積累。這種對“小而精”垂類模型的持續打磨,為AI智能體(Agent)的爆發奠定了堅實基礎。

        最斩殴美精品一二三区_手机免费Av片在线播放_精品在线欧美一区二区_亚洲欧洲自拍拍偷午夜色无码_精品3d动画肉动漫在线无码_日本高清中文字幕二区不卡