<b id="zlk11"><small id="zlk11"></small></b>

<rp id="zlk11"></rp>

<var id="zlk11"></var>

<video id="zlk11"><td id="zlk11"><output id="zlk11"></output></td></video>

Kimi最強開源思考模型 Kimi K2 Thinking發布：推理等超越GPT

發布時間：2025-11-27 00:33:11 作者：玩站小弟

11月7日消息，日前，月之暗面宣布發布Kimi K2Thinking，這是Kimi 迄今能力最強的開源思考模型。目前，該模型已上線kimi.com和最新版Kimi手機應用的常規對話模式。據了解，Kim 。

11月7日消息，最強日前，開源月之暗面宣布發布Kimi K2 Thinking，思考這是模型Kimi 迄今能力最強的開源思考模型。

目前，布推該模型已上線kimi.com和最新版Kimi手機應用的最強常規對話模式。

據了解，開源Kimi K2 Thinking原生掌握“邊思考，思考邊使用工具”的模型能力，在人類最后的布推考試（Humanity's Last Exam）、自主網絡瀏覽能力（BrowseComp）、最強復雜信息收集推理（SEAL-0）等多項基準測試中表現達到SOTA水平，開源超越GPT-5。思考

在Agentic搜索、模型Agentic編程、布推寫作和綜合推理能力等方面也取得全面提升。

據介紹，該模型無需人類干預，即可自主實現高達300輪的工具調用和持續穩定的多輪思考能力，從而幫助用戶解決更復雜的問題。

人類最后的考試是一項涵蓋100多個專業領域的終極封閉式學術測試。

在允許使用工具——搜索、Python、網絡瀏覽工具的同等情況下，Kimi K2 Thinking在這項基準評測中取得了44.9%的SOTA成績。

根據官方示例顯示，Kimi K2 Thinking經過5輪搜索和推理，結合每輪搜索到的新信息，層層深入，最終推理出了答案：

此外，在復雜搜索和瀏覽場景中，Kimi K2 Thinking模型也表現出色。

BrowseComp是由OpenAI發布的一個專門評估AI Agent網絡瀏覽能力的基準測試，這項測試的初衷是衡量AI Agent在信息過載環境中展現出的堅持性與創造力，即能否像人類研究員一樣“刨根問底”。

在這項極具挑戰的任務上，人類平均只能達到29.2%的成績。

Kimi K2 Thinking在這項基準測試中展現出極強的鉆研能力，以60.2%的成績成為新的SOTA模型。

在長程規劃和自主搜索能力的驅動下，Kimi K2 Thinking可借助多達上百輪的“思考→搜索→瀏覽網頁→思考→編程”動態循環，持續地提出并完善假設、驗證證據、進行推理，并構建出邏輯一致的答案。

這種邊主動搜索邊持續思考的能力，使Kimi K2 Thinking能夠將模糊且開放式的問題分解為清晰、可執行的子任務。

在官方示例中，Kimi K2 Thinking經過兩輪搜索和思考，先根據股票回購的已知信息找到了這家制造快速的公司，然后在美國證券交易委員會（SEC）的官網上找到了股票回購公告信息，得出了準確的答案：

Tag：

相關文章

Intel Xe3P將用于獨顯：兩個版本現身
11月6日消息，Intel即將推出的Xe3P GPU架構，可能并不僅限于此前已知的Crescent Island數據中心GPU和Nova Lake CPU的核顯，最新日志文件顯示，Xe3P架構很可能也
2025-11-27
日本計劃修改自衛隊軍銜名稱外交部：絕不允許日本軍國主義復活
中新網北京11月18日電 (記者李京澤謝雁冰)中國外交部發言人毛寧18日主持例行記者會。有記者提問：據報道，近期多名日本官員表示，日方正計劃修改自衛隊軍銜名稱，擬恢復“大佐”等舊日本軍隊的軍階
2025-11-27
知名臺企龍巖行：謀發展促融合
中新網龍巖11月18日電 (鄧麗錦)11月18日，“謀發展·促融合——知名臺企龍巖行”活動在福建龍巖舉行。本次活動吸引了100多位臺商代表、近80家臺資企業踴躍參與，覆蓋機械制造、電子信息、農產品精深
2025-11-27
不只是直播！時代少年團六周年演唱會快手打造線上狂歡現場
近日，時代少年團在其快手官方賬號上發布了「2025·愛你愛我」出道六周年演唱會概念預告片，七位少年通過視頻的形式發出演唱會邀請函。隨后快手也正式官宣，將對11月22日舉辦的時代少年團六周
2025-11-27
微軟醞釀Win11 UI重磅更新！“毛玻璃”限制解除可自由應用
11月6日消息，對于偏愛現代美學，特別是喜歡“模糊”效果的用戶來說，微軟正在醞釀一項好消息。Windows 11即將迎來重要的更新，微軟將解除對“亞克力&rdquo
2025-11-27
小米首款AI眼鏡發布固件更新支持抖音開播、小愛控車
11月19日消息，日前，小米首款AI眼鏡迎來1.4.16.0固件更新，固件包大小909MB，新增抖音開播、小愛控車等功能，并修復其他已知問題。本次更新詳情如下：1、支持英語口語陪練，在安靜環境中喚醒小
2025-11-27

最新評論

最斩殴美精品一二三区_手机免费Av片在线播放_精品在线欧美一区二区_亚洲欧洲自拍拍偷午夜色无码_精品3d动画肉动漫在线无码_日本高清中文字幕二区不卡