<b id="zlk11"><small id="zlk11"></small></b>

<rp id="zlk11"></rp>

<var id="zlk11"></var>

<video id="zlk11"><td id="zlk11"><output id="zlk11"></output></td></video>

?

當前位置：首頁 > 娛樂 > AI進化成人的速度可能比你想象的還慢

AI進化成人的速度可能比你想象的還慢

2025-11-16 21:55:40 [知識] 來源：企業錄(www.cmjokers.net)-公司信息發布,網上買賣交易門戶

吹了這么久AI，進化到底嘛時候才能超越人類??？成人

其實，圈內人對 AI 都有一個終極期望，速度可的還就是想象實現 AGI （通用人工智能），說白了，進化就是成人造出“和人一樣聰明的AI”。

咱去馬斯克的速度可的還社交平臺上逛一圈，會發現他三句不離AGI。想象。進化

OpenAI的成人奧特曼也在瘋狂預言，AGI即將到來，速度可的還也就這三五年的想象事兒了。

但這玩意，進化到底咋衡量呢？成人俗話說得好，人和人的速度可的還區別，比人和豬的區別還大。。到底啥水平，才能和人一樣聰明??？

就連天天為了AGI吵架的大佬們，也根本說不出來，AGI到底是個啥。。

合著都在這虛空對線是吧。

所以最近，一幫頂尖大佬看不下去了，幾十號人聯手發了篇論文，作者還是全明星陣容，包括圖靈獎得主、谷歌前 CEO 等等，他們聯合起來，給出了目前為止第一個 AGI 的量化定義。

他們也順便用GPT模型做了個測試，結果顯示，如果AGI是100分，GPT-5只有58分，不及格的水平。

這幫大佬的核心觀點是：AGI，就是一種能達到“一個受過良好教育的成年人”的能力的人工智能。

他們把心理學中一個最權威的理論，CHC 理論，給AI搬過來了。

CHC 的觀點，簡單來說，就是智力這玩意，不是一個單一的標準能衡量的東西，需要多維度考察。

說白了，這就和高考差不多。一門課強根本不夠，你得門門都強，才證明你厲害。

所以，他們把 AI 的能力分成了 10 個核心能力，每個占了 10% 的分。它們分別是：

(K) 通識知識、(RW) 讀寫能力、(M) 數學能力、(R) 即時推理、(WM) 工作記憶、(V) 視覺處理、(A) 聽覺處理、(S) 反應速度、(MS) 長期記憶存儲、 (MR) 長期記憶檢索。

這里面比較抽象的，可能就是工作記憶和長期記憶了。

工作記憶，其實就是短期記憶，就是說我剛剛提過的東西，你現在還能記得起來；而長期記憶就是，AI通過跟我的對話，永久性學到了新東西，就像你上過學，即使你畢業了，“奇變偶不變”還刻在你DNA里一樣。。

每一種能力，他們都會叫AI測試，也就是寫他們精心準備的測試題。比如(R) 即時推理這一塊，他們就專門找了些略微燒腦的問題，比如：

“David認識張先生的朋友Jack，Jack認識David的朋友林女士。認識Jack的人都有碩士學位，認識林女士的人都是上海人。所以誰既是上海人又有碩士學位？”（測試你是不是AI的時候到了）

他們找了OpenAI的兩員大將，GPT-4（2023）和 GPT-5（2025）來考試。結果，GPT-4 總分 27。 GPT-5 總分 58，合計也沒達到100分。

而且，咱來看看這成績單，有拉滿的，也有拉褲兜的，純純嚴重偏科。

比如 GPT-5，在通識(K)、讀寫(RW)、數學(M)這幾項上，直奔 9 分 10 分。所以說目前來看，這幾項是AI的強項。

而 (MS) 長期記憶存儲這項，GPT-5純純大光頭，3-4分的也有一堆。而GPT-4更不用說，好幾項都是0分。

這一項其實考的是， AI 能不能持續學習獲得信息。因為論文發現，現在的 AI 根本就是個健忘癥，你今天教它的東西，明天它就忘得一干二凈。

他們做測試的方法，就是第一天跟AI講一些東西，然后第二天單開一個對話，再讓AI回想。

都不用猜，包想不起來的，大伙用過都知道，新開窗口就會清空記憶，那得分不是0就怪了。。

有的人會反駁，現在的AI早就有永久記憶了。但文章中其實譴責了這一點，現在AI的記憶，根本不是真正的記憶，他們只是在假裝自己有記憶。

作者們把這招叫做 “能力扭曲” ，即利用某些領域的優勢來彌補其他領域的嚴重弱點，創造出一種“AI真有能力”的錯覺。像現在的AI記憶，其實就是在瘋狂卷上下文長度，或者通過知識庫來實現，實際上就是外掛，模型本身是一點記憶都沒有。

除了記憶力，長期記憶檢索ai們也很拉，說白了，就是檢測幻覺，別睜眼說瞎話。

當然，還有一項大伙都很拉的功能，(V) 視覺處理。 GPT-4是0分，而GPT-5進化過后，也只來到4分。

它考的不是簡單的“這圖里有啥”，考的是視覺推理。這對大模型來說，可就難多了。比如說，咱來試一道：

“下面這 4 個 2D 展開圖里，哪一個不能折成左邊那個立方體？”

還真有點難度，但我們人類稍加思索，還是能做出來的。我也去求證了下Gemini，結果確實是無法戰勝。

這也說明，AI的眼睛和腦子，目前配合的不是很好，還沒有人類這種，邊看邊想就解決問題的能力。

當然，這份報告，肯定還是不夠完美的。除了這十個維度，人腦還有聯想等其他難以名狀的能力，人類可太復雜了，不是幾道題就能測明白的。

但它最大的價值，是給當下的 AI 做了一次全面診斷：AI現在還是瘸腿，在一些人類最基本的認知能力上，仍然有嚴重的缺陷。

而且，現在的 AI 廠商會還用一些捷徑，來掩蓋這些弱點。

因此，這篇文章也在給大家敲警鐘：這樣搞出來的 AI，是到不了 AGI 的。

但奧特曼在前一陣的直播里還說了，AGI在路上了，我只能說，走著瞧了。

當然，俺覺得，這套標準本身也有不小的槽點。

人家AGI ，憑啥非要模仿人類??？它很可能是一種完全不同的智能。硬拿人類的 CHC 理論去套 AGI，是否有點刻舟求劍的意味了。

而且，這標準定得也有點高了。講實話，AI 要能達到一個“沒受過教育的小孩”的水平，就已經無敵了。更別提有相當一部分人類，自己都通不過這個測試。。

不過，不管怎么吐槽，有人提出標準就是好事。

它最大的意義，是終于把 AGI 這個話題從玄學的范疇，拉回到了一個可以討論的具體問題上。

就算這個標準不完美，它也會逼著整個行業開始思考，我們到底在追求什么，以及我們到底缺了什么。

這總比大家都在吹牛，說自己快要實現 AGI要強得多。

(責任編輯：時尚)

相關內容

推薦文章

“北京冬奧會帶動三億人參與冰雪運動”主題展覽在京開幕

視頻：“北京冬奧會帶動三億人參與冰雪運動”主題展覽在京開幕來源：中國新聞網中新網北京11月15日電 (記者陳杭呂少威)第十六屆北京奧運城市體育文化節“雙奧”文化推廣系列活動“北京冬奧會帶動三億人參 ...[詳細]
無人能敵！iPhone 17系列國內激活銷量超825萬：Pro Max幾乎獨占一半

11月8日消息，博主數碼閑聊站今天公布了機構統計的iPhone 17系列國內激活銷量數據，目前系列總量超過了825萬臺。作為對比，同月發布的小米17系列已經是目前安卓新旗艦中銷量第一，但也只是剛剛跟過 ...[詳細]
2025王者榮耀KPL年度總決賽今晚開戰主題皮膚6元秒殺

11月8日消息，2025KPL年總決賽·巔峰之戰今晚17:45正式開打，成都AG超玩會對戰重慶狼隊。本屆年總全勝晉級決賽的成都AG超玩會能否保持狀態，達成KPL賽事體系六連冠，延續他們的 ...[詳細]
（第八屆進博會）進博會上的小展商們：以進博為舞臺觸及世界

中新網上海11月8日電 (記者鐘升)“圍巾你收好。這是我的微信，你加一下，之后臟了想要打理隨時可以聯系我?！睅滋鞎r間，參加第八屆中國國際進口博覽會的印度展商伊姆蘭·拉赫的微信就快加滿了。對于這位連續 ...[詳細]
高德揭秘：鷹眼守護預警和車道級安全預警有啥區別

11月15日消息，今年9月，高德地圖與中國安全生產科學研究院聯合發布了“鷹眼守護”預警系統。“鷹眼守護"預警系統會對交通斷流、多車急剎、多車臨停等重大異常 ...[詳細]
華為兆瓦閃充實測：三把槍同時插功率接近1340kW！

11月8日消息，今年早些時候，華為面向純電卡車推出了兆瓦閃充，那么這么久過去了，體驗如何？近日，有網友分享了實測。視頻中可以看到，華為兆瓦閃充一共配有三把槍，其中兩把為充電用，官方數據顯示每把支持12 ...[詳細]
述評：文化遺產，究竟有啥用？

中新網杭州11月7日電題：述評：文化遺產，究竟有啥用？作者嚴格林波日前，“亞太遺產實踐者聯盟(HeritAP)”年會暨“世界遺產貢獻可持續發展目標”優秀案例發布會在杭州舉行。會議當日發布2025 ...[詳細]
全球最長海纜2Africa東段正式開通！全長4.5萬公里：連接三大洲30多國

11月8日消息，以“智纜環非數通未來”為主題的AI+云網融合行業解決方案發布會7日在肯尼亞首都內羅畢舉行。會上舉行了2Africa東段海纜資源點亮儀式，標志著該項目東段正式開通 ...[詳細]
“十五運”女子舉重87公斤以上級李閆強勢奪冠

中新網哈爾濱11月15日電(記者王妮娜)黑龍江省體育局15日發布消息，第十五屆全運會女子舉重項目14日收官。在最后一項87公斤以上級決賽中，黑龍江隊的李閆以抓舉140公斤、挺舉180公斤，總成績32 ...[詳細]
俄外交部：俄方密切關注美國在核領域的活動

中新社莫斯科11月7日電俄羅斯外交部發言人扎哈羅娃7日表示，俄相關部門密切關注美國在核領域的相關活動，包括進攻性戰略武器試驗。針對美國日前試射“民兵3”洲際彈道導彈的問題，扎哈羅娃當天在例行記者會 ...[詳細]

熱點閱讀

隨機內容

友情鏈接

接受PR>=1、BR>=1，流量相當，內容相關類鏈接。

昂達終于發布首款RTX 50顯卡：還是入門級的RTX 5050

鴻蒙智行最美轎車！新款享界S9開啟預訂：預售價31.8萬起

全球史上最年長夫妻合計216歲分享長壽秘訣：每天都會喝酒

最斩殴美精品一二三区_手机免费Av片在线播放_精品在线欧美一区二区_亚洲欧洲自拍拍偷午夜色无码_精品3d动画肉动漫在线无码_日本高清中文字幕二区不卡