發布時間:2025-11-19 23:04:54 來源:企業錄(www.cmjokers.net)-公司信息發布,網上買賣交易門戶 作者:焦點
11月16日消息,破譯據媒體報道,水平谷歌旗下AI Studio平臺正在測試一款未命名的接近解讀AI模型,在破譯難辨認歷史手稿方面取得重要進展。谷歌古籍該模型在核心字符識別上的核心錯誤率僅為0.56%,準確率已接近該領域的錯誤專業研究人員水平。
歷史學家Mark Humphries利用專門構建的率僅基準數據集對模型進行了系統評估。在測試涵蓋的破譯五份18至19世紀高難度手稿中,模型整體字符錯誤率約為1.7%,水平其中大部分錯誤出現在標點符號和大小寫規范等非核心問題上,接近解讀并未影響單詞本身的谷歌古籍正確識別。
若排除這些非關鍵性錯誤,核心模型的錯誤字符錯誤率可進一步降至0.56%,相當于每轉寫200個字符僅出現一處實質性錯誤,率僅其表現已與專注于文獻轉寫的破譯專業工作者相當。
測試手稿涵蓋了多樣化的書寫風格,包括字跡潦草、拼寫非標準和語法不一致等復雜情況,充分驗證了模型的強適應能力。更值得注意的是,該模型不僅能完成文字轉寫,還展現出一定的上下文推理能力。
例如,在處理一份18世紀商人日記時,模型遇到一條未標注單位的購糖記錄“145”。它通過反向核對賬目總額,結合當時英國的貨幣與重量單位體系,成功推斷出該數字代表“14磅5盎司”。
Humphries也指出當前評估仍存在一定局限。由于該模型僅以A/B測試形式零星出現,難以進行大規模系統性驗證,目前僅完成基準數據集中約10%樣本的評估工作。
相關文章
隨便看看