中文字幕av影院,欧美一级欧美三级在线观看,av三级写真有码在线看,日本精品aaa,992tv成人国产福利在线观看,久久久久久久久浪潮精品,91精品久久久久久久久不口人,激情欧美在线
      1. 丑態百出網

        今天(10日),我們迎來第41個教師節教育是強國建設、民族復

        AI解數學題只靠最后一個token

        henry 發自 凹非寺量子位 | 公眾號 QbitAI

        大語言模型在解心算題時,只依賴最后一個token?

        最近,來自加州大學圣克魯茲分校、喬治·梅森大學和Datadog的研究人員發現:在心算任務中,幾乎所有實際的數學計算都集中在序列的最后一個token上完成,而不是分散在所有token中。

        這意味著,相較于在Transformer和多層感知機(MLP)中常見的全局信息訪問——即每個token在預測時都能查詢并利用整個上文信息——在諸如心算這樣的特定任務中,全局訪問其實并不是必需的。

        這是怎么一回事?

        心算只要最后一個token?!

        總的來說,研究人員采用了上下文感知平均消融(Context-Aware Mean Ablation, CAMA)基于注意力的窺視(attention-based peeking)技術對Llama-3-8B等Transformer架構的模型進行了一系列的消融實驗。

        這些實驗通過系統性地移除或改變模型的一部分,探究能讓模型依然表現良好的“最少計算量”

        在這一過程中,研究人員發現模型內部會形成一個稀疏子圖(sparse subgraph)——他們把它稱為“人人為我”(All-for-One, AF1)。

        這個子圖通過最少的計算層和最有限的信息傳遞,讓模型高效完成運算。

        在“人人為我”中,輸入Transformer前幾層(L_wait)的token并沒有做跟“自己數值”相關的計算,而是“等待”,并主要承擔一些通用的準備工作(比如識別token、結構編碼、預測下一步所需的通用表示)。

        然后,在中間的兩層(L_transfer)里,它們就將信息傳遞給最后一個token。

        之后,最后一個token獨自完成計算并給出答案。

        這一過程表明,模型內部將任務通用型計算(如 token 識別、數值與結構編碼)與輸入特定型計算(如實際算術運算)是分開的。

        (注:這篇研究聚焦于心算任務,即涉及兩個或三個操作數的算術問題(例如42+20?15),這些問題可以通過單個token的輸出解決,而無需模型進行顯式的鏈式思維推理。)

        接下來,我們具體來看。

        眾所周知,大語言模型在許多計算任務上表現出色,而其中一個重要原因是其采用了Transformer架構。

        與RNN不同,Transformer允許任意token通過自注意力機制立即訪問所有先前的token以傳遞信息,并使每個token能夠通過多層感知機(MLP)并行執行各自的獨立計算。

        但即便如此,模型內部的信息流和計算過程仍然是不透明的。

        因此,為了揭開大語言模型的“黑箱”,研究人員采用了以下三個步驟來進行探索。

        首先,在模型的初始層抑制token針對特定輸入的計算

        研究人員發現,在傳統Transformer的每一層中,token都能訪問所有之前的token,但對于簡單的心算任務,每個token可能未必從一開始就要獲得全局信息。

        由此,研究人員引入了等待期(L_wait):讓在前面的L_wait層中的token獨立計算,只執行任務通用操作(如理解數字、識別算術結構),而不訪問其他token。

        為了實現這一點,他們使用了上下文感知平均消融(CAMA)

        CAMA的作用是屏蔽掉token之間的輸入特定信息,同時保留每個token的普遍計算能力,使模型能夠在不依賴具體輸入的情況下完成基礎準備工作。

        接下來,在少數幾層中限制跨token位置的信息傳遞路徑。只讓最后token在L_transfer層中訪問所有token,其余層只關注自己。

        最后,在剩余的層中強制所有計算都在最后一個token上發生

        由于CAMA只能從第一層開始,因此,研究人員引入了一種可以在任意層控制信息訪問的方法——基于注意力的窺視(ABP)

        它通過修改注意力掩碼(attention mask),精確指定每個“查詢”(query)token可以關注哪些“鍵”(key)。

        在這篇論文中,研究人員主要使用了以下兩種模式:

        完全窺探 (Full-peeking):token可以關注所有在它之前的token,這是標準的因果注意力。在AF1的傳遞階段,最后一個token使用此模式來收集信息。自我窺探 (Self-peeking):token只能關注它自己,在傳遞和計算階段,所有非末尾的token都使用此模式;在計算階段,最后一個token也切換到此模式。

        實驗驗證

        在完成方法和操作流程的構建后,研究者進行了一系列實驗來發現、驗證和分析AF1子圖。這里主要涉及到Llama-3-8B和Llama-3.1-8B,以及在Pythia和GPT-J模型上的驗證。

        首先,通過三階段消融與窺視實驗,研究人員發現Llama-3-8B在A+B+C任務中只需前14層做任務通用計算(CAMA 層),然后通過2層信息傳輸讓最后的token獲取全局信息,剩余層僅進行最后token的自計算。

        這個幾乎保留全部性能的子圖被命名為AF1_llama

        接下來,研究人員又進一步驗證了AF1_llama在Llama-3-8B和Llama-3.1-8B上的表現。

        實驗表明,AF1_llama在八個任務中總體表現出高忠實度。

        更進一步,實驗進一步驗證了第15和16層的信息傳輸在Llama-3-8B中的重要性。

        研究表明,僅少數注意力頭對算術計算關鍵,即使移除近60個頭部,模型仍能保持約95%的準確率,表明大部分注意力頭冗余,而關鍵頭集中在少數層。

        此外,為了探究AF1_llama是否可以在Llama-3-8B上泛化到表示A+B和A?B運算的其他算術形式,研究進一步將口頭描述運算以及將運算嵌入到應用題或Python代碼中。

        實驗表明,AF1_llama在不包含額外語義上下文的直接算術任務中仍保持了相當高的準確率。

        然而,它在需要語義理解的任務上,如應用題和Python代碼,完全失敗了,這表明它需要額外的組件來處理其他能力,比如理解自然語言或Python程序輸入。

        最后,研究人員在Pythia和GPT-J中也發現了類似AF1的子圖,但與Llama不同,這些模型的等待期更短(L_wait ≈ 9–11)、信息傳輸層更長,且性能邊界不如Llama清晰。

        盡管忠實度普遍低于Llama,但對二元運算任務的子圖仍能恢復超過一半的原始模型準確率。

        總體而言,這項工作為大語言模型中的算術推理和跨token計算的機制理解做出了貢獻。此外,它通過CAMA和ABP提供了方法論上的創新,可服務于算術任務之外的更廣泛應用。

        [1]https://x.com/rohanpaul_ai/status/1966788202238448101

        [2]https://www.arxiv.org/pdf/2509.09650

        訪客,請您發表評論:

        網站分類
        熱門文章
        友情鏈接
        主站蜘蛛池模板: 国产在线干| 国产一区免费在线观看| 精品国产鲁一鲁一区二区作者 | 亚洲国产精品激情综合图片| 国产精品二区一区| 亚洲视频h| 久久一级精品视频| 亚洲精品日本久久一区二区三区| 99国产精品永久免费视频 | 中文字幕一区2区3区| 精品国产鲁一鲁一区二区三区| 亚洲精品国产精品国自产网站按摩| 91麻豆国产自产在线观看hd | 国产一区=区| 高清人人天天夜夜曰狠狠狠狠| 李采潭无删减版大尺度| 久久er精品视频| 精品videossexfreeohdbbw| 一区二区三区欧美精品| 亚洲精品日本无v一区| 午夜影院h| 国产毛片精品一区二区| 日韩精品一区在线视频| 久久精品一二三| 国产欧美日韩va另类在线播放| 久久精品手机视频| 国产精品国产三级国产播12软件| 免费午夜在线视频| 精品无人国产偷自产在线 | 国产一区二区极品| 国产一区中文字幕在线观看| 国产精品欧美久久久久一区二区 | 精品国产一区二区三区在线| 99精品黄色| 性色av色香蕉一区二区| 欧美日韩三区| 午夜欧美影院| 午夜电影一区二区三区| 国产床戏无遮挡免费观看网站| 欧美精品日韩一区| 国产一区二区三区的电影| 亚洲二区在线播放视频| 精品国产一区二区三| 国产精品区一区二区三| 国模一区二区三区白浆| 亚洲欧美一区二| 久久精品麻豆| 国产精品影音先锋| 国产精品久久久久四虎| 国产精品一区二| 亚洲国产99| 国产69精品久久久久999小说| 2023国产精品自产拍在线观看| 性色av色香蕉一区二区三区| 国产一区激情| 色综合久久精品| 欧美精品五区| 亚洲天堂国产精品| 国产午夜精品一区二区三区四区 | 日韩有码一区二区三区| 精品久久综合1区2区3区激情| 92久久精品| 一本色道久久综合亚洲精品图片| 日韩精品一区二区三区中文字幕| 亚洲乱视频| 国产精品综合在线观看| 国产伦理精品一区二区三区观看体验 | 97香蕉久久国产超碰青草软件| 国产乱xxxxx97国语对白| 91福利视频免费观看| 综合久久激情| 99国产精品| 日韩精品乱码久久久久久| 国产一区二区在线免费| 国产精品免费自拍| 麻豆精品国产入口| 26uuu亚洲电影在线观看| 亚洲午夜精品一区二区三区电影院| 欧美一区二区伦理片| 亚洲午夜精品一区二区三区| 国产日韩欧美在线影视| 中出乱码av亚洲精品久久天堂| 国产精品久久免费视频| 欧美亚洲视频一区| 午夜精品一区二区三区aa毛片| 强制中出し~大桥未久在线播放| 午夜电影一区| 欧美国产精品久久| 免费精品一区二区三区视频日产| 亚洲精品国产一区| 久久第一区| 欧美日韩国产午夜| 国产欧美亚洲精品第一区软件| 国产精品丝袜综合区另类 | 一区二区在线不卡| 久久一级精品视频| 国产清纯白嫩初高生视频在线观看| 欧美乱妇高清无乱码免费 | 国产91精品高清一区二区三区| 国产日产欧美一区| 色综合久久久| 黄色香港三级三级三级| 日韩精品一区二区中文字幕| 波多野结衣巨乳女教师| 国产乱码精品一区二区三区中文| 国产伦高清一区二区三区| 久久久精品久久日韩一区综合| 四虎国产精品永久在线| 爽妇色啪网| 99精品小视频| 狠狠色噜噜狠狠狠合久| 国产精品日韩精品欧美精品| 欧美精品粉嫩高潮一区二区 | 日韩精品一区中文字幕| 国产高清一区在线观看| 中文字幕一区二区在线播放| 一区二区欧美视频| 狠狠插狠狠插| 91久久国产露脸精品国产| 精品a在线| 国产一区二区三区伦理| 色婷婷精品久久二区二区我来| 一区二区国产精品| 国产精品一区二区久久乐夜夜嗨 | 久久精品国产亚洲一区二区| 久久久久国产精品www| 国产精品一区二区免费| 国产天堂第一区| 精品国产一区二区在线| 午夜看大片| 久久久久久久久久国产精品| 欧美日韩综合一区二区| 国产精品久久久久四虎| 日韩欧美激情| 狠狠干一区| 国产精品国产三级国产专区55| 久久国产欧美一区二区免费| 国产欧美一区二区三区视频| 日本一区二区三区免费在线| 国产二区精品视频| 激情久久精品| 午夜大片网| 激情久久久| 好吊色欧美一区二区三区视频 | 91精品久久天干天天天按摩| 日本午夜无人区毛片私人影院 | 综合色婷婷一区二区亚洲欧美国产| 日韩精品久久久久久中文字幕8| 首页亚洲欧美制服丝腿 | 日韩精品免费一区二区在线观看| 猛男大粗猛爽h男人味| 亚洲国产精品国自产拍av | 丰满少妇高潮惨叫久久久一| 美女销魂免费一区二区| 中文在线一区二区三区| 91精品丝袜国产高跟在线| 国产区二区| 神马久久av| 狠狠躁天天躁又黄又爽| 欧美激情精品久久久久久免费| 狠狠色噜噜狠狠狠狠69| 毛片大全免费看| 最新日韩一区| 一区二区久久精品66国产精品| 窝窝午夜精品一区二区| 国产精品刺激对白麻豆99| 久久一区欧美| 99精品欧美一区二区三区美图| 国产一区二区三区黄| 亚洲福利视频一区| 国产精品久久久久久亚洲美女高潮| 首页亚洲欧美制服丝腿| 亚洲日韩欧美综合| 国产午夜精品一区二区理论影院 | 激情久久久| 91精品中综合久久久婷婷| 93久久精品日日躁夜夜躁欧美| 日韩精品一区二区三区在线| 亚洲精品一区在线| 国产精品一区二区三| 国产区图片区一区二区三区| 国产精品九九九九九九| 久久久人成影片免费观看| 精品国产仑片一区二区三区| 少妇高清精品毛片在线视频| 国产一级不卡毛片| 久草精品一区| 欧美日韩久久一区| 免费精品一区二区三区第35| 99精品欧美一区二区| 日本大码bbw肉感高潮| 91偷自产一区二区三区精品| 99久久国产综合精品女不卡| 日韩av在线播| 肥大bbwbbwbbw高潮| 国内久久久久久| 性国产日韩欧美一区二区在线| 国产全肉乱妇杂乱视频在线观看| 99国产精品一区二区| 亚洲精品丝袜| 国产一区二区精华| 日韩精品中文字幕久久臀| 在线精品国产一区二区三区 | 999国产精品999久久久久久| 免费观看黄色毛片| 夜夜精品视频一区二区| 欧美一级片一区| 国产资源一区二区| 国产69精品久久久久9999不卡免费| 午夜天堂电影| 综合在线一区| av狠狠干| 亚洲第一区国产精品| 日韩美一区二区三区| 国产婷婷色一区二区三区在线| 亚洲欧美日本一区二区三区| 超碰97国产精品人人cao| 精品午夜电影| 亚洲精品久久久久一区二区| 欧美亚洲精品一区二区三区| 欧美在线播放一区| av午夜在线观看| 一级午夜电影| 国产日韩一区二区在线| 国产午夜亚洲精品| 中文字幕一级二级三级 | 色综合久久网| 狠狠色噜噜狠狠狠狠| 日本一区二区三区电影免费观看| 国产精品9区| 一区二区中文字幕在线| 日韩av在线网址| 欧美一区二区三区黄| 国产精品欧美久久| 91精品视频在线免费观看| 99久久婷婷国产精品综合| 黄色av免费| 激情久久综合网| 久久狠狠高潮亚洲精品| 亚洲精品日韩在线| 中出乱码av亚洲精品久久天堂| av午夜剧场| 欧美一区二区三区免费观看视频| 国产91在| 午夜影院黄色片| 91夜夜夜|