看板 PC_Shopping作者 wei115 (社畜)標題 [情報] Intel 與 AMD 聯手推進 APX 指令集!x86 時間 Thu May 7 04:37:30 2026
完整標題:
Intel 與 AMD 聯手推進 APX 指令集!x86 架構迎來史上最大變革,效能提升不增功耗
原始連結:
https://www.koc.com.tw/archives/641394
內文:
Intel 與 AMD 這對數十年來在 CPU 市場上正面廝殺的競爭對手,正透過 x86 生態系統
顧問小組(EAG)持續深化合作。繼兩天前聯合發布 ACE(AI Compute Extensions)AI
矩陣加速指令集白皮書之後,EAG 再度揭露了 APX(Advanced Performance Extensions
)的最新細節。這項被稱為「x86 自 64 位元以來最大演進」的指令集擴充,將通用暫存
器數量直接翻倍,並在不增加晶片面積與功耗的前提下顯著提升效能。
https://i.imgur.com/dDlr9lf.jpeg
APX 是什麼?為什麼是 x86 的重大演進?
APX(Advanced Performance Extensions)是 Intel 與 AMD 共同制定的新一代 x86 指
令集擴充標準。它的核心精神非常直接:讓 x86 指令集能夠存取更多的暫存器(
Registers)。
暫存器是 CPU 內部容量極小但存取速度極快的儲存單元,負責存放正在運算的資料、指
令與記憶體位址。當指令集能存取更多暫存器時,處理器就能在更短的時間內完成更多工
作,因為大量資料可以直接在 CPU 內部處理,不需要頻繁到速度較慢的記憶體中讀寫。
https://i.imgur.com/6wsaewW.jpeg
這項規格早在 2024 年 10 月就由 Intel 首次提出,如今在 EAG 的框架下由 Intel 與
AMD 共同推動,並釋出了更多技術細節。
APX 六大核心改進
APX 並非單一功能的補強,而是對 x86 指令集架構的一次系統性升級。以下是主要改進
項目:
通用暫存器(GPR)翻倍:由現有的 16 個一舉擴充至 32 個。這讓編譯器可以將更多資
料與變數保留在暫存器中,而非寫入速度較慢的記憶體,對程式碼編譯與執行效率有直接
幫助。
https://i.imgur.com/2N81Nkk.jpeg
記憶體操作效率提升:經過 SPEC CPU 2017 整數基準測試的模擬驗證,APX 編譯後的程
式碼可減少 10% 的讀取操作(loads)與 20% 的寫入操作(stores),代表更快且功耗
更低的程式執行。
非破壞性指令形式:傳統 x86 指令大多是「破壞性」的,運算結果會直接蓋掉其中一個
來源運算元。APX 新增了非破壞性版本,減少暫存器複製需求,讓程式碼更簡潔且執行更
快。
條件執行擴充:過去 x86 的條件執行僅限於 CMOV 與 SET 等少數指令。APX 新增了條件
式讀取(Conditional Load)、條件式寫入(Conditional Store)、條件式比較/測試(
Conditional Compare/Test)以及旗標抑制功能,大幅擴展 if-conversion 的應用範圍
,減少分支預測失誤。
堆疊操作強化:新增 PUSH2 與 POP2 指令,可以在一次記憶體操作中同時推送或彈出兩
個暫存器,加速函式呼叫的進入與返回流程。
程式碼密度不變:儘管新增了大量指令與功能,APX 並不顯著增加程式碼體積,並且完全
向下相容——既有的 x86 軟體可以在支援 APX 的處理器上無縫執行。
與 ACE 指令集同屬 EAG 框架下的戰略布局
APX 的公布時間點極具戰略意義。就在兩天前的 4 月 30 日,Intel 與 AMD 才剛聯合發
布了 ACE(AI Compute Extensions)技術白皮書,將其定位為 x86 架構的「標準矩陣加
速架構」,支援 INT8、FP8、BF16 等主流 AI 資料格式,並相容於 AVX10 指令集。
ACE 聚焦 AI 矩陣運算加速,APX 則專注於通用運算效能的全面提升:兩者相輔相成,共
同構成 EAG 對 x86 架構未來發展的完整藍圖。EAG 自去年成立以來,陸續公布了 FRED
(彈性返回與事件遞送)、AVX10(向量指令集統一)、ChkTag(記憶體安全標籤檢查)
以及 ACE 與 APX 等多項核心特性。
https://i.imgur.com/s3drPcm.jpeg
不用更大面積、不必更高功耗,效能自然提升
APX 最令人驚豔的特色之一,是這些效能提升幾乎不需要額外的矽晶圓面積或功耗作為代
價。Wccftech 的報導強調,APX 可以在不顯著增加核心面積與功耗的情況下,實現更高
的通用運算效能:這對於晶片設計與散熱解決方案來說,意義極為重大。
對開發者與消費者的意義
對於軟體開發者而言,APX 最大的價值在於編譯器的最佳化空間大幅增加。當編譯器能夠
將更多變數保留在暫存器而非記憶體中,程式就能跑得更快、更省電。尤其對於 LLVM
與 GCC 等主流編譯器來說,APX 的 32 個通用暫存器將成為極具吸引力的編譯目標。
對於一般消費者而言,APX 帶來的效益將間接體現在日常使用中:從網頁瀏覽、文書處理
到遊戲與內容創作,支援 APX 的處理器將能以更低的功耗完成相同的工作,或在相同功
耗下提供更流暢的效能表現。
結語
Intel 與 AMD 從數十年的競爭對手,到如今在 EAG 框架下聯手推進 x86 架構的演進:
這不僅是為了對抗 ARM 與 RISC-V 的新興威脅,更是對 x86 這套走過近半世紀的指令集
架構注入全新生命力。APX 的通用暫存器翻倍、ACE 的 AI 矩陣加速標準化,再加上
FRED、AVX10、ChkTag 等一系列基礎架構革新,x86 的故事顯然還沒有寫完。
心得:
出大事了
x86要大改了,上次大改還是x86-64
x86-64的重點在於擴充暫存器長度+新增新暫存器
APX的重點在於新增新暫存器+現代風格的資料流指令
目前用的資料流邏輯還是1970年代流行的那套
從古老到現代,過去50年的歷史刻在x86的指令集裡面
並且x86已經做好再戰50年的準備了
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.109.127 (臺灣)
※ 作者: wei115 2026-05-07 04:37:30
※ 文章代碼(AID): #1f-wQFBa (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1778099855.A.2E4.html
→ hn9480412: 但還有一個豬隊友微軟1F 59.125.187.40 台灣 05/07 04:46
推 WusoAiwen: 難怪兩家股價最近這麼飆,果然商場上沒有永久的敵人2F 101.8.48.155 台灣 05/07 06:44
→ olozil: 阿不就越來越像RISC4F 220.132.89.193 台灣 05/07 08:10
推 NoneWolf: 太好了 我買AMD5F 42.70.198.105 台灣 05/07 08:29
推 takanasiyaya: x86抄risc也已經很久了就是。6F 49.218.208.119 台灣 05/07 08:40
推 smallreader: 新增16個暫存器不增加空間 是重新利用AVX的暫存器嗎(不懂就問)7F 223.139.162.224 台灣 05/07 08:56
→ olozil: 這跟AVX沒什麼關係就是了9F 111.243.2.147 台灣 05/07 09:04
推 smallreader: 看來我被"不增加面積"誤導了,他們有在實體上增設這16個暫存器,說的也是"不顯著增加"面積而已
中文都亂寫,不意外10F 223.139.162.224 台灣 05/07 09:28
推 oopFoo: 現代cpu都有幾百個"虛擬暫存器",只是開14F 36.224.222.169 台灣 05/07 09:31
推 smallreader: 第一段最後一句對應原文意思是「在不顯著增加...之下,能提升效能」15F 223.139.162.224 台灣 05/07 09:32
→ oopFoo: 放出來而已。基本上就是指令集的改進。
NovaLake會有,Zen6應該要有。FRED已經在17F 36.224.222.169 台灣 05/07 09:32
→ smallreader: 被翻成在不增加...下能顯著提升 整個意思就大轉彎了19F 223.139.162.224 台灣 05/07 09:33
推 olozil: 對APX不用太期待,基本上就是已經沒什麼手段了還不想大改,影響CPU的主要有計算、控制、IO、同步,增加暫存器就是對計算與控的部分增強,但效果有限,IO來說你加大了L1反而性能會下降,你把L1從32K->48K
訪問就會從4個cycle變5個cycle,
然後掉性能,X86最大的問題一直是記憶體的一致性,這是RISC不會有的問題26F 111.243.2.147 台灣 05/07 09:49
推 smallreader: 就算是虛擬的也要有實體位置支援吧34F 223.139.162.224 台灣 05/07 09:57
推 olozil: 直接舉例來說,上一次加暫存器是X86-64,然後這次幅度還會比上次小一點35F 111.243.2.147 台灣 05/07 09:57
→ smallreader: 不然能並行的線頭數量會減少(?)37F 223.139.162.224 台灣 05/07 09:59
推 oopFoo: 記憶體的一致性,TSO,有好有壞。現代cpu的性能,根本發揮不出來。記憶體頻寬又小所謂的虛擬其實就是實際暫存器,我講的
有點反過來。實際有幾百個暫存器,cpu會虛擬成好幾組,同時使用。現在只是開放
給程式直接使用,可縮短程式碼,更有效率38F 36.224.222.169 台灣 05/07 10:01
推 smallreader: 嗯 反過來 實體=幾百個 虛擬=一個執行緒所看到的44F 223.139.162.224 台灣 05/07 10:06
→ oopFoo: 的應用。46F 36.224.222.169 台灣 05/07 10:06
推 CyBw: 還沒要升x86-128嗎,都幾年了47F 114.35.167.130 台灣 05/07 10:09
推 oopFoo: 暫存器增加多吧,x64加8個,apx加16個。cpu內部看到的暫存器跟程式碼不一樣。例如store [rax]然後接著load rax,cpu會用兩暫存器,因為它們互不干擾,可以平行處理你要一個cycle同時處理8個指令,那這八個指令不能互相依賴。太少暫存器就容易製造依賴。48F 36.224.222.169 台灣 05/07 10:14
推 nrsair: 新指令集擴充55F 49.217.202.62 台灣 05/07 10:20
推 s25g5d4: 6202 年還在談 CISC/RISC 就落伍了,是沒看到 ARM 近幾年瘋狂加各種 SIMD 指令集,ARM 跟 x86 這幾年差異主要在 variable instruction length 而已。ARM 現在也是 decoder 拆 mOP 下去跑,跟 x86 一樣,只是 fixed length decoder 比較好做而已56F 211.22.64.132 台灣 05/07 10:31
推 kuninaka: 股價飆跟這沒關係啊
那是AI需求62F 1.174.97.117 台灣 05/07 10:46
→ h311013: 蘋果推自研真的是很有遠見64F 61.227.103.243 台灣 05/07 11:31
推 wahaha99: 就算是實體暫存器 佔用空間也還好
君不見現在佔CPU最多的早就不是邏輯單元65F 37.19.205.168 日本 05/07 11:35
推 takanasiyaya: Apple從來就喜歡自研,只有core2時代的Intel真的太厲害才低頭用Intel,不然全部都嘛用自己的。不過M系列記憶體架構有創新是真的有意義67F 49.218.208.119 台灣 05/07 12:43
→ labbat: 存儲記憶體都是公共資源,通用暫存器都是特定執行緒限定資源,編譯器活用可以減輕匯流排負擔71F 39.15.56.30 台灣 05/07 12:47
推 Bencrie: 我想得到的好處就 x86-64 ABI 呼叫函數的時候 args 塞 regs 的上限變高74F 60.251.10.52 台灣 05/07 12:51
推 guanting886: 看起來雖然是APX很厲害 但感覺上是兩邊找機會把過去的技術債一起清掉 之前有多少0day搞到資料中心很緊張76F 42.78.166.15 台灣 05/07 13:16
推 ltytw: 清掉技術債怎麼不是找時間重新發明X86?
例如什麼X86 Gen2 然後順便清掉技術債或屎山代碼79F 36.234.230.69 台灣 05/07 13:20
推 tsairay: 清掉技術債不是叫你不要向下相容82F 202.39.11.150 台灣 05/07 13:22
噓 bhmagic: 血紅姊哭哭 沒人理VIA83F 99.118.209.229 美國 05/07 13:29
→ olozil: X86實際可用6個暫存器, _sp與_bp有限制
所以是 86(6) -> 86-64(16) -> APX(32)
這次增加幅度沒有上次多84F 111.243.2.147 台灣 05/07 13:37
→ commandoEX: 升128沒啥好處吧,要說的話AVX就能處理128/256/512 bit的數據了87F 59.125.204.130 台灣 05/07 13:47
推 takanasiyaya: 卡難,x86的小白使用者們不允許,i皇當初雄心壯志要打掉x86重練itinum的結果就是被AMD x86-64闖空門進去伺服器89F 49.218.208.119 台灣 05/07 13:48
→ commandoEX: VIA授權不是過期了嗎?93F 59.125.204.130 台灣 05/07 13:49
→ ma721: 把ai放進去94F 101.10.87.189 台灣 05/07 14:07
推 leon1757tw: 要清技術債的是x86s吧 不過被放棄了95F 123.110.162.31 台灣 05/07 14:17
推 s25g5d4: 重新發明 x86?IA64:96F 211.22.64.132 台灣 05/07 14:52
→ gainsborough: 只要I、A、高通、發哥還是賣SOC,那注定就有面積大小的成本獲利定價衝突,感覺還是打不贏大面積狂堆晶體管數量的蘋果SOC(面向普通消費者)97F 114.41.201.174 台灣 05/07 16:10
→ cor1os: 加新指令集才是淘汰老PC最快的方法 -.-101F 122.147.131.2 台灣 05/07 16:30
推 oopFoo: _bp沒有限制,_sp有限制所以_sp+_bp來存取stack frame。但esp可以offset了,ebp就可空出來。如果你的環境許可,esp也可挪來用。但就算6>16>32。16還是比10多啊。102F 58.114.66.74 台灣 05/07 19:58
推 soem: 可惜X86S各方沒共識,能移除一些舊時代的指令集的話也算是有進步106F 1.34.10.55 台灣 05/07 20:04
推 oopFoo: 移除沒有意義,因為空間佔很少。現代cpu的瓶頸在branch,在cache,在memory,這都不是指令集的問題。x86雖然丑,但相容性100%108F 58.114.66.74 台灣 05/07 20:08
→ friedpig: 相容性100%除了少數老舊工業軟體沒再更新以外 真的那麼重要嗎?
真的必須的舊軟體沒剩多少了八111F 114.32.196.169 台灣 05/07 21:48
推 smallreader: 編譯器框架很在意相容性吧
有一些萬年不變的程式碼還活在底層114F 223.139.162.224 台灣 05/07 22:21
推 oopFoo: 編譯器,直譯器不需要重新再來。軟體生態重新再來,就算相似也是超大工程。遠望
riscv。116F 58.114.66.74 台灣 05/08 04:05
推 athraugh: 請教各位高人. CPU 對RAM 的頻寬要增加,到VRAM (GPU的)那樣大頻寬, 是需要增加指令集 還是 對連接的實體線數量? 目前都不做的困難點是什麼.119F 39.12.109.188 台灣 05/08 08:48
推 oopFoo: 頻寬增加要實體線數量增加+高速ram。困難點在於"貴"。之前高階pc的需求主要來自於遊戲,遊戲吃"大快取",對頻寬要求反而不高。現在ai興起,狂吃頻寬。所以之後的pc也會在這方面加強。123F 36.224.222.169 台灣 05/08 09:39
推 athraugh: 謝謝回復128F 39.12.109.188 台灣 05/08 10:58
推 Rollnmeow: X86s始終沒共識只有Intel提倡而已
這個APX才是共識下的產物129F 49.214.1.195 台灣 05/08 12:08
推 roseritter: VRAM一般都是高速,比起MB上的RAM131F 223.139.62.6 台灣 05/08 12:51
推 atelier: x86陣營包袱多權力也分散 改架構難度太高蘋果軟硬體一把抓 單純多了 又有信仰
換架構駕輕就熟Motorola 68000->PowerPCx86->Apple Silicon
以前PowerPC轉x86 軟體支援說斷就斷
蘋果的使用者還不是就摸摸鼻子買新的132F 101.10.218.47 台灣 05/08 13:24
→ xxtomnyxx: 現在似乎很多call都把資料陣列用ecx/rcx指向,PUSH和POP功能增加有用嗎?是說,以前自學組合語言時一直沒弄清楚,stack資料調用的速度會比offset快嗎?138F 120.126.106.155 台灣 05/08 13:46
推 tn601374: 哦豁143F 36.224.223.120 台灣 05/08 16:15
--