[情報] Intel 與 AMD 聯手推進 APX 指令集！x86 - PC_Shopping板

看板 PC_Shopping
作者 wei115 (社畜)
標題 [情報] Intel 與 AMD 聯手推進 APX 指令集！x86
時間 Thu May 7 04:37:30 2026

完整標題：
Intel 與 AMD 聯手推進 APX 指令集！x86 架構迎來史上最大變革，效能提升不增功耗

原始連結：
https://www.koc.com.tw/archives/641394

Intel 與 AMD 聯手推進 APX 指令集！x86 架構迎來史上最大變革，效能提升不增功耗 - 電腦王阿達 APX（Advanced Performance Extensions）是 Intel 與 AMD 共同制定的新一代 x86 指令集擴充標準。它的核心精神非常直接：讓 x86 指令集能夠存取更多的暫存器（Registers）。 ...

內文：

Intel 與 AMD 這對數十年來在 CPU 市場上正面廝殺的競爭對手，正透過 x86 生態系統
顧問小組（EAG）持續深化合作。繼兩天前聯合發布 ACE（AI Compute Extensions）AI
矩陣加速指令集白皮書之後，EAG 再度揭露了 APX（Advanced Performance Extensions
）的最新細節。這項被稱為「x86 自 64 位元以來最大演進」的指令集擴充，將通用暫存
器數量直接翻倍，並在不增加晶片面積與功耗的前提下顯著提升效能。

https://i.imgur.com/dDlr9lf.jpeg

APX 是什麼？為什麼是 x86 的重大演進？

APX（Advanced Performance Extensions）是 Intel 與 AMD 共同制定的新一代 x86 指
令集擴充標準。它的核心精神非常直接：讓 x86 指令集能夠存取更多的暫存器（
Registers）。

暫存器是 CPU 內部容量極小但存取速度極快的儲存單元，負責存放正在運算的資料、指
令與記憶體位址。當指令集能存取更多暫存器時，處理器就能在更短的時間內完成更多工
作，因為大量資料可以直接在 CPU 內部處理，不需要頻繁到速度較慢的記憶體中讀寫。
https://i.imgur.com/6wsaewW.jpeg

這項規格早在 2024 年 10 月就由 Intel 首次提出，如今在 EAG 的框架下由 Intel 與
AMD 共同推動，並釋出了更多技術細節。

APX 六大核心改進
APX 並非單一功能的補強，而是對 x86 指令集架構的一次系統性升級。以下是主要改進
項目：

通用暫存器（GPR）翻倍：由現有的 16 個一舉擴充至 32 個。這讓編譯器可以將更多資
料與變數保留在暫存器中，而非寫入速度較慢的記憶體，對程式碼編譯與執行效率有直接
幫助。

https://i.imgur.com/2N81Nkk.jpeg

記憶體操作效率提升：經過 SPEC CPU 2017 整數基準測試的模擬驗證，APX 編譯後的程
式碼可減少 10% 的讀取操作（loads）與 20% 的寫入操作（stores），代表更快且功耗
更低的程式執行。

非破壞性指令形式：傳統 x86 指令大多是「破壞性」的，運算結果會直接蓋掉其中一個
來源運算元。APX 新增了非破壞性版本，減少暫存器複製需求，讓程式碼更簡潔且執行更
快。

條件執行擴充：過去 x86 的條件執行僅限於 CMOV 與 SET 等少數指令。APX 新增了條件
式讀取（Conditional Load）、條件式寫入（Conditional Store）、條件式比較/測試（
Conditional Compare/Test）以及旗標抑制功能，大幅擴展 if-conversion 的應用範圍
，減少分支預測失誤。

堆疊操作強化：新增 PUSH2 與 POP2 指令，可以在一次記憶體操作中同時推送或彈出兩
個暫存器，加速函式呼叫的進入與返回流程。

程式碼密度不變：儘管新增了大量指令與功能，APX 並不顯著增加程式碼體積，並且完全
向下相容——既有的 x86 軟體可以在支援 APX 的處理器上無縫執行。

與 ACE 指令集同屬 EAG 框架下的戰略布局

APX 的公布時間點極具戰略意義。就在兩天前的 4 月 30 日，Intel 與 AMD 才剛聯合發
布了 ACE（AI Compute Extensions）技術白皮書，將其定位為 x86 架構的「標準矩陣加
速架構」，支援 INT8、FP8、BF16 等主流 AI 資料格式，並相容於 AVX10 指令集。

ACE 聚焦 AI 矩陣運算加速，APX 則專注於通用運算效能的全面提升：兩者相輔相成，共
同構成 EAG 對 x86 架構未來發展的完整藍圖。EAG 自去年成立以來，陸續公布了 FRED
（彈性返回與事件遞送）、AVX10（向量指令集統一）、ChkTag（記憶體安全標籤檢查）
以及 ACE 與 APX 等多項核心特性。

https://i.imgur.com/s3drPcm.jpeg

不用更大面積、不必更高功耗，效能自然提升

APX 最令人驚豔的特色之一，是這些效能提升幾乎不需要額外的矽晶圓面積或功耗作為代
價。Wccftech 的報導強調，APX 可以在不顯著增加核心面積與功耗的情況下，實現更高
的通用運算效能：這對於晶片設計與散熱解決方案來說，意義極為重大。

對開發者與消費者的意義
對於軟體開發者而言，APX 最大的價值在於編譯器的最佳化空間大幅增加。當編譯器能夠
將更多變數保留在暫存器而非記憶體中，程式就能跑得更快、更省電。尤其對於 LLVM
與 GCC 等主流編譯器來說，APX 的 32 個通用暫存器將成為極具吸引力的編譯目標。

對於一般消費者而言，APX 帶來的效益將間接體現在日常使用中：從網頁瀏覽、文書處理
到遊戲與內容創作，支援 APX 的處理器將能以更低的功耗完成相同的工作，或在相同功
耗下提供更流暢的效能表現。

結語

Intel 與 AMD 從數十年的競爭對手，到如今在 EAG 框架下聯手推進 x86 架構的演進：
這不僅是為了對抗 ARM 與 RISC-V 的新興威脅，更是對 x86 這套走過近半世紀的指令集
架構注入全新生命力。APX 的通用暫存器翻倍、ACE 的 AI 矩陣加速標準化，再加上

FRED、AVX10、ChkTag 等一系列基礎架構革新，x86 的故事顯然還沒有寫完。

心得:
出大事了

x86要大改了，上次大改還是x86-64

x86-64的重點在於擴充暫存器長度+新增新暫存器

APX的重點在於新增新暫存器+現代風格的資料流指令

目前用的資料流邏輯還是1970年代流行的那套

從古老到現代，過去50年的歷史刻在x86的指令集裡面

並且x86已經做好再戰50年的準備了

--

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.109.127 (臺灣)
※ 作者: wei115 2026-05-07 04:37:30
※ 文章代碼(AID): #1f-wQFBa (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1778099855.A.2E4.html

→ hn9480412: 但還有一個豬隊友微軟1F 59.125.187.40 台灣 05/07 04:46

推 WusoAiwen: 難怪兩家股價最近這麼飆，果然商場上沒有永久的敵人2F 101.8.48.155 台灣 05/07 06:44

→ olozil: 阿不就越來越像RISC4F 220.132.89.193 台灣 05/07 08:10

推 NoneWolf: 太好了我買AMD5F 42.70.198.105 台灣 05/07 08:29

推 takanasiyaya: x86抄risc也已經很久了就是。6F 49.218.208.119 台灣 05/07 08:40

推 smallreader: 新增16個暫存器不增加空間是重新利用AVX的暫存器嗎（不懂就問）7F 223.139.162.224 台灣 05/07 08:56

→ olozil: 這跟AVX沒什麼關係就是了9F 111.243.2.147 台灣 05/07 09:04

推 smallreader: 看來我被"不增加面積"誤導了，他們有在實體上增設這16個暫存器，說的也是"不顯著增加"面積而已
中文都亂寫，不意外10F 223.139.162.224 台灣 05/07 09:28

推 oopFoo: 現代cpu都有幾百個"虛擬暫存器"，只是開14F 36.224.222.169 台灣 05/07 09:31

推 smallreader: 第一段最後一句對應原文意思是「在不顯著增加...之下，能提升效能」15F 223.139.162.224 台灣 05/07 09:32

→ oopFoo: 放出來而已。基本上就是指令集的改進。
NovaLake會有，Zen6應該要有。FRED已經在17F 36.224.222.169 台灣 05/07 09:32

→ smallreader: 被翻成在不增加...下能顯著提升整個意思就大轉彎了19F 223.139.162.224 台灣 05/07 09:33

→ oopFoo: PTL上了。FRED在某些io上有大進步。
https://reurl.cc/X2prXE
fred只需要作業系統支援。apx就需要重新編碼，理論上可20%的效能提昇。
基本上，實體面積真的沒什麼增加。21F 36.224.222.169 台灣 05/07 09:34

Intel FRED Can Yield Greater Performance - FRED Benchmarks On Panther Lake Review - Phoronix With Intel's new Core Ultra Series 3 'Panther Lake' laptop SoCs, the Xe3-based Arc B390 graphics and much improved CPU performance capture much of the ...

推 olozil: 對APX不用太期待，基本上就是已經沒什麼手段了還不想大改，影響CPU的主要有計算、控制、IO、同步，增加暫存器就是對計算與控的部分增強，但效果有限，IO來說你加大了L1反而性能會下降，你把L1從32K->48K
訪問就會從4個cycle變5個cycle，
然後掉性能，X86最大的問題一直是記憶體的一致性，這是RISC不會有的問題26F 111.243.2.147 台灣 05/07 09:49

推 smallreader: 就算是虛擬的也要有實體位置支援吧34F 223.139.162.224 台灣 05/07 09:57

推 olozil: 直接舉例來說，上一次加暫存器是X86-64，然後這次幅度還會比上次小一點35F 111.243.2.147 台灣 05/07 09:57

→ smallreader: 不然能並行的線頭數量會減少(?)37F 223.139.162.224 台灣 05/07 09:59

推 oopFoo: 記憶體的一致性，TSO，有好有壞。現代cpu的性能，根本發揮不出來。記憶體頻寬又小所謂的虛擬其實就是實際暫存器，我講的
有點反過來。實際有幾百個暫存器，cpu會虛擬成好幾組，同時使用。現在只是開放
給程式直接使用，可縮短程式碼，更有效率38F 36.224.222.169 台灣 05/07 10:01

推 smallreader: 嗯反過來實體=幾百個虛擬=一個執行緒所看到的44F 223.139.162.224 台灣 05/07 10:06

→ oopFoo: 的應用。46F 36.224.222.169 台灣 05/07 10:06

推 CyBw: 還沒要升x86-128嗎，都幾年了47F 114.35.167.130 台灣 05/07 10:09

推 oopFoo: 暫存器增加多吧，x64加8個，apx加16個。cpu內部看到的暫存器跟程式碼不一樣。例如store [rax]然後接著load rax，cpu會用兩暫存器，因為它們互不干擾，可以平行處理你要一個cycle同時處理8個指令，那這八個指令不能互相依賴。太少暫存器就容易製造依賴。48F 36.224.222.169 台灣 05/07 10:14

推 nrsair: 新指令集擴充55F 49.217.202.62 台灣 05/07 10:20

推 s25g5d4: 6202 年還在談 CISC/RISC 就落伍了，是沒看到 ARM 近幾年瘋狂加各種 SIMD 指令集，ARM 跟 x86 這幾年差異主要在 variable instruction length 而已。ARM 現在也是 decoder 拆 mOP 下去跑，跟 x86 一樣，只是 fixed length decoder 比較好做而已56F 211.22.64.132 台灣 05/07 10:31

推 kuninaka: 股價飆跟這沒關係啊
那是AI需求62F 1.174.97.117 台灣 05/07 10:46

→ h311013: 蘋果推自研真的是很有遠見64F 61.227.103.243 台灣 05/07 11:31

推 wahaha99: 就算是實體暫存器佔用空間也還好
君不見現在佔CPU最多的早就不是邏輯單元65F 37.19.205.168 日本 05/07 11:35

推 takanasiyaya: Apple從來就喜歡自研，只有core2時代的Intel真的太厲害才低頭用Intel，不然全部都嘛用自己的。不過M系列記憶體架構有創新是真的有意義67F 49.218.208.119 台灣 05/07 12:43

→ labbat: 存儲記憶體都是公共資源，通用暫存器都是特定執行緒限定資源，編譯器活用可以減輕匯流排負擔71F 39.15.56.30 台灣 05/07 12:47

推 Bencrie: 我想得到的好處就 x86-64 ABI 呼叫函數的時候 args 塞 regs 的上限變高74F 60.251.10.52 台灣 05/07 12:51

推 guanting886: 看起來雖然是APX很厲害但感覺上是兩邊找機會把過去的技術債一起清掉之前有多少0day搞到資料中心很緊張76F 42.78.166.15 台灣 05/07 13:16

推 ltytw: 清掉技術債怎麼不是找時間重新發明X86?
例如什麼X86 Gen2 然後順便清掉技術債或屎山代碼79F 36.234.230.69 台灣 05/07 13:20

推 tsairay: 清掉技術債不是叫你不要向下相容82F 202.39.11.150 台灣 05/07 13:22

噓 bhmagic: 血紅姊哭哭沒人理VIA83F 99.118.209.229 美國 05/07 13:29

→ olozil: X86實際可用6個暫存器, _sp與_bp有限制
所以是 86(6) -> 86-64(16) -> APX(32)
這次增加幅度沒有上次多84F 111.243.2.147 台灣 05/07 13:37

→ commandoEX: 升128沒啥好處吧，要說的話AVX就能處理128/256/512 bit的數據了87F 59.125.204.130 台灣 05/07 13:47

推 takanasiyaya: 卡難，x86的小白使用者們不允許，i皇當初雄心壯志要打掉x86重練itinum的結果就是被AMD x86-64闖空門進去伺服器89F 49.218.208.119 台灣 05/07 13:48

→ commandoEX: VIA授權不是過期了嗎?93F 59.125.204.130 台灣 05/07 13:49

→ ma721: 把ai放進去94F 101.10.87.189 台灣 05/07 14:07

推 leon1757tw: 要清技術債的是x86s吧不過被放棄了95F 123.110.162.31 台灣 05/07 14:17

推 s25g5d4: 重新發明 x86？IA64：96F 211.22.64.132 台灣 05/07 14:52

→ gainsborough: 只要I、A、高通、發哥還是賣SOC，那注定就有面積大小的成本獲利定價衝突，感覺還是打不贏大面積狂堆晶體管數量的蘋果SOC(面向普通消費者)97F 114.41.201.174 台灣 05/07 16:10

→ cor1os: 加新指令集才是淘汰老PC最快的方法 -.-101F 122.147.131.2 台灣 05/07 16:30

推 oopFoo: _bp沒有限制，_sp有限制所以_sp+_bp來存取stack frame。但esp可以offset了，ebp就可空出來。如果你的環境許可，esp也可挪來用。但就算6>16>32。16還是比10多啊。102F 58.114.66.74 台灣 05/07 19:58

推 soem: 可惜X86S各方沒共識，能移除一些舊時代的指令集的話也算是有進步106F 1.34.10.55 台灣 05/07 20:04

推 oopFoo: 移除沒有意義，因為空間佔很少。現代cpu的瓶頸在branch，在cache，在memory，這都不是指令集的問題。x86雖然丑，但相容性100%108F 58.114.66.74 台灣 05/07 20:08

→ friedpig: 相容性100%除了少數老舊工業軟體沒再更新以外真的那麼重要嗎？
真的必須的舊軟體沒剩多少了八111F 114.32.196.169 台灣 05/07 21:48

推 smallreader: 編譯器框架很在意相容性吧
有一些萬年不變的程式碼還活在底層114F 223.139.162.224 台灣 05/07 22:21

推 oopFoo: 編譯器，直譯器不需要重新再來。軟體生態重新再來，就算相似也是超大工程。遠望
riscv。116F 58.114.66.74 台灣 05/08 04:05

推 athraugh: 請教各位高人. CPU 對RAM 的頻寬要增加，到VRAM (GPU的)那樣大頻寬，是需要增加指令集還是對連接的實體線數量？目前都不做的困難點是什麼.119F 39.12.109.188 台灣 05/08 08:48

推 oopFoo: 頻寬增加要實體線數量增加+高速ram。困難點在於"貴"。之前高階pc的需求主要來自於遊戲，遊戲吃"大快取"，對頻寬要求反而不高。現在ai興起，狂吃頻寬。所以之後的pc也會在這方面加強。123F 36.224.222.169 台灣 05/08 09:39

推 athraugh: 謝謝回復128F 39.12.109.188 台灣 05/08 10:58

推 Rollnmeow: X86s始終沒共識只有Intel提倡而已
這個APX才是共識下的產物129F 49.214.1.195 台灣 05/08 12:08

推 roseritter: VRAM一般都是高速，比起MB上的RAM131F 223.139.62.6 台灣 05/08 12:51

推 atelier: x86陣營包袱多權力也分散改架構難度太高蘋果軟硬體一把抓單純多了又有信仰
換架構駕輕就熟Motorola 68000->PowerPCx86->Apple Silicon
以前PowerPC轉x86 軟體支援說斷就斷
蘋果的使用者還不是就摸摸鼻子買新的132F 101.10.218.47 台灣 05/08 13:24

→ xxtomnyxx: 現在似乎很多call都把資料陣列用ecx/rcx指向，PUSH和POP功能增加有用嗎？是說，以前自學組合語言時一直沒弄清楚，stack資料調用的速度會比offset快嗎？138F 120.126.106.155 台灣 05/08 13:46

推 tn601374: 哦豁143F 36.224.223.120 台灣 05/08 16:15