顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2026-05-08 18:18:23
看板 PC_Shopping
作者 wei115 (社畜)
標題 [情報] Intel 與 AMD 聯手推進 APX 指令集!x86
時間 Thu May  7 04:37:30 2026


完整標題:
Intel 與 AMD 聯手推進 APX 指令集!x86 架構迎來史上最大變革,效能提升不增功耗

原始連結:
https://www.koc.com.tw/archives/641394
Intel 與 AMD 聯手推進 APX 指令集!x86 架構迎來史上最大變革,效能提升不增功耗 - 電腦王阿達 APX(Advanced Performance Extensions)是 Intel 與 AMD 共同制定的新一代 x86 指令集擴充標準。它的核心精神非常直接:讓 x86 指令集能夠存取更多的暫存器(Registers)。 ...

 

內文:

Intel 與 AMD 這對數十年來在 CPU 市場上正面廝殺的競爭對手,正透過 x86 生態系統
顧問小組(EAG)持續深化合作。繼兩天前聯合發布 ACE(AI Compute Extensions)AI
矩陣加速指令集白皮書之後,EAG 再度揭露了 APX(Advanced Performance Extensions
)的最新細節。這項被稱為「x86 自 64 位元以來最大演進」的指令集擴充,將通用暫存
器數量直接翻倍,並在不增加晶片面積與功耗的前提下顯著提升效能。

https://i.imgur.com/dDlr9lf.jpeg
[圖]


APX 是什麼?為什麼是 x86 的重大演進?

APX(Advanced Performance Extensions)是 Intel 與 AMD 共同制定的新一代 x86 指
令集擴充標準。它的核心精神非常直接:讓 x86 指令集能夠存取更多的暫存器(
Registers)。

暫存器是 CPU 內部容量極小但存取速度極快的儲存單元,負責存放正在運算的資料、指
令與記憶體位址。當指令集能存取更多暫存器時,處理器就能在更短的時間內完成更多工
作,因為大量資料可以直接在 CPU 內部處理,不需要頻繁到速度較慢的記憶體中讀寫。
https://i.imgur.com/6wsaewW.jpeg
[圖]


這項規格早在 2024 年 10 月就由 Intel 首次提出,如今在 EAG 的框架下由 Intel 與
AMD 共同推動,並釋出了更多技術細節。

APX 六大核心改進
APX 並非單一功能的補強,而是對 x86 指令集架構的一次系統性升級。以下是主要改進
項目:

通用暫存器(GPR)翻倍:由現有的 16 個一舉擴充至 32 個。這讓編譯器可以將更多資
料與變數保留在暫存器中,而非寫入速度較慢的記憶體,對程式碼編譯與執行效率有直接
幫助。

https://i.imgur.com/2N81Nkk.jpeg
[圖]

記憶體操作效率提升:經過 SPEC CPU 2017 整數基準測試的模擬驗證,APX 編譯後的程
式碼可減少 10% 的讀取操作(loads)與 20% 的寫入操作(stores),代表更快且功耗
更低的程式執行。


非破壞性指令形式:傳統 x86 指令大多是「破壞性」的,運算結果會直接蓋掉其中一個
來源運算元。APX 新增了非破壞性版本,減少暫存器複製需求,讓程式碼更簡潔且執行更
快。


條件執行擴充:過去 x86 的條件執行僅限於 CMOV 與 SET 等少數指令。APX 新增了條件
式讀取(Conditional Load)、條件式寫入(Conditional Store)、條件式比較/測試(
Conditional Compare/Test)以及旗標抑制功能,大幅擴展 if-conversion 的應用範圍
,減少分支預測失誤。


堆疊操作強化:新增 PUSH2 與 POP2 指令,可以在一次記憶體操作中同時推送或彈出兩
個暫存器,加速函式呼叫的進入與返回流程。

程式碼密度不變:儘管新增了大量指令與功能,APX 並不顯著增加程式碼體積,並且完全
向下相容——既有的 x86 軟體可以在支援 APX 的處理器上無縫執行。

與 ACE 指令集同屬 EAG 框架下的戰略布局

APX 的公布時間點極具戰略意義。就在兩天前的 4 月 30 日,Intel 與 AMD 才剛聯合發
布了 ACE(AI Compute Extensions)技術白皮書,將其定位為 x86 架構的「標準矩陣加
速架構」,支援 INT8、FP8、BF16 等主流 AI 資料格式,並相容於 AVX10 指令集。


ACE 聚焦 AI 矩陣運算加速,APX 則專注於通用運算效能的全面提升:兩者相輔相成,共
同構成 EAG 對 x86 架構未來發展的完整藍圖。EAG 自去年成立以來,陸續公布了 FRED
(彈性返回與事件遞送)、AVX10(向量指令集統一)、ChkTag(記憶體安全標籤檢查)
以及 ACE 與 APX 等多項核心特性。


https://i.imgur.com/s3drPcm.jpeg
[圖]

不用更大面積、不必更高功耗,效能自然提升
APX 最令人驚豔的特色之一,是這些效能提升幾乎不需要額外的矽晶圓面積或功耗作為代
價。Wccftech 的報導強調,APX 可以在不顯著增加核心面積與功耗的情況下,實現更高
的通用運算效能:這對於晶片設計與散熱解決方案來說,意義極為重大。


對開發者與消費者的意義
對於軟體開發者而言,APX 最大的價值在於編譯器的最佳化空間大幅增加。當編譯器能夠
將更多變數保留在暫存器而非記憶體中,程式就能跑得更快、更省電。尤其對於 LLVM
與 GCC 等主流編譯器來說,APX 的 32 個通用暫存器將成為極具吸引力的編譯目標。

對於一般消費者而言,APX 帶來的效益將間接體現在日常使用中:從網頁瀏覽、文書處理
到遊戲與內容創作,支援 APX 的處理器將能以更低的功耗完成相同的工作,或在相同功
耗下提供更流暢的效能表現。


結語
Intel 與 AMD 從數十年的競爭對手,到如今在 EAG 框架下聯手推進 x86 架構的演進:
這不僅是為了對抗 ARM 與 RISC-V 的新興威脅,更是對 x86 這套走過近半世紀的指令集
架構注入全新生命力。APX 的通用暫存器翻倍、ACE 的 AI 矩陣加速標準化,再加上

FRED、AVX10、ChkTag 等一系列基礎架構革新,x86 的故事顯然還沒有寫完。


心得:
出大事了

x86要大改了,上次大改還是x86-64

x86-64的重點在於擴充暫存器長度+新增新暫存器

APX的重點在於新增新暫存器+現代風格的資料流指令

目前用的資料流邏輯還是1970年代流行的那套

從古老到現代,過去50年的歷史刻在x86的指令集裡面

並且x86已經做好再戰50年的準備了

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.109.127 (臺灣)
※ 作者: wei115 2026-05-07 04:37:30
※ 文章代碼(AID): #1f-wQFBa (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1778099855.A.2E4.html
hn9480412: 但還有一個豬隊友微軟1F 59.125.187.40 台灣 05/07 04:46
WusoAiwen: 難怪兩家股價最近這麼飆,果然商場上2F 101.8.48.155 台灣 05/07 06:44
WusoAiwen: 沒有永久的敵人
olozil: 阿不就越來越像RISC4F 220.132.89.193 台灣 05/07 08:10
NoneWolf: 太好了 我買AMD5F 42.70.198.105 台灣 05/07 08:29
takanasiyaya: x86抄risc也已經很久了就是。6F 49.218.208.119 台灣 05/07 08:40
smallreader: 新增16個暫存器不增加空間 是重新利7F 223.139.162.224 台灣 05/07 08:56
smallreader: 用AVX的暫存器嗎(不懂就問)
olozil: 這跟AVX沒什麼關係就是了9F 111.243.2.147 台灣 05/07 09:04
smallreader: 看來我被"不增加面積"誤導了,他們有10F 223.139.162.224 台灣 05/07 09:28
smallreader: 在實體上增設這16個暫存器,說的也是
smallreader: "不顯著增加"面積而已
smallreader: 中文都亂寫,不意外
oopFoo: 現代cpu都有幾百個"虛擬暫存器",只是開14F 36.224.222.169 台灣 05/07 09:31
smallreader: 第一段最後一句對應原文意思是「在不15F 223.139.162.224 台灣 05/07 09:32
smallreader: 顯著增加...之下,能提升效能」
oopFoo: 放出來而已。基本上就是指令集的改進。17F 36.224.222.169 台灣 05/07 09:32
oopFoo: NovaLake會有,Zen6應該要有。FRED已經在
smallreader: 被翻成在不增加...下能顯著提升 整個19F 223.139.162.224 台灣 05/07 09:33
smallreader: 意思就大轉彎了
oopFoo: PTL上了。FRED在某些io上有大進步。21F 36.224.222.169 台灣 05/07 09:34
oopFoo: https://reurl.cc/X2prXE
oopFoo: fred只需要作業系統支援。apx就需要重新
oopFoo: 編碼,理論上可20%的效能提昇。
oopFoo: 基本上,實體面積真的沒什麼增加。
Intel FRED Can Yield Greater Performance - FRED Benchmarks On Panther Lake Review - Phoronix With Intel's new Core Ultra Series 3 'Panther Lake' laptop SoCs, the Xe3-based Arc B390 graphics and much improved CPU performance capture much of the ...

 
olozil: 對APX不用太期待,基本上就是已經沒什麼手26F 111.243.2.147 台灣 05/07 09:49
olozil: 段了還不想大改,影響CPU的主要有計算、控
olozil: 制、IO、同步,增加暫存器就是對計算與控
olozil: 的部分增強,但效果有限,IO來說你加大了
olozil: L1反而性能會下降,你把L1從32K->48K
olozil: 訪問就會從4個cycle變5個cycle,
olozil: 然後掉性能,X86最大的問題一直是記憶體的
olozil: 一致性,這是RISC不會有的問題
smallreader: 就算是虛擬的也要有實體位置支援吧34F 223.139.162.224 台灣 05/07 09:57
olozil: 直接舉例來說,上一次加暫存器是X86-64,35F 111.243.2.147 台灣 05/07 09:57
olozil: 然後這次幅度還會比上次小一點
smallreader: 不然能並行的線頭數量會減少(?)37F 223.139.162.224 台灣 05/07 09:59
oopFoo: 記憶體的一致性,TSO,有好有壞。現代cpu38F 36.224.222.169 台灣 05/07 10:01
oopFoo: 的性能,根本發揮不出來。記憶體頻寬又小
oopFoo: 所謂的虛擬其實就是實際暫存器,我講的
oopFoo: 有點反過來。實際有幾百個暫存器,cpu會
oopFoo: 虛擬成好幾組,同時使用。現在只是開放
oopFoo: 給程式直接使用,可縮短程式碼,更有效率
smallreader: 嗯 反過來 實體=幾百個 虛擬=一個執44F 223.139.162.224 台灣 05/07 10:06
smallreader: 行緒所看到的
oopFoo: 的應用。46F 36.224.222.169 台灣 05/07 10:06
CyBw: 還沒要升x86-128嗎,都幾年了47F 114.35.167.130 台灣 05/07 10:09
oopFoo: 暫存器增加多吧,x64加8個,apx加16個。48F 36.224.222.169 台灣 05/07 10:14
oopFoo: cpu內部看到的暫存器跟程式碼不一樣。例如
oopFoo: store [rax]然後接著load rax,cpu會用兩
oopFoo: 暫存器,因為它們互不干擾,可以平行處理
oopFoo: 你要一個cycle同時處理8個指令,那這八個
oopFoo: 指令不能互相依賴。太少暫存器就容易製造
oopFoo: 依賴。
nrsair: 新指令集擴充55F 49.217.202.62 台灣 05/07 10:20
s25g5d4: 6202 年還在談 CISC/RISC 就落伍了,是沒56F 211.22.64.132 台灣 05/07 10:31
s25g5d4: 看到 ARM 近幾年瘋狂加各種 SIMD 指令集
s25g5d4: ,ARM 跟 x86 這幾年差異主要在 variable
s25g5d4:  instruction length 而已。ARM 現在也是
s25g5d4:  decoder 拆 mOP 下去跑,跟 x86 一樣,
s25g5d4: 只是 fixed length decoder 比較好做而已
kuninaka: 股價飆跟這沒關係啊62F 1.174.97.117 台灣 05/07 10:46
kuninaka: 那是AI需求
h311013: 蘋果推自研真的是很有遠見64F 61.227.103.243 台灣 05/07 11:31
wahaha99: 就算是實體暫存器 佔用空間也還好65F 37.19.205.168 日本 05/07 11:35
wahaha99: 君不見現在佔CPU最多的早就不是邏輯單元
takanasiyaya: Apple從來就喜歡自研,只有core2時67F 49.218.208.119 台灣 05/07 12:43
takanasiyaya: 代的Intel真的太厲害才低頭用Intel
takanasiyaya: ,不然全部都嘛用自己的。不過M系列
takanasiyaya: 記憶體架構有創新是真的有意義
labbat: 存儲記憶體都是公共資源,通用暫存器都是71F 39.15.56.30 台灣 05/07 12:47
labbat: 特定執行緒限定資源,編譯器活用可以減輕
labbat: 匯流排負擔
Bencrie: 我想得到的好處就 x86-64 ABI 呼叫函數74F 60.251.10.52 台灣 05/07 12:51
Bencrie: 的時候 args 塞 regs 的上限變高
guanting886: 看起來雖然是APX很厲害 但感覺上是76F 42.78.166.15 台灣 05/07 13:16
guanting886: 兩邊找機會把過去的技術債一起清掉
guanting886:  之前有多少0day搞到資料中心很緊張
ltytw: 清掉技術債怎麼不是找時間重新發明X86?79F 36.234.230.69 台灣 05/07 13:20
ltytw: 例如什麼X86 Gen2  然後順便清掉技術債或
ltytw: 屎山代碼
tsairay: 清掉技術債不是叫你不要向下相容82F 202.39.11.150 台灣 05/07 13:22
bhmagic: 血紅姊哭哭 沒人理VIA83F 99.118.209.229 美國 05/07 13:29
olozil: X86實際可用6個暫存器, _sp與_bp有限制84F 111.243.2.147 台灣 05/07 13:37
olozil: 所以是 86(6) -> 86-64(16) -> APX(32)
olozil: 這次增加幅度沒有上次多
commandoEX: 升128沒啥好處吧,要說的話AVX就能處87F 59.125.204.130 台灣 05/07 13:47
commandoEX: 理128/256/512 bit的數據了
takanasiyaya: 卡難,x86的小白使用者們不允許,i89F 49.218.208.119 台灣 05/07 13:48
takanasiyaya: 皇當初雄心壯志要打掉x86重練itinum
takanasiyaya: 的結果就是被AMD x86-64闖空門進去
takanasiyaya: 伺服器
commandoEX: VIA授權不是過期了嗎?93F 59.125.204.130 台灣 05/07 13:49
ma721: 把ai放進去94F 101.10.87.189 台灣 05/07 14:07
leon1757tw: 要清技術債的是x86s吧 不過被放棄了95F 123.110.162.31 台灣 05/07 14:17
s25g5d4: 重新發明 x86?IA64:96F 211.22.64.132 台灣 05/07 14:52
gainsborough: 只要I、A、高通、發哥還是賣SOC,那97F 114.41.201.174 台灣 05/07 16:10
gainsborough: 注定就有面積大小的成本獲利定價衝
gainsborough: 突,感覺還是打不贏大面積狂堆晶體
gainsborough: 管數量的蘋果SOC(面向普通消費者)
cor1os: 加新指令集才是淘汰老PC最快的方法 -.-101F 122.147.131.2 台灣 05/07 16:30
oopFoo: _bp沒有限制,_sp有限制所以_sp+_bp來存取102F 58.114.66.74 台灣 05/07 19:58
oopFoo: stack frame。但esp可以offset了,ebp就可
oopFoo: 空出來。如果你的環境許可,esp也可挪來用
oopFoo: 。但就算6>16>32。16還是比10多啊。
soem: 可惜X86S各方沒共識,能移除一些舊時代的指106F 1.34.10.55 台灣 05/07 20:04
soem: 令集的話也算是有進步
oopFoo: 移除沒有意義,因為空間佔很少。現代cpu的108F 58.114.66.74 台灣 05/07 20:08
oopFoo: 瓶頸在branch,在cache,在memory,這都不
oopFoo: 是指令集的問題。x86雖然丑,但相容性100%
friedpig: 相容性100%除了少數老舊工業軟體沒再更111F 114.32.196.169 台灣 05/07 21:48
friedpig: 新以外 真的那麼重要嗎?
friedpig: 真的必須的舊軟體沒剩多少了八
smallreader: 編譯器框架很在意相容性吧114F 223.139.162.224 台灣 05/07 22:21
smallreader: 有一些萬年不變的程式碼還活在底層
oopFoo: 編譯器,直譯器不需要重新再來。軟體生態116F 58.114.66.74 台灣 05/08 04:05
oopFoo: 重新再來,就算相似也是超大工程。遠望
oopFoo: riscv。
athraugh: 請教各位高人.   CPU  對RAM 的頻寬要119F 39.12.109.188 台灣 05/08 08:48
athraugh: 增加,到VRAM (GPU的)那樣大頻寬, 是
athraugh: 需要增加指令集 還是 對連接的實體線數
athraugh: 量?  目前都不做的困難點是什麼.
oopFoo: 頻寬增加要實體線數量增加+高速ram。困難123F 36.224.222.169 台灣 05/08 09:39
oopFoo: 點在於"貴"。之前高階pc的需求主要來自於
oopFoo: 遊戲,遊戲吃"大快取",對頻寬要求反而不
oopFoo: 高。現在ai興起,狂吃頻寬。所以之後的pc
oopFoo: 也會在這方面加強。
athraugh: 謝謝回復128F 39.12.109.188 台灣 05/08 10:58
Rollnmeow: X86s始終沒共識只有Intel提倡而已129F 49.214.1.195 台灣 05/08 12:08
Rollnmeow: 這個APX才是共識下的產物
roseritter: VRAM一般都是高速,比起MB上的RAM131F 223.139.62.6 台灣 05/08 12:51
atelier: x86陣營包袱多權力也分散 改架構難度太高132F 101.10.218.47 台灣 05/08 13:24
atelier: 蘋果軟硬體一把抓 單純多了 又有信仰
atelier: 換架構駕輕就熟Motorola 68000->PowerPC
atelier: x86->Apple Silicon
atelier: 以前PowerPC轉x86 軟體支援說斷就斷
atelier: 蘋果的使用者還不是就摸摸鼻子買新的
xxtomnyxx: 現在似乎很多call都把資料陣列用ecx/138F 120.126.106.155 台灣 05/08 13:46
xxtomnyxx: rcx指向,PUSH和POP功能增加有用嗎?
xxtomnyxx: 是說,以前自學組合語言時一直沒弄清楚
xxtomnyxx: ,stack資料調用的速度會比offset快嗎
xxtomnyxx: ?
tn601374: 哦豁143F 36.224.223.120 台灣 05/08 16:15

--
※ 看板: PC_Shopping 文章推薦值: 0 目前人氣: 0 累積人氣: 35 
作者 wei115 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇