※ 本文轉寄自 ptt.cc 更新時間: 2025-09-03 16:54:33
看板 PC_Shopping
作者 標題 [新聞] 英特爾申請「軟體定義超級核心」專利
時間 Tue Sep 2 08:51:29 2025
資料來源:
https://reurl.cc/daOYr8
Intel files patent for 'Software Defined Supercore' — increases single-thread performance and IPC by mimicking ultra-wide execution using multiple cores | Tom's Hardware Intel's Software Defined Supercore (SDC) lets multiple CPU cores fuse into a virtual high-performance core to boost single-thread speed without buildi ...
以下Google機翻:
英特爾已獲得一項名為“軟體定義超核”(SDC)的技術的專利,該技術使軟體能夠融合多
個核心的功能,組建一個虛擬的超寬“超級核”,只要擁有足夠的並行工作能力,就能提升
單線程性能。如果該技術能夠按預期運行,那麼英特爾未來的 CPU 將在特定支援 SDC 的應
用程式中提供更快的單執行緒效能。目前,這只是一項專利,它可能會成為現實,也可能不
會。
個核心的功能,組建一個虛擬的超寬“超級核”,只要擁有足夠的並行工作能力,就能提升
單線程性能。如果該技術能夠按預期運行,那麼英特爾未來的 CPU 將在特定支援 SDC 的應
用程式中提供更快的單執行緒效能。目前,這只是一項專利,它可能會成為現實,也可能不
會。
英特爾的軟體定義超核 (SDC) 技術將兩個或多個實體 CPU 核心組合成一個高效能虛擬內核
,透過將單線程指令劃分為獨立區塊並並行執行,實現協同運行。每個核心運行程式的不同
部分,而專門的同步和資料傳輸指令則確保保留原始程式順序,從而以最小的開銷最大化每
個時鐘指令數 (IPC)。這種方法旨在提升單線程性能,而無需提高時脈速度或建立寬大的單
片內核,因為這樣會增加功耗和/或晶體管預算。
,透過將單線程指令劃分為獨立區塊並並行執行,實現協同運行。每個核心運行程式的不同
部分,而專門的同步和資料傳輸指令則確保保留原始程式順序,從而以最小的開銷最大化每
個時鐘指令數 (IPC)。這種方法旨在提升單線程性能,而無需提高時脈速度或建立寬大的單
片內核,因為這樣會增加功耗和/或晶體管預算。
現代 x86 CPU 核心可以解碼 4-6 條指令,然後在將指令解碼為微操作後,每週期執行 8-9
條微操作,達到此類處理器的峰值 IPC 效能。相較之下,Apple 基於 Arm 的客製化高效
能核心(例如 Firestorm、Avalanche、Everest)在理想條件下每週期最多可解碼 8 條指
令,然後每週期執行超過 10 條指令。正因如此,Apple 的處理器通常比 Arm 同類產品具
有更高的單執行緒效能和更低的功耗。
條微操作,達到此類處理器的峰值 IPC 效能。相較之下,Apple 基於 Arm 的客製化高效
能核心(例如 Firestorm、Avalanche、Everest)在理想條件下每週期最多可解碼 8 條指
令,然後每週期執行超過 10 條指令。正因如此,Apple 的處理器通常比 Arm 同類產品具
有更高的單執行緒效能和更低的功耗。
雖然技術上可以建構一個 8 路 x86 CPU 核心(即一個超標量 x86 處理器,能夠每時脈解
碼、發出和退出多達 8 條指令),但在實踐中,由於前端瓶頸以及在功耗和麵積成本大幅
增加的情況下效能提升的收益遞減,這一目標尚未實現。事實上,即使是現代 x86 CPU,在
一般工作負載下通常也能達到 2、3 或 4 個持續 IPC,具體取決於軟體。因此,英特爾的
SDC 建議,與其建構一個 8 路 x86 CPU 核心,不如在可行的情況下,將兩個或多個 4 寬
單元配對,組成一個大核心進行協作。
碼、發出和退出多達 8 條指令),但在實踐中,由於前端瓶頸以及在功耗和麵積成本大幅
增加的情況下效能提升的收益遞減,這一目標尚未實現。事實上,即使是現代 x86 CPU,在
一般工作負載下通常也能達到 2、3 或 4 個持續 IPC,具體取決於軟體。因此,英特爾的
SDC 建議,與其建構一個 8 路 x86 CPU 核心,不如在可行的情況下,將兩個或多個 4 寬
單元配對,組成一個大核心進行協作。
在硬體方面,支援 SDC 的系統中的每個核心都包含一個小型專用硬體模組,用於管理配對
核心之間的同步、暫存器傳輸和記憶體排序。這些模組利用一個保留的記憶體區域(稱為蟲
洞位址空間)來協調即時輸入/即時輸出資料和同步操作,確保來自不同核心的指令以正確
的程式順序退出。該設計同時支援順序和無序核心,只需對現有執行引擎進行少量更改,從
而在晶片空間方面實現緊湊的設計。
核心之間的同步、暫存器傳輸和記憶體排序。這些模組利用一個保留的記憶體區域(稱為蟲
洞位址空間)來協調即時輸入/即時輸出資料和同步操作,確保來自不同核心的指令以正確
的程式順序退出。該設計同時支援順序和無序核心,只需對現有執行引擎進行少量更改,從
而在晶片空間方面實現緊湊的設計。
在軟體方面,系統使用 JIT 編譯器、靜態編譯器或二進位偵測將單執行緒程式拆分為程式
碼段,並將不同的程式碼區塊分配給不同的核心。它注入了用於流程控制、暫存器傳遞和同
步行為的特殊指令,使硬體能夠保持執行完整性。作業系統的支援至關重要,因為作業系統
會根據運行時條件動態決定何時將執行緒遷移到超核模式或從超核模式中遷移出來,以平衡
效能和核心可用性。
碼段,並將不同的程式碼區塊分配給不同的核心。它注入了用於流程控制、暫存器傳遞和同
步行為的特殊指令,使硬體能夠保持執行完整性。作業系統的支援至關重要,因為作業系統
會根據運行時條件動態決定何時將執行緒遷移到超核模式或從超核模式中遷移出來,以平衡
效能和核心可用性。
英特爾的專利沒有提供精確的數位效能提升估計,但它暗示在特定場景下,期望兩個「窄」
核心的效能接近「寬」核心的效能是現實的。
-----
看起來像是superscalar(超純量)或out-of-order(亂序執行)但共用的硬體元件變成能單獨
執行程式的E-core?
看來再堆時脈或堆pipeline深度已經沒什麼效益了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.79.117 (臺灣)
※ 作者: crimsonmoon9 2025-09-02 08:51:29
※ 文章代碼(AID): #1ejZ-Jvf (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1756774291.A.E69.html
推 : 超線程是一個核當兩個用 這是兩個當一個1F 223.140.255.217 台灣 09/02 09:14
→ : 用嗎
→ : 用嗎
超線程是hyper-threading在一個核裡能執行複數執行緒並共用部分硬體
我的理解是這個像是把一個執行緒拆給兩個E-core做並期待他1+1>>1P-core
→ : 上一個想用軟體救硬體的AMD已經認清現3F 59.125.204.130 台灣 09/02 09:18
→ : 實了
→ : 實了
→ : 怎麼感覺這玩意有點熟悉5F 123.110.221.151 台灣 09/02 09:23
→ : Intel連APO大小核調度都搞得零零落落6F 39.15.32.24 台灣 09/02 09:27
→ : 這種韌體層面的線程拆分會有搞頭嗎?
→ : 這種韌體層面的線程拆分會有搞頭嗎?
→ : big-little的變形?8F 42.78.70.142 台灣 09/02 09:28
我覺得不太像 big.LITTLE本質上的處理器核上執行的是完整的一個執行緒
但SDC中要把兩個E-core合體才是一個完整的執行緒
推 : 軟硬整合黑科技9F 49.217.123.120 台灣 09/02 09:30
→ : 推土機:對 我做過 死了10F 57.140.96.63 台灣 09/02 09:33
推 : 推土機:11F 36.236.79.253 台灣 09/02 09:39
可惜沒經歷過這個美好(?的年代XD
推 : 用軟體救硬體不就Transmeta12F 101.9.198.221 台灣 09/02 09:44
推 : 沒招了就開始走旁門左道13F 202.39.11.150 台灣 09/02 09:45
→ : 推土機「幫復」14F 101.10.5.176 台灣 09/02 10:01
推 : 印特爾CPU設計部門是不是只剩印度人15F 42.73.70.21 台灣 09/02 10:04
→ : 感覺不是很靠譜...16F 138.199.22.154 日本 09/02 10:06
推 : 真的聽起來很熟悉,整個敘述就像疊床17F 101.8.248.1 台灣 09/02 10:10
→ : 架屋的感覺,用一個軟體去整合多變單
→ : ,光運行這軟體要吃掉多少資源跟頻寬
→ : ?
→ : 最後會不會變成跑分用,實際上烙賽之
→ : 類的
※ 編輯: crimsonmoon9 (42.72.79.117 臺灣), 09/02/2025 10:19:56→ : 架屋的感覺,用一個軟體去整合多變單
→ : ,光運行這軟體要吃掉多少資源跟頻寬
→ : ?
→ : 最後會不會變成跑分用,實際上烙賽之
→ : 類的
推 : 這不叫科技,叫「話術」23F 42.77.179.255 台灣 09/02 10:19
推 : 彷若當年傳聞中的逆向超執行緒24F 123.204.135.88 台灣 09/02 10:32
推 : 推土機再現25F 114.43.103.78 台灣 09/02 10:35
推 : 這合併是手排還自排?26F 42.74.159.94 台灣 09/02 10:41
→ : 軟體是電子不是量子 跑步都需要時間27F 123.51.254.202 台灣 09/02 10:50
推 : 根本當年推土機的招 裡面都印度人印特爾了28F 220.133.114.205 台灣 09/02 10:50
→ : 是不是
→ : 是不是
推 : 這是不是AMD臥底呀,怎麼這幾次都30F 36.235.153.145 台灣 09/02 10:52
→ : 在抄AMD已走過的死路
→ : 在抄AMD已走過的死路
推 : 看起來是讓單核心軟體可以強制多核心並行32F 110.30.8.26 台灣 09/02 10:52
→ : 運算?
→ : 運算?
→ : 多黏幾顆大核不幹 搞有的沒的 下去吧34F 111.82.51.108 台灣 09/02 10:55
推 : 我可以預想到阿姬濕會怎麼吹了35F 110.30.8.26 台灣 09/02 10:56
推 : 不過時代不同,也許現代的頻寬可以抗住這36F 1.170.199.7 台灣 09/02 11:15
→ : 技術
→ : 技術
→ : 感覺跟鬼谷生物說書裡當某物種衰敗瀕臨38F 59.125.136.34 台灣 09/02 11:16
→ : 滅絕前會瘋狂突變演化掙扎一波那樣
→ : 滅絕前會瘋狂突變演化掙扎一波那樣
推 : 當初推土機就是假設錯誤 以為整數運算40F 57.140.96.63 台灣 09/02 11:27
→ : 是瓶頸 然後盲信可以用GPU取代浮點阿
→ : 是瓶頸 然後盲信可以用GPU取代浮點阿
推 : 要出裡面堆滿e core的cpu就是了42F 223.139.8.21 台灣 09/02 11:28
推 : p core的team不是被解散了嗎43F 202.39.11.150 台灣 09/02 11:29
推 : 煙霧彈44F 122.121.4.14 台灣 09/02 11:31
推 : "如果可以按預期運行"45F 42.74.120.176 台灣 09/02 11:31
推 : 康莊大道不走,專走旁門左道,慘啊46F 202.39.11.150 台灣 09/02 11:33
推 : 下一章是雞血驅動? 推土機:你也懂雞血?47F 60.251.219.78 台灣 09/02 11:35
推 : 專利PTT化?48F 223.141.171.152 台灣 09/02 11:37
→ : 專利PPT化
→ : 專利PPT化
推 : 這也在阿基師的守備範圍嗎? I皇版推土50F 49.216.47.168 台灣 09/02 11:38
→ : 機你怎麼看(X 吹(O
→ : 機你怎麼看(X 吹(O
推 : 就 很勇的發起了技術挑戰 但是收益很低52F 57.140.96.63 台灣 09/02 11:41
推 : 好懷念我的推土機,建議哀皇趕快做53F 223.138.142.251 台灣 09/02 11:50
推 : 這算是一種反璞歸真嗎?54F 182.235.207.105 台灣 09/02 11:52
→ : 呵呵 軟體優化誰來做?55F 42.73.52.188 台灣 09/02 11:53
→ : 不就spmt mlperf的dk做過 光靠jit很56F 23.108.99.122 新加坡 09/02 11:55
→ : 難找真的能平行化的區塊 效率很差
→ : 難找真的能平行化的區塊 效率很差
→ : 瓶頸還是在硬體吧?58F 36.230.158.2 台灣 09/02 11:55
→ : all new itanium bulldozer59F 218.161.120.232 台灣 09/02 11:57
→ : P core太耗電 集合一堆 E core來打完美60F 122.118.17.168 台灣 09/02 12:00
推 : 這以前p4年代就有在講了 逆向ht61F 49.216.253.101 台灣 09/02 12:06
→ : E cord:我又合體啦,我又分開啦62F 220.133.86.39 台灣 09/02 12:08
推 : 軟體定義xxx 要先確保微軟不要搞你。63F 42.72.230.165 台灣 09/02 12:14
推 : 但是要怎麼解決換手的overhead呢64F 27.53.171.30 台灣 09/02 12:15
→ : 這機制 看起來一定有security 漏洞 最後65F 42.72.230.165 台灣 09/02 12:16
→ : 又關掉
→ : 又關掉
推 : 開始發瘋亂搞了 準備死去67F 114.25.161.57 台灣 09/02 12:17
噓 : 真的合體又分開............搞笑68F 223.138.102.69 台灣 09/02 12:22
推 : 推土機: 再耦合GPU與NPU,看起來跟HSA有80%像69F 59.125.102.45 台灣 09/02 12:25
推 : 微軟:你有問過我的意見嗎?70F 61.223.89.253 台灣 09/02 12:25
推 : Indel的 1+1>2 實際就是 1+1<171F 1.173.200.11 台灣 09/02 12:25
![[圖]](https://i.imgur.com/mU4spPih.jpg)
推 : 不過這樣跑分很高很爽XD73F 57.140.96.63 台灣 09/02 12:32
推 : 內建VM的感覺?74F 115.43.50.111 台灣 09/02 12:33
→ : 問題是指令要怎麼拆才能不會有順序問題75F 138.199.22.154 日本 09/02 12:38
→ : 又同時最高效率與最低開銷
→ : 還要考慮快取共用....以後是統一大快取?
→ : 又同時最高效率與最低開銷
→ : 還要考慮快取共用....以後是統一大快取?
推 : 然後廣告就動不動32核78F 60.251.58.169 台灣 09/02 12:42
噓 : SDC A MO LI GAN WU 50%? Z 5 TAN GEE MO??79F 114.136.242.165 台灣 09/02 12:42
推 : 又找到外星人了嗎80F 42.72.164.89 台灣 09/02 12:53
→ : 把13 14代優化能耗 解決瑕疵 換成下一代81F 118.168.232.161 台灣 09/02 12:59
→ : 還是會有很多富哥支持的 新一代要搞這齣
→ : ?
→ : 還有加兩倍快取
→ : 蘇媽都知道力大飛磚 牢英很想彎道超車是
→ : 吧
→ : 還是會有很多富哥支持的 新一代要搞這齣
→ : ?
→ : 還有加兩倍快取
→ : 蘇媽都知道力大飛磚 牢英很想彎道超車是
→ : 吧
推 : 現在是AMD走康莊大道,Intel走旁門左道87F 202.39.11.150 台灣 09/02 13:14
→ : 想不到啊想不到
→ : 想不到啊想不到
→ : 合併兩個以上的 core 跑 VLIW/EPIC? lol89F 42.79.68.117 台灣 09/02 13:23
噓 : 吃到AMD的毒藥90F 125.227.5.157 台灣 09/02 13:25
→ : 有請造謠大濕阿基濕開吹91F 61.230.224.47 台灣 09/02 13:27
→ : 或是core的ALU是可以動態調配的. O_O92F 42.79.68.117 台灣 09/02 13:28
推 : 一核有難,多核圍觀,全E核的垃圾要來93F 223.138.126.254 台灣 09/02 13:28
→ : 了
→ : 了
→ : 最後又造成一堆漏洞,打patch後效能大降95F 106.107.218.130 台灣 09/02 13:31
推 : 判讀指令給誰跑的指令要給誰跑?96F 39.12.216.74 台灣 09/02 13:38
噓 :97F 39.14.48.119 台灣 09/02 13:54
噓 : 從拉基桶撿回來抄的作業98F 118.166.211.228 台灣 09/02 14:02
推 : 不用1+1>2,穩定大於1.2就有搞頭了99F 27.53.171.30 台灣 09/02 14:11
推 : 聽起來就是單執行緒的軟體外掛包裝成可100F 42.75.211.119 台灣 09/02 14:13
→ : 多執行緒的軟體 !?
→ : 多執行緒的軟體 !?
推 : 太慢早該這樣做了 總有不想切換的時候102F 36.228.5.87 台灣 09/02 14:17
→ : 不想切換可以指不切換跟不想煩惱切換
→ : 不想切換可以指不切換跟不想煩惱切換
推 : 阿基濕還在擬稿要怎麼發推嗎XD104F 36.231.86.80 台灣 09/02 14:23
→ : 乞丐超人核心!?105F 211.22.101.67 台灣 09/02 14:24
→ : 不就自動讓單執行緒可以並行處理,軟體邏輯106F 100.8.239.31 美國 09/02 14:50
→ : 層上宣告失敗之後韌體層做過好多嘗試AMD也
→ : 搞過,現在Intel走投無路從垃圾桶撿回來的
→ : 冷飯炒新聞
→ : 層上宣告失敗之後韌體層做過好多嘗試AMD也
→ : 搞過,現在Intel走投無路從垃圾桶撿回來的
→ : 冷飯炒新聞
推 : 應該是分支預測如果沒辦法持續改善的110F 123.204.9.100 台灣 09/02 14:52
→ : 性能提升備案,目前是先從特殊指令集
→ : 著手,只是和蘇嬤的協調是個問題
→ : 性能提升備案,目前是先從特殊指令集
→ : 著手,只是和蘇嬤的協調是個問題
推 : 先跟微軟協調的成再說113F 114.34.118.62 台灣 09/02 14:55
→ : 話說之前說的那個X86s到底怎樣了?114F 59.125.204.130 台灣 09/02 15:00
→ : 這算軟體層面上的分支預測,要由軟體115F 123.204.9.100 台灣 09/02 15:01
→ : 去猜應用場景,來對執行緒做協調,但
→ : 重點仍是卡在微軟,再好的想法都沒啥
→ : 用
→ : 去猜應用場景,來對執行緒做協調,但
→ : 重點仍是卡在微軟,再好的想法都沒啥
→ : 用
推 : 樓上阿基濕119F 111.253.133.167 台灣 09/02 15:10
推 : 又跟蘇媽要協調了XDXD120F 57.140.96.63 台灣 09/02 15:24
→ : 造謠大濕阿基濕幻想出的世界線裡世界中121F 61.230.224.47 台灣 09/02 15:29
→ : 心就是i皇其它家都要圍繞著i皇轉啊
→ : 所以當然是微軟跟蘇媽的問題囉
→ : 心就是i皇其它家都要圍繞著i皇轉啊
→ : 所以當然是微軟跟蘇媽的問題囉
推 : 玩不贏,換花樣124F 49.216.128.165 台灣 09/02 16:30
→ : 有問過微軟嗎?
→ : 有問過微軟嗎?
推 : 笑死,要就是當年AMD太超前要就是intel126F 125.230.3.96 台灣 09/02 17:08
→ : 根本沒救了
→ : 根本沒救了
推 : 魑魅魍魎,琴瑟琵琶128F 49.218.243.65 台灣 09/02 18:47
→ : noHT vs HT
→ : noHT vs HT
→ : 穿越到2011了130F 114.33.176.49 台灣 09/02 18:51
→ : 大概又是跑分能看而已131F 1.170.190.75 台灣 09/02 19:21
→ : 如果開始要用這個騙單核跑分那還真的慘
→ : 如果開始要用這個騙單核跑分那還真的慘
推 : 本來是HT一分二 現在要變成二合一了嗎XD133F 220.135.157.53 台灣 09/02 20:16
→ : CMT134F 125.231.130.197 台灣 09/02 21:32
→ : 聽起來很像虛擬化?135F 36.235.224.228 台灣 09/02 22:56
推 : 牙膏:重返農藥!136F 111.249.150.105 台灣 09/02 23:34
推 : 以前玩軟體平行化最大的障礙就依賴137F 118.140.16.38 香港 09/03 00:41
→ : 性,看印特爾怎麼解決
→ : 性,看印特爾怎麼解決
→ : 1. 推土機玩過了 2. i皇把HT拿掉想全靠139F 68.228.69.69 美國 09/03 04:39
→ : 硬體核心,搞這個又變軟體,那幹嘛拿掉
→ : HT?????
→ : 硬體核心,搞這個又變軟體,那幹嘛拿掉
→ : HT?????
推 : 不重要 AMD YES!142F 42.78.22.87 台灣 09/03 07:40
推 : 彎的過去就是拓海 玩不過去就是填海143F 49.217.124.219 台灣 09/03 08:05
→ : !
→ : !
推 : 公佈時跑分強悍,市售時遊戲烙賽的節145F 101.8.250.76 台灣 09/03 08:18
→ : 奏
→ : 奏
→ : 資料相依性能解決的大部分早就平行化147F 59.125.204.130 台灣 09/03 08:27
→ : 了,還會留到現在的不是懶就是B>Z
→ : 了,還會留到現在的不是懶就是B>Z
→ : 還需要微軟優化149F 223.136.104.81 台灣 09/03 09:00
→ : 這我知道!悟天克斯!150F 114.25.136.248 台灣 09/03 11:40
→ : Microsoft Win+ Intel inside CMT151F 125.231.130.197 台灣 09/03 13:38
--
※ 看板: PC_Shopping 文章推薦值: 0 目前人氣: 0 累積人氣: 94
作者 crimsonmoon9 的最新發文:
- 53F 18推
資料來源: 以下Google機翻: 英特爾已獲得一項名為“軟體定義超核”(SDC)的技術的專利,該技術使軟體能夠融合多 個核心的功能,組建一個虛擬的超寬“超級核”,只要擁有足夠的並行工作能力,就能提 …151F 60推 5噓- 10F 7推
- 17F 11推
點此顯示更多發文記錄
→
guest
回列表(←)
分享
