超级课堂：英特尔核显是如何进化成Xe的？

更新时间：2023-01-08 14:22:00作者：51data

每次看显卡市场占有率的图表，最大的房子不是NVIDIA，也不是AMD，而是Intel，占据了显卡市场的大部分。原因当然是他们家的主流处理器基本上都有内核，他们家的处理器也占了市场的大头，占有率很高。

实际上，1998年，Intel进入显卡市场，推出了Intel i740专用显卡。此后，集成到810/815芯片组中，从此，Intel的集成显卡家族应运而生。那个时代核显示器集成在北桥内，但2010年的Clarkdale处理器开始集成到CPU内部。目前，最新的Xe架构核显示已经是英特尔的第12代显示架构。

过去英特尔的核显示屏每年都会与酷睿系列处理器一起升级，但在第八代Cannon Lake卡壳之前，Gen 9.5核显示屏已经伴随着我们很久了。移动平台直到2019年推出的Ice Lake处理器才开始重新启动核显示升级。桌面平台直接跳到了最新的Xe架构，直到今年的Rocket Lake。

初始英特尔核显示的时间轴

但是，与在CPU的性能方面被批评磨掉牙膏不同，核显的性能每一代都有很大的提高。那么，我们来回顾一下Intel的核显进化历史吧。

Gen5:Clarkdale2010年推出的Clarkdale处理器无疑是最先集成GPU的CPU。该处理器由32nm的进程CPU Die和45nm的GPU Die封装在一起组成一个PCB，两个芯片通过QPI总线相连。其实当时看Clarkdale的话，感觉漏洞百出的Intel又在玩胶水了，其实那一年看的是Clarkdale

Clarkdale内核的结构图，GPU Die包括PCI-E控制器和内存控制器，其实是北桥芯片

Clarkdale系列处理器只有双核机型，有酷睿i5-600和酷睿i3-500两种机型，在LGA 1156时代，四核处理器没有集成GPU。

当时的Intel将Clarkdale的GPU统称为“Intel HD Graphics”。这个名字至今仍在使用。这个GPU实际上是G45上的X4500 HD的升级版，增加了两个EU，达到12个，核心频率最高可达900MHz，支持分层z缓存算法( Hierarchical Z )和Fast Z Clear )技术

Gen6:Sandy BridgeSandy Bridge的核心图

2011年推出的Sandy Bridge架构处理器将CPU和GPU集成在同一个芯片上，所有CPU、GPU、内存控制器和PCI-E控制器都集成在一个内核中。最大的改进是L3缓存更改为环形总线设计，允许核心、GFX和显示/媒体控制器共享L3缓存。

Sandy Bridge的GPU主要包括指令流处理器、媒体处理器、多媒体解码器、执行单元、集成执行单元阵列、媒体采样器、纹理采样器、指令缓冲器等

Sandy Bridge根据机型分为标准版和“k”系倍频解锁版，标准版的GFX被命名为HD Graphics 2000，而只有k系列拥有的GFX是高等级的HD Graphics 3000，前者拥有6个欧盟与全面支持turbo boost动态不同，最高频率为1350MHz，支持DX10.1、SM4.1、OpenGL 3.0，HD Graphics 3000比上一代实现了2倍的增长。

此外，这一代的核表示还增加了快速同步转码加速技术。集成编码器可以支持MPEG2、VC1和H.264视频的多种硬件编码。与Sandy Bridge集成的图形核心提供了视频解码和编码硬件加速功能，可以大幅降低用户在视频转码时的成本。时间

Gen7:Ivy BridgeIvy Bridge体系结构图

Ivy Bridge对Intel核显示的改进还是两个方向，首先是更进一步，支持提高GPU的性能，还有DX11，二是继续支持提高核显示的功能、多屏幕输出、高分辨率等

Ivy Bridge的GPU增强了几何前端、光栅化、像素后端处理、采样器和寻址单元的并行计算能力，每个周期可以执行两个MAC操作。 GPU可以直接读取L3缓存的数据，图形单元增加了两个可编程操作和一个固定功能单元支持曲面细分计算，并升级为解码和显示功能。

同样的核表示也分为两种，分别是具有16个EU单元的HD 4000和具有6个EU单元的HD 2500。 “k”系列处理器使用HD 4000，其他处理器使用HD 2500，最高频率与SNB时代一样为1350MHz，支持DX11、SM5.0，支持OpenGL 3.2，在性能上

Ivy Bridge支持快速同步2.0编码加速技术，与第一代相比，2.0版具有更快、更高的图像质量。视频输出也从原来的2画面上升到了3画面输出，最大分辨率从原来的2560*1600上升到了4k*4k水平。

Gen7.5:HaswellHaswell体系结构图

Haswell采用Gen7.5核显示器，从这一代开始，Intel的核显示器开始了模块化、可扩展的设计。 Haswell的显示核心采用了2级的EU集群结构设计，上层称为Slice，下层称为Subslice，每个Subslice有10个EU，2组Subslice单元构成1组Subslice

Haswell的GT1、GT2、GT3核显分别有10个、20个、40个EU单元，此外还有128MB的eDRAM、512位宽、64GB/s带宽内置的嵌入式eDRAM作为L4缓存

Intel的核显示屏以前被命名为HD Graphics，但由于与NVIDIA的GeForce和AMD的Radeon相比还不够霸气，从Haswell处理器的核心显卡来看，Intel是一个新名称中文分别对应GT3及GT3e核表示，称为“铫炬”，具体型号为Iris Graphics 5100和Iris Pro Graphics 5200。

这一代台式机版酷睿i3处理器基本上使用的是GT2核心。型号为HD Graphics 4600/4400，后者仅用于酷睿i3-41xx系列处理器，只有16个欧盟。虽然非k系列处理器的核心性能有了很大的提升，但真正需要高性能核心性能的是酷睿i3级处理器，而高端处理器基本上都有一个核心

奔腾和赛扬处理器采用了GT1内核，但这一代最强大的GT3e内核只有酷睿i7-4770 r和酷睿i5-4670 r这两种台式机级处理器。但是，这两个都没有市售，是面向OEM市场的产品。

Gen8:BroadwellBroadwell-H内部结构

Broadwell主要面向移动市场，在桌面零售市场上只有两个CPU。酷睿i7-5775 c和酷睿i5-5675 c采用英特尔目前功能最强大的Iris Pro 6200内核，配备128 MB edram高速缓存，无需倍频锁定即可超频。

broad well gen8GPU体系结构示意图

Broadwell使用的是Gen8图形核心。 Intel重新设计了Subslice单元，每组的欧盟单元从以前的10个降至8个。在同一个采样器和调度器下，这意味着每个欧盟单元的效率都提高了。补充欧盟的数量可以通过增加Subslice单元的总数来实现。因此，在Broadwell的一组Slice单元中有3组Subslice单元，EU单元的总数为24个，在Broadwell的GT1、GT2、GT3核显中分别有12个、24个、48个EU单元

台式机零售版上的两个Iris Pro 6200是带eDRAM的GT3e内核，由于内核规模大幅提升，酷睿i7-5775 c的核心性能比前一代酷睿i7-4790 k提高了近80%，性能在悬挂后得到了修复

Gen9:SkylakeSkylake处理器核心

Skylake使用的Gen9代GPU在很多方面与Gen8相似，一组SubSlice单元仍然是24个EU，但是可以扩展到最多3组slice单元。也就是说，由于最多将搭载72个EU单元，Skylake也会出现很多GT4水平的核。

GT4核表示可支持3组Slice单元、72个EU单元

Skylake的Gen9体系结构支持图形规范，如DX12、OpenCL 2.x、OpenGL 5.x和Vulkan，并支持新的4W-65W编译器堆栈。 Gen9还支持HEVC/H.265、AVC、SVC、VP8、MJPG硬件加速和相机原始架构。

对于多媒体，Gen9架构支持单个固定功能单元以降低功耗，快速同步转码单元也设计了固定功能的编码器以降低功耗、延迟。此外，Gen9的视频解码、转码加速还支持hevc(h.265 )、VP8、MJPEG等标准。

在Skylake处理器上启用新的核显示命名

不过，GT3/GT3e/GT4e这样的高性能核显示只用于移动版处理器，桌面版的Skylake处理器基本上使用的是24EU的GT2，虽然性能比桌面版Haswell有所提升，但幅度还是比较大的另外两个“p”后续处理器使用的是GT1核显。

gen9.5:kaby lake/coffee lake/comet lake要说gen 9.5核显，不得不说是和大家一起度过了多年的HD/UHD Graphics 630。使用kabylake、Coffee Lake、cometlake三代体系结构，实现桌面的

Gen9.5增强了视频的硬件解码功能，使用更强大的MFX多媒体编解码器硬件模块，提供10位hevc、8/10位vp9视频格式的硬件解码、10位hevc、8bivc 添加了对IntelwirelessHD显示技术的支持。提高提高了AVC编码效率。

通过在VQE视频质量引擎中支持HDR和SDR以及对Rec.2020更广色域的支持，输出视频的颜色现在具有可塑性。第八代酷睿处理器从HD Graphics更名为UHD Graphics，实际上是因为视频输出接口支持HDMI 2.0/HDCP 2.2标准，并没有太大的变化。

但是，在Gen9.5核出现后，由于Intel自身的10nm工艺难产，Gen10核与Cannon Lake处理器一起胎死腹中，Gen9.5核显从2017年开始服务至今。

在Gen11:Ice Lake沉寂多年之后，Intel的10纳米工艺终于成熟了。 Ice Lake架构与Gen11核显一起出现，得益于10nm工艺的高晶体管密度，Gen11的EU数最多可达64组EU，核显首次达到1TFlops的计算性能。

但是，由于Ice Lake处理器仅用于第10代酷睿低功耗处理器，而标准的台式机和移动压力处理器是Comet Lake，因此Gen11核显示的处理器并不多。 Intel提供G1、G4、G7三种配置的核表示，每种配置有32/48/64对欧盟，低端的G1被命名为“UHD”

在体系结构上，Gen11核表示通过增加单一Slice中包含的子Slice来扩大规模，增加周期的计算次数。然后，我们在缓存系统上写了一篇文章，增加了三级缓存的容量。英特尔方面表示，欧盟的三级高速缓存有3MB，本地共享内存也有0.5MB。此外，处理器内存控制器的升级允许使用更高的内存带宽。

官方宣布，与8代酷睿处理器上的Gen9核显相比，平均可提供约1.8倍的帧频。

此外，Gen11内核支持VRS可变速率着色。可以在不重要的画面上节约一定的GPU资源，使这部分的GPU资源参与更重要部分的画面渲染。这样，(提高 )就可以达到总帧数，根据Intel的数据，在支持VRS的游戏中帧数最多可以达到提高%。

在视频接口方面，Gen11内核新支持HDMI 2.0b和DisplayPort 1.4 HBR3，提高了输出的最高分辨率和帧数，并支持HDR。

在视频硬件的编码部分，即在Intel QuickSync特性中使用的独立硬件电路，Gen11内核的显示也得到了很大的改善，现在支持2个HEVC 10-bit并同时编码，对于YUV444，最多可以使用2个

Gen12:XeIntel的第12代显示架构被称为Xe，这是Intel近几年来最具雄心的产品。 Intel将Xe GPU的体系结构描述为可扩展的矢量-矩阵体系结构。其可扩展性使您能够为各种市场提供不同的分支机构体系结构和产品，从面向高性能计算市场的Xe-HPC，到面向数据中心和AI计算的Xe-HPC

Tiger Lake和Rocket Lake处理器中使用的Xe-LP体系结构是Xe体系结构中低功耗产品的一个变种，体系结构的主要关注点是能效，以尽可能低的功耗提供最大的性能

与Tiger Lake-U集成的Xe-LP GPU有6组Slice共96组EU，在规模上比Gen11核大了50%。另一方面，虽然Tiger Lake-H和Rocket Lake上的核显示只有2组Slice共计32组EU，但与Comet Lake处理器相比，图形性能依然提高了50%。

在Xe-LP中，Intel大幅调整了欧盟内部。首先，Gen 11的一对一线程控制单元变成了1比2。这意味着一个线程控制单元实际上负责两个欧盟的任务。再到具体的ALU上，现在每个EU包含8个用于处理浮点或整数指令的ALU，另外还有2个只以扩展数学指令为对象的ALU，从原来的4.4结构变成了8.2，可以并行处理2种指令。

显示引擎有4条4K分辨率级别的处理流水线，支持2条eDP，外部输出接口支持DisplayPort 1.4和HDMI 2.0。当然，具体的输出接口可以是DP和HDMI，也可以是USB-C。其他支持8K输出、HDR10、杜比vision、12位Bt 2020色域、自适应同步等，显示屏刷新率最高可达360Hz。遗憾的是，我们看不到本机的HDMI 2.1支持，制造商有可能会通过中继芯片支持。

在媒体引擎中，整个处理流水线的编解码器性能提高了一倍，颜色深度支持升级到12位，并且支持HDR/Dolby Vision播放。这里的另一个亮点是通过硬件解码支持AV1。这是面向未来的特性。

您现在看到的Xe核显及其DG1独显只是Intel计划的第一部分。如果不出意外的话，今明两年我们将看到面向游戏玩家的Xe-HPG进入市场，届时我们将在独显市场上看到三足鼎立的景象。

其实Intel在初期的CPU和核显的组合上存在一些问题，越强的CPU搭载越强的核显，但实际的需求明显相反。幸运的是，这个问题早就被改掉了。目前的第11代酷睿处理器十分明显，只有四核的Tiger Lake-U配备了拥有96组欧盟的GT2核显。另一方面，Rocket Lake-S和Tiger Lake-H这8核处理器只搭载了32组EU的GT1核显。 Tiger Lake-U因用于轻薄的书籍，无独显，多依赖自身核显，而Rocket Lake-S和Tiger Lake-H多搭载独显

新一代的Alder Lake将继续使用Xe架构，具有较少内核的Alder Lake-P具有更强的GT2级核表示，而具有较多内核的Alder Lake-S具有GT1级核表示，新一代的Raptor Lake将使用改进版关于Xe架构今后将如何发展，英特尔从AMD的图形部门挖了很多人，预计大家实际上会参考AMD的GCN，逐渐优化Xe架构的潜力。当然，在Intel的后台优化Xe的同时并行开发其他架构的GPU也不是不可能的。

上一篇：会计资格评价网官网2023报名入口 http://kzp.mof.gov.cn/list_warning_bm.jsp

下一篇：关于黄色的10句话，让你在赞美秋天的时候不会缺字。

加载中...

超级课堂：英特尔核显是如何进化成Xe的？

相关文章

为您推荐

微软推新补丁：修复英特尔第四代酷睿安全漏洞

十堰星尚教育：武汉五所高校都是百年名校。哪个排名第一？

沉重！十堰四所学校被省里点名！你看，那是你的母校吗？

谈论技术：英特尔近年来最大的成功！超极本和低压酷睿

十堰的家长同学们，这12所双非高校，每所都有一个A类学科，竞争非常激烈。

分批返校！十堰大学已经采取了很多措施为开学做准备。

精品文章

热门推荐