英特尔的承诺之一就是用它的新x制作e GPU系列是,它的各种形式,它将迎合从集成图形的范围,一直到超密集超级计算机所需的高性能计算模型。这意味着支持简单图形,复杂图形,射线跟踪,AI推论,AI培训以及进入分子建模,油气,核反应堆,火箭,核火箭和所有的计算的计算类型的计算更多的大问题,更多计算提供更多功能。坐在英特尔顶部附近’s offerings is the Xe-生命值架构,旨在为标准服务器和企业部署提供高性能GPU。

过去几周的英特尔已经提供了X的一些技术细节e-生命值,追随Raja Koduri,在他的社交媒体概况中显示出来。我们知道它被设计为是一个模块化的架构,使用英特尔连接不同的小芯片’S嵌入式多模互连桥技术。我们也知道,由于英特尔的披露’S结构日,它设置为在英特尔建立’S 10nm增强的超灰(10ESF,以前10 ++,以前10 +++)制造过程,我们认为是2021年底的过程。 Raja Koduri在建筑日演示期间承诺xe-hp(和xe-生命值G)将于2021年提供。

英特尔解释说,模块化的XE-HP设计将从一到四个瓷砖扩展,XE-HP的概念是‘scale everything’,例如执行单元,频率,带宽,IPC和数学能力。我们假设每个瓦片都可以直接访问一些片上存储器 –真正缩放芯片的各个方面 –虽然如何芯片'S HBM2E分配了HASN'是确认的。产品的点是它专为数据中心而设计,因此需要媒体计算以及原始计算,涵盖各种用例。

作为架构日期间示范的一部分,英特尔也展示了它们’在实验室的早期硅中运行了一些基准。早期硅,我们的意思是这些aren’t在最终频率下运行,这是’T最终固件,软件堆栈仍然有一种方法,所以无疑有各个级别都有优化。

首先,英特尔表明X的单个瓦片e-生命值不仅可以实时跨越一个4K60视频,而是十。在演示中,他们有FFMPEG输出,表明演示将每个视频从5332 kB / s转换为3000 kb / s平均值(6000 kb / s max)。

对于Compute,英特尔提供了以下性能编号,作为使用基于OpenCL的CLPeak基准测试的FP32数学的峰GFLOPS。

  • 一个瓷砖:10588 GFLOPS(10.6 TF)FP32
  • 两个瓷砖:21161 GFLOPS(21.2 TF)FP32(1.999x)
  • 四块瓷砖:42277 GFLOPS(42.3 TF)的FP32(3.993x)

我们还从X视频中获取一些其他信息e-生命值。测试是在Linux上完成的,实际上在四平台芯片的版本上完成,但在1T / 2T / 4T模式下运行。这就是为什么在查看视频时,我们可以看到所有三个版本运行在1300 MHz。用于芯片的字符串是‘XeHP HD Graphics NEO’ as well.

视频还显示单个瓷砖有512‘compute units’,而双层图块有1024个计算单元,并且四块有2048个计算单元。虽然英特尔没有人'正式澄清了什么"compute units"在这种情况下意味着,性能象征且证实了它's counting Intel'S执行单位。基于给定的GFLOPS,所述时钟速度和XE架构'S 8管道每次执行单元,带双FMA,英特尔'S Performance数字分别映射到512/1024/2048 EUS。这意味着每个人都有:

  • 一个瓷砖:512 EUS = 4096 ALU(+ 1024扩展数学alus)
  • 两个瓷砖:1024 EUS = 8196 ALU(+ 2048延长数学alus)
  • 四个瓷砖:2048 EUS = 16384 ALU(+ 4096扩展数学ALU)

这假设来自XE-LP的8 + 2的执行单元结构仍然存在。我们知道HP将支持矩阵数学的新XMX指令,以及与AI相关量化级别和FP64。哪个英特尔'S热芯片演示文稿已确认将在EUS中实施作为额外的物理块。

x的后部也有一个镜头e-生命值死亡,Raja也在他的热筹码中显示出来。我们可以玩一个计算别针的游戏。


英特尔 Xe-生命值 4-Tile Rear

英特尔认为,在多瓦策略中实现了计算性能的线性缩放近在咫尺–使用Clpeak至少4T,旨在测量GPU的基准's最大计算吞吐量。那里’这里没有什么可以说瓷砖到瓦片带宽缩放,或者如果这种多平铺策略和瓷砖的NUMA排列具有记忆有限或稀疏数学的敲击效果– Intel’目标只是表明硬件正在运行,它可以提供什么样的峰值计算性能。那里’S也没有关于功耗的单词,或者在演示文稿中,英特尔表示,这里的目标是在单个芯片中提供相当于一个具有最佳TCO的机架级转码系统,获胜性能 - 每美元的瓦特。

Xe-生命值设置为2021年为企业市场提供。

相关阅读

发表评论

41评论

查看所有评论

  • TophatProductions115. - 2020年8月21日星期五 - 关联

    但它可以运行孤岛危机吗?!

    I'我现在看到自己:p
    回复
  • 伊恩蝉联 - 2020年8月21日星期五 - 关联

    我们现在有CPU可以通过现在通过软件渲染运行孤岛危机。不太好,但他们跑了:)

    //www.zamiclub.com/bench/CPU-2020/2755
    回复
  • the_stopher. - 2020年8月21日星期五 - 关联

    它可以重新筛选可重新筛选吗? ;) 回复
  • Kaspar737. - 2020年8月22日星期六 - 关联

    现在更好的问题是"它可以运行Microsoft Flight Simulator吗?" 回复
  • 机械 - 2020年8月21日星期五 - 关联

    基本执行单元的ISA是什么?他们如何获得足够的Bandwitdh和延迟,2000个单位? Knights Mill只有128 x86核心。这是一个减少的指令集吗? 回复
  • 推出 - 2020年8月21日星期五 - 关联

    It'更像是GPU而不是CPU - 但我'我肯定使用某种专有的ISA,其中我不'认为一个名字曾被公开提到,至少不是我的知识。大概"The Xe ISA" 回复
  • spunjji. - 2020年8月24日星期一 - 关联

    It'与x86相比,几乎肯定会降低,因为eus唐'T需要几乎做了许多不同的工作。 回复
  • kimgitz. - 2020年8月21日星期五 - 关联

    当你考虑Nvidia的最新收益时,由于这种细分市场的快速增长,他们赚了更多的钱,而不是以前让游戏段更有利可图。英特尔在某事上。 回复
  • spunjji. - 2020年8月24日星期一 - 关联

    值得注意的是nvidia'在该地区的增长在很大程度上归结为购买Mellanox,否则他们'D仍然从游戏图形中获得显着升高。

    绝对从英特尔举动,但他们'LL需要在nvidia aren的一个地区引人注目't.
    回复
  • nico_mach. - 2020年8月26日星期三 - 关联

    即使英特尔成功,也需要时间才能取消纠正NVIDIA'S CUDA框架和同时,NVIDIA将释放新装备。一世'不,英特尔的粉丝(过去几年的神纳吉人一直是侄子)'很高兴在这里看到更多的竞争。

    二次问题是这个市场的成长程度真的是多少。我理解个人助理和互联网初创公司有高原'D和全球经济现在是一个大问题标志,美国市场是一个双重问号。
    回复

登录

没有帐户? 立即注册