芯片制造非常精密但是也并不完美

文章图片

芯片制造非常精细但是也并不完美 

PC(例如 CPU 或 GPU)、手机或汽车中使用的每个芯片都经过选择过程。这是因为一些芯片在制造后会比其他芯片表现更好。

英特尔、AMD 和 Nvidia 等所有芯片制造商都采用了一个选择过程,其中性能更高的芯片被指定为更昂贵的型号(提供更高的时钟速度、更多的内核等)和不太完美的部件,但仍可充分利用硅可以作为禁用内核或较低速度的低性能处理器出售。如果芯片不能以 2 GHz 运行,那么可以将其作为以 1.5 GHz 运行的芯片出售。或者,如果 CPU 显示集成显卡部分存在缺陷,则将其作为没有集成显卡的 CPU 出售。

芯片分bin是所有微处理器和 DRAM 芯片制造过程中发生这种分离的一个阶段。虽然常规的芯片分bin是为了让制造商受益,但如果对给定的价值/主流模型的需求太多,你可能会很幸运,最终会得到功能强大的硅/芯片,作为更便宜的部分出售。分Bin还可以提高晶圆的产量,因为可以利用和销售更多的硅,从而降低制造成本。本文更深入地介绍了芯片制造过程以及做出某些决定的原因。

 为之而死的晶圆

所有芯片均由超纯硅圆盘制成,层叠金属、绝缘体和半导体材料,无论是标准CPU、CPU,还是成为系统内存的DRAM 。

整个过程非常复杂,大批量生产最新芯片所需的制造工厂耗资数十亿美元。这些光盘被称为晶圆,英特尔、GlobalFoundries 和台积电等公司每年生产数百万片。需要最高质量的工具来确保最终产品与设计芯片的工程师的超精确计划相匹配。

为了使一切尽可能接近完美,工厂的生产区域会稍微加压,以防止空气中的细菌和灰尘颗粒进入房间。工人们穿着防护装备,以确保尽可能少的皮肤细胞和头发进入机器。

完成的晶圆是一件美丽的东西,也非常有价值。每一个制造成本都高达数千美元,整个制造过程——从硅锭到产品——从开始到结束需要几个月的时间。可以从光盘中取出并出售的每个芯片对于弥补制造它们所花费的资金至关重要。 

CPU芯片.png

英特尔第 9 代酷睿处理器的300 毫米晶圆

为了将芯片取出来,需要使用金刚石锯将晶圆切成薄片,但其中相当一部分完全是废料,因为沿边缘的芯片并不完整。5% 到 25% 的晶圆(数量在很大程度上取决于芯片的尺寸)将被丢弃。然后将其余部分安装在电路板封装上,并可能覆盖有散热器,最终成为我们都熟悉的 CPU。

核心(不)平等

让我们来看看英特尔的一款相对现代的处理器——旧的酷睿 i9-10900K,它有 10 个核心和一个集成 GPU。下图显示了我们通常如何了解和看到此类 PC 组件,但如果我们能够打开散热器并使用一组工具深入研究芯片的内部结构,它看起来就会大不相同。实际的CPU是一个由逻辑块、SRAM 存储、接口和通信总线组成的城市景观——仅在一个芯片中,就有数十亿个独立的电子元件,所有这些电子元件都在同步和谐地工作。 

芯片平台.png

下面标记的图像突出了一些关键区域——最左边是 I/O 系统,包含 DDR4-SDRAM 内存、PCI Express 和显示控制器。还包含管理所有核心的通信环的系统。I/O 部分的正上方是系统内存的接口,在管芯的另一侧,我们可以看到集成图形芯片 GPU。无论你得到什么样的英特尔酷睿处理器,这三个部分都会存在。


IC芯片平台.png


在所有这些之间的是 CPU 内核。每一个都是另一个的副本,充满了处理数字、移动数据和预测未来指令的单元。位于内核两侧的是两条3 级缓存(较低级别位于内核深处),每个都提供 1 MB 的高速存储。

人们可能认为英特尔会为他们销售的每个 CPU 制造一个新的晶圆,但一张“i9-10900”光盘将生产出可能最终出现在以下任何一种型号中的芯片。

以 GHz(千兆赫兹)为单位测量的“基本时钟”是芯片运行的最低保证频率,无论其负载如何。“All Core Turbo”是所有内核可以一起运行的最大频率,但不一定保持很长时间。这与“Turbo Boost”类似,只是它只有 2 个内核。

PL1 TDP 代表功率级别 1 - 热设计功率。它是 CPU 在任何负载下以其基本时钟运行时会产生多少热量。它可以创造更多的东西,但它会限制芯片的运行速度,当插入主板时,它们的设计者可能会限制芯片可以吸收的功率,以防止这种情况发生。

代码以 F 结尾的模型具有禁用的 GPU;K 表示它有一个未锁定的时钟系统(因此可以轻松超频),T 表示低功耗。这些只是台式机 CPU,有些最终会成为针对专业市场的 Xeon 型号,以工作站或小型服务器的形式出现。

所以这只是一个设计的 19 个模型——一个芯片如何以及为什么最终变成这么多不同的类型?


这是一个不完美的世界


尽管芯片制造厂令人难以置信,但无论是它们还是所使用的技术和材料都不是 100% 完美的。总会有一些纳米级的碎屑微粒,无论是在工厂内部还是在所使用的原始硅和金属的深处。无论他们多么努力,制造商都无法使它们完全干净和纯净。

当试图构建非常小的组件时,只有高倍电子显微镜才能让你看到它们,没有什么能完全按照它应该做的表现。在纳米世界中,量子行为变得更加明显,随机性、噪声和其他故障竭尽全力破坏芯片叠叠乐的微妙游戏。所有这些问题都对处理器制造商不利,最终结果被归类为缺陷。 

CPU晶圆.png

用于查找缺陷的图像比较与光散射方法。来源:日立高新技术

并不是所有的缺陷都是严重的——它们可能只会导致芯片的特定部分比它应该运行的更热,但如果它真的很糟糕,那么整个部分可能完全是垃圾。制造商做的第一件事就是首先扫描晶圆以查看缺陷。

专门用于解决这些问题的机器是在晶圆制造之后但在将其切成单个芯片之前使用的。显示有问题的管芯或整个晶圆被标记出来,因此可以将它们放在一边进行进一步检查。但即使是这些步骤也无法捕捉到每一个小瑕疵和故障,因此在从晶圆上切下硅片并将其安装到它们的封装上后,每个硅片都会进行更多测试。

 

不同的bin差别何在?

当英特尔和其他公司坐下来检查处理器的质量时,他们将芯片设置为以设定的电压和特定的时钟速度运行;die经过一系列基准测试,旨在对所有各个部分施加压力,仔细测量消耗的电功率和产生的热量。他们会发现,有些芯片完全按照要求运行,而另一些则更好或更差。

处理器CPU.png

在最终测试和检查之前组装处理器

一些芯片可能需要更高的电压才能完全稳定,其他芯片的内部可能会产生过多的热量,并且可能有些根本无法达到要求的标准。厂商会对被确定为有缺陷的处理器进行类似的探索,但在进行之前,会执行额外的检查以查看芯片的哪些部分仍然有效以及哪些位是废料。其最终结果是,晶圆的有用输出(称为良率)会产生一系列裸片,可以根据它们的功能部件、稳定的时钟频率、所需电压和热输出对它们进行分类。这个排序程序的名称就叫芯片分bin。

实际上没有die被扔进某个箱子里,这个短语来自统计学,其中数字分布可以组织成称为bin的组。例如,关于年龄分布的人口调查可能会使用 0 到 5 岁、6 到 10 岁、11 到 16 岁等区间。

晶圆也是如此,在我们的 i9-10900K 示例中,一些 bin 用于工作内核的数量、CPU 稳定的时钟频率范围以及特定时钟的热输出。假设一个 Core i9-10900 芯片经过全面测试,发现有几个严重缺陷,如上所述。其中两个内核和 GPU 损坏到无法正常运行的程度。

然后英特尔将禁用 kaput 部分并将其标记为 Core i7-10700 系列的芯片,特别是 F 型号。但随后需要测试时钟速度、功率和稳定性。如果芯片达到要求的目标,它将保持为 i7,但如果不能完全达到这些目标,则可以禁用另外 2 个内核,并将芯片用于 Core i5 模型。

对于第 10 代酷睿处理器系列,英特尔确实为酷睿 i5、i3 和奔腾/赛扬系列提供了单独的晶圆设计。这些以 6 核芯片开始,然后被分为 2 个核心产品。

产品需求往往会超过生产能力,因此使用 10 核心晶圆来帮助完成订单。有时,功能完美的模具会关闭部分,以确保工厂有足够的输出。购买特定型号和实际得到的die的关系确实像一个运气游戏。

综上所述,芯片分bin极大地提高了晶圆的良率,因为这意味着可以利用和销售更多的芯片。没有它,英特尔实际的垃圾箱将堆满废硅。

芯片晶圆2.png

被分bin的CPU 有什么特别的吗?

像计算中的许多术语一样,芯片分bin已成为其原始含义以外的同义词。在线商店有时会以“binned CPU”的形式出售挑选的特殊 CPU(那些超锁到疯狂水平或运行温度极低CPU)。事实上,所有芯片都被分bin了,因为它们必须如此。

当然,没有什么可以阻止零售商对他们购买的芯片进行分bin。AMD 和 Intel 处理器必须批量购买(包含数十个甚至数百个芯片的订单)。可以坐下来测试计算机并检查每一个芯片的超频或降压,记录它们的温度等等。然后可以将这批产品中最好的作为特殊产品出售,零售商可以将它们正确地归类为“binned”。当然,所有这些额外的测试都需要花费时间和精力,因此零售商提高了产品的零售价。

这些所谓的被bin的芯片是否在某种程度上很特别?是也不是。每个人的电脑、手机、汽车等中使用的每一个芯片都经过了某种选择过程。这只是所有微处理器和 DRAM 芯片制造的另一个阶段。


相关文章

发表评论

评论

    暂无评论

©Copyright 2013-2025 亿配芯城(深圳)电子科技有限公司 粤ICP备17008354号

Scroll