采用COWOS-S中介层技术的台积电N5工艺
Posted: Thu Dec 05, 2024 7:21 am
在 Ignite 2023 大会上,微软首先谈到了开发自己的 AI 加速器芯片 Maia,并在活动前不久公布了 Maia 100 的规格。 Maia 100 是最大的 TSMC 处理器之一,采用 5 纳米节点,专为 Azure 中的繁重工作负载而设计。
Maia 100 具有以下特性:
芯片尺寸 - 820 mm2;
案例——采用COWOS-S中介层技术的台积电N5工艺;
HBM BW/Cap - 64 GB HBM2E 时为 1.8 TB/s;
峰值密集张量 POPS - 6 位:3、9 位:1.5、BF16:0.网络分析软 立陶宛电话号码列表
件Wireshark 4.4.0最近发布。该工具的 4.0.0 版本于 2022 年秋季发布,下一版本于 2023 年发布,4.2.6 版本于 7 月发布。该分析仪的第一个稳定版本可以追溯到 2008 年。
Wireshark 4.4.0 修复了以前版本中发现的重要错误。此外,新版本的分析器还将包含一些协议的更新、对自动配置文件切换的支持以及对项目代码的许多其他添加。
一些更改还会影响 I/O 图形、TCP 流、VoIP 呼叫以及其他对话框和界面。该工具的新版本增加了对使用 zlib-ng 构建的支持以及对 Lua 5.3/5.4 的支持。
新版本的Wireshark支持以下协议:MatterBTP、AT RL、BEER、iRDMA-EDP、NMEA 0183、SAPRFC、ZMTP、SANE、RF4CE Profile、ZMTP、SAPRFC、RF4CE、rdpear、PLDM、MiWi P2P Star和mac- nr-框架。
更新了对 IPv6 协议的支持,添加了更多地址块属性,并且默认添加了“显示地址详细信息”功能。8;
L1/L2 - 500MB;
后端网络带宽 - 600 GB/s (12X400 GB);
主机带宽 (PCIe) = 32 GB/s PCIe Gen5X8;
TDP要求——700W;
TDP - 500W。
Microsoft Maia 100 采用垂直集成来优化成本和性能,以及带有专门开发的机架和软件堆栈的定制服务器主板以提高性能。

SoC Maia 100 具有以下架构:
用于训练和输出处理的高速张量模块,支持多种数据类型 16xRx16。
矢量处理器作为松散耦合的超标量引擎,采用指令集架构 (ISA) 设计,支持多种数据类型,包括 FP32 和 BF16。
支持各种张量分割方案的直接内存访问(DMA)。
异步编程通过
硬件信号量。
L1和L2由软件管理,以实现更好的数据利用率和能源效率。
Maia 100 利用基于以太网的连接和类似 RoCE 的自定义协议进行极高带宽计算,支持高达 4800 Gbps 的全聚集和散射减少带宽,以及高达 1200 Gbit 的全对全带宽/s。
Maia SDK 支持将 PyTorch 和 Triton 模型快速移植到 Maia,并提供轻松部署到 Azure OpenAI 服务的工具。开发人员可以使用 DNN 的 Triton 编程语言或 Maia API 来优化性能。该 SDK 还原生支持 PyTorch 模型。
Maia 100 具有以下特性:
芯片尺寸 - 820 mm2;
案例——采用COWOS-S中介层技术的台积电N5工艺;
HBM BW/Cap - 64 GB HBM2E 时为 1.8 TB/s;
峰值密集张量 POPS - 6 位:3、9 位:1.5、BF16:0.网络分析软 立陶宛电话号码列表
件Wireshark 4.4.0最近发布。该工具的 4.0.0 版本于 2022 年秋季发布,下一版本于 2023 年发布,4.2.6 版本于 7 月发布。该分析仪的第一个稳定版本可以追溯到 2008 年。
Wireshark 4.4.0 修复了以前版本中发现的重要错误。此外,新版本的分析器还将包含一些协议的更新、对自动配置文件切换的支持以及对项目代码的许多其他添加。
一些更改还会影响 I/O 图形、TCP 流、VoIP 呼叫以及其他对话框和界面。该工具的新版本增加了对使用 zlib-ng 构建的支持以及对 Lua 5.3/5.4 的支持。
新版本的Wireshark支持以下协议:MatterBTP、AT RL、BEER、iRDMA-EDP、NMEA 0183、SAPRFC、ZMTP、SANE、RF4CE Profile、ZMTP、SAPRFC、RF4CE、rdpear、PLDM、MiWi P2P Star和mac- nr-框架。
更新了对 IPv6 协议的支持,添加了更多地址块属性,并且默认添加了“显示地址详细信息”功能。8;
L1/L2 - 500MB;
后端网络带宽 - 600 GB/s (12X400 GB);
主机带宽 (PCIe) = 32 GB/s PCIe Gen5X8;
TDP要求——700W;
TDP - 500W。
Microsoft Maia 100 采用垂直集成来优化成本和性能,以及带有专门开发的机架和软件堆栈的定制服务器主板以提高性能。

SoC Maia 100 具有以下架构:
用于训练和输出处理的高速张量模块,支持多种数据类型 16xRx16。
矢量处理器作为松散耦合的超标量引擎,采用指令集架构 (ISA) 设计,支持多种数据类型,包括 FP32 和 BF16。
支持各种张量分割方案的直接内存访问(DMA)。
异步编程通过
硬件信号量。
L1和L2由软件管理,以实现更好的数据利用率和能源效率。
Maia 100 利用基于以太网的连接和类似 RoCE 的自定义协议进行极高带宽计算,支持高达 4800 Gbps 的全聚集和散射减少带宽,以及高达 1200 Gbit 的全对全带宽/s。
Maia SDK 支持将 PyTorch 和 Triton 模型快速移植到 Maia,并提供轻松部署到 Azure OpenAI 服务的工具。开发人员可以使用 DNN 的 Triton 编程语言或 Maia API 来优化性能。该 SDK 还原生支持 PyTorch 模型。