📢 Gate广场 #NERO发帖挑战# 秀观点赢大奖活动火热开启!
Gate NERO生态周来袭!发帖秀出NERO项目洞察和活动实用攻略,瓜分30,000NERO!
💰️ 15位优质发帖用户 * 2,000枚NERO每人
如何参与:
1️⃣ 调研NERO项目
对NERO的基本面、社区治理、发展目标、代币经济模型等方面进行研究,分享你对项目的深度研究。
2️⃣ 参与并分享真实体验
参与NERO生态周相关活动,并晒出你的参与截图、收益图或实用教程。可以是收益展示、简明易懂的新手攻略、小窍门,也可以是行情点位分析,内容详实优先。
3️⃣ 鼓励带新互动
如果你的帖子吸引到他人参与活动,或者有好友评论“已参与/已交易”,将大幅提升你的获奖概率!
NERO热门活动(帖文需附以下活动链接):
NERO Chain (NERO) 生态周:Gate 已上线 NERO 现货交易,为回馈平台用户,HODLer Airdrop、Launchpool、CandyDrop、余币宝已上线 NERO,邀您体验。参与攻略见公告:https://www.gate.com/announcements/article/46284
高质量帖子Tips:
教程越详细、图片越直观、互动量越高,获奖几率越大!
市场见解独到、真实参与经历、有带新互动者,评选将优先考虑。
帖子需原创,字数不少于250字,且需获得至少3条有效互动
AI大模型时代网络设备需求爆发 探讨未来创新与投资机遇
网络在AI大模型时代扮演关键角色
大模型时代,光模块、交换机等网络设备迭代加速,需求爆发。本文从原理出发,探讨网络为何成为AI时代的重要一环,并讨论未来网络侧的创新与投资机会。
网络需求来源
模型体积与单卡上限差距拉大,转向多服务器集群训练,构成网络重要性基础。
网络更多用于同步显卡间模型参数,对密度、容量要求提高。
训练耗时=数据规模x参数量/计算速率。计算速率=单设备速率x设备数x并行效率。扩大设备数和并行效率成为关键。
多卡同步复杂:每次计算后需对齐,All-to-All操作常见,对传输和交换要求高。
故障成本高:训练持续数月,中断需回到断点重新训练,网络稳定性至关重要。
网络创新方向
通信介质:光、铜、硅介质更新,LPO、LRO、硅光等降本技术发展。
网络协议:片间通信与节点间通信协议竞争。
网络架构:叶脊架构向Dragonfly、rail-only等新架构演进。
投资建议
通信系统核心环节:中际旭创、新易盛、天孚通信、工业富联、英维克、沪电股份。
通信系统创新环节:长飞光纤、太辰光、源杰科技、盛科通信-U、寒武纪、德科立。
风险提示
网络重要性认识
通信在AI时代重要性体现在:
显卡数量和连接效率决定训练时间,时间是竞争关键资源。
训练中每层运算后需对齐参数,对网络要求极高。
网络故障成本高,中断会严重影响训练效率和成本。
集群规模达万卡,连接部件数十万,系统稳定性要求高。
网络创新方向认识
降本、开放和算力规模平衡是主要议题。
通信介质创新:光、铜、硅介质进步,LPO、LRO、硅光等新技术。
通信协议创新:节点内(如NVLINK)和节点间(IB vs 以太网)协议竞争。
网络架构更新:叶脊架构向Drangonfly、Rail-only等新架构演进。
从云计算到AI时代,通信重要性提升
AI对网络连接需求爆发,参数规模膨胀导致单卡无法承载。
训练耗时=数据规模x参数量/计算速率,堆叠算力成为关键。
计算速率=单设备速率x设备数x并行效率,设备数和并行效率变得同样重要。
网络成为提升设备数和并行效率的关键,英伟达收购Mellanox即为此考虑。
大模型训练中的多卡合作
数据并行:每GPU保留完整模型,分割数据训练。
模型并行:将模型分割到不同GPU,包括张量并行和流水线并行。
多维混合并行:结合多种并行方式,划分多个Stage进行训练。
各种并行方式均需进行参数同步,对网络提出不同要求。
多卡互联核心:同步的准确率
反向广播进行参数对齐,All-to-All延迟是关键指标。
同步方式包括同步并行、异步并行、All-Reduce等。
Ring All-Reduce等优化算法可降低带宽和延迟。
需要网络硬件支持,如NVLink、IB协议等。
系统工程:监测-总结-创新的迭代
需要实时监测数据流动、运行态势。
软硬件抓包是主要监测手段,如Wireshark等。
DPI/DFI等硬件串并接技术可实现无损监测。
基于监测结果不断优化系统稳定性和效率。
通信协议的竞争与迭代
节点内通信:PCIe、NVLink、Infinity Fabric等。
节点间通信:InfiniBand vs 以太网RoCE协议族。
RDMA成为AI集群连接的刚需。
英伟达IB协议vs AMD领衔的超以太网联盟。
网络硬件创新方向
传输介质:光、铜、硅之争,性价比和稳定性是关键。
交换机:光交换机兴起,电交换机芯片创新。
网络架构:叶脊架构向Dragonfly、Rail-only等演进。
数据中心集群:跨数据中心互联成为新焦点。
投资建议
关注交换机、光模块等基础硬件。
跟踪LPO、CPO、特种光纤等新技术带来的机会。
关注国产交换机加速进化的机会。
风险提示