12/20/2024,光纤在线讯,利来w66字节跳动正在开发两款专门用于人工智能领域的GPU,并计划到2026年实现大规模量产。据悉,这两款AI GPU将由台积电负责制造,这将有助于字节跳动降低对英伟达的依赖,并且符合美国的出口管控法规。
??目前,这两款GPU正处于设计阶段,一款专为AI训练设计,另一款则用于AI推理。预计它们将采用台积电的先进制程技术N4或N5生产,与英伟达的Blackwell系列制程技术相似。字节跳动期望在2026年实现这些GPU的大规模生产及部署。
??今年,字节跳动已经投入超过20亿美元购买超过20万台英伟达H20 GPU,单价约为10000美元,其中许多订单尚未交付。由于市场上英伟达GPU供不应求且价格高昂,字节跳动决定开发自家的人工智能硬件。
??英伟达为了应对去年美国实施的出口管控政策,为中国市场特别设计了DGX H20等产品。尽管HGX H20的性能相比英伟达的高端H100有所削减,但它仍然配备了96GB的HBM3内存、最高4TB/s的内存带宽和8路GPU互联能力,因此在实际应用中仍然受到企业客户的青睐。尽管字节跳动的新GPU可能会受到美国出口管制的限制,无法在性能上超越HGX H20,但其成本将大幅降低。
??字节跳动在自主开发AI GPU方面面临的最大挑战是,公司目前依赖英伟达的CUDA及相应软件栈进行AI训练和推理。如果转向自家GPU,字节跳动将需要开发新的软件平台,并确保软件与硬件的兼容性。
??此外,有消息称,苹果被曝与腾讯和字节洽谈AI模型合作,腾讯不予置评,字节暂无回应。
??12月19日,有报道称苹果正在和腾讯和字节跳动商谈将两家公司的人工智能模型整合到在中国销售的iPhone中,但谈判仍处于早期阶段。12月19日,腾讯方面就此向记者表示:“不予置评。”字节跳动暂无回应。