英特尔推出新款AI芯片:推理性能比英伟达H100快50%
来源:龙8国际 更新时间:2024-11-02 04:32:36
美国当地时间4月9日,英特英伟英特尔在面向客户和合作伙伴的尔推英特尔on产业创新大会上,英特尔CEO帕特·基辛格亮出了最新AI芯片——Gaudi 3。出新
英特尔表示,款A快Gaudi 3 AI加速器可通过以太网的片推通用标准连接多达数万个加速器。与上一代产品相比,理性英特尔Gaudi 3将带来4倍的英特英伟BF16 AI计算能力提升,以及1.5倍的尔推内存带宽提升。该加速器将为寻求大规模部署生成式AI的出新企业带来AI训练和推理方面的重大飞跃。
英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,款A快以及1750亿参数GPT-3模型的片推训练时间。
英特尔表示,理性Gaudi 3能够比英伟达上一代H100处理器训练特定大型语言模型的英特英伟速度快40%,在推理端比英伟达H100快50%。尔推
基辛格在现场表示,出新Gaudi 3的性能将与英伟达H200相当,在某些领域的性能甚至会更好。但是他没有给出具体数据。
值得注意的是,外媒指出,H100是英伟达Hopper产品线中的老款芯片,在2022年发布。英伟达在去年又发布了H200,将于今年二季度正式开售,2024年3月英伟达展示了新的Blackwell B100和B200芯片。
英特尔表示,Gaudi 3已经在Meta大模型Llama上做了测试,可以有效地训练或部署AI大模型,包括文生图的Stable Diffusion和语音识别的Whisper等等。
在现场,基辛格也展示了集成最新英特尔芯片的AI PC,能够快速处理的多项任务,例如快速处理邮件、语音处理、图像渲染等。
据了解,英特尔Gaudi 3采用台积电5纳米工艺制造。英特尔Gaudi 3将于2024年第二季度面向OEM厂商出货,包括戴尔、惠普和超微电脑在内的公司将使用该芯片。
当天,英特尔还分享了企业AI各细分领域的下一代产品和服务的最新信息。英特尔为面向数据中心、云和边缘发布了下一代处理器英特尔至强6。配备能效核(E-cores)的英特尔至强6处理器将于2024年第二季度推出,配备性能核(P-cores)的英特尔至强6处理器将紧随其后推出,带来更高的AI性能。
英特尔想要打造一个广泛的AI生态联盟,推动企业在AI领域创新。
英特尔概述了面向开放的、可扩展的AI系统的战略,其中包括硬件、软件、框架和工具。当天,英特尔联合多家公司宣布,将创建一个开放平台助力企业推动AI创新。这一计划旨在开发开放的、多供应商的生成式AI系统,通过RAG(检索增强生成)技术,提供部署便利性、性能和价值。RAG可使企业在标准云基础设施上运行的大量现存专有数据源得到开放大语言模型(LLM)功能的增强,加速生成式AI在企业中的应用。
进入4月以来,英特尔股价累计跌幅超过13%。外媒指出,新的人工智能芯片能否帮助英特尔找到股价上涨的动能值得关注,在9日盘中,英特尔一度下跌1.7%,或创出约三年半来最差六日表现,但在发布新的芯片后,英特尔股价开始上涨。截至9日美股收盘,英特尔收涨0.92%,市值1632亿美元。