行情频道: 行情 / 知识 / 新股 / 要闻 / 基金 /
刘高畅/杨然国盛计算机想象

核心观点

英伟达的表现和指导都超出了预期,验证 ai 计算长期景气度。1)英伟达2024财年第四季度业绩超出预期,收入达到创纪录 221 亿美元,环比增长 同比增长22% 265%。其中,数据中心业务在 Nvidia Hopper GPU 计算平台和 InfiniBand 在端到端网络的推动下,2024财年第四季度收入达到184 1亿美元创历史新高,环比增长 同比增长27% 409%;同时,2024财年数据中心约 40% 人工智能推理的收入。2)Q1FY25指导超出预期。预计英伟达Q1 FY25总收入240亿美元,上下波动2%。除了业绩和指导,英伟达最大的亮点是,人工智能推理需求在数据中心业务中占40%,这验证了推理阶段的强劲需求,并为市场提供了一剂助推器。

英伟达与贝索斯投资机器人初创公司Figureee共同成立了具体的智能研究小组 AI。1)英伟达高级科学家Jimm Fan在推特上说,他将和Yukee一起工作 Zhu在英伟达成立了一个新的研究小组——GEAR,通用特定的智能体研究。未来,每台移动机器都将是独立的,机器人和模拟智能体将像iPhone一样无处不在。2)此前,英伟达首席执行官黄仁勋在中国台北举行了国际电脑展。(COMPUTEX)自主移动机器人平台ISaacac上演示 AMR,现场视频演示中使用的机器人底盘是9号公司的机器人移动平台。Isaac AMR是一个模拟、验证、部署、优化和管理独立移动机器人团队的平台,包括边缘到云的软件服务、计算和一套参考传感器和机器人硬件,可以加速独立移动机器人(AMR)开发和部署速度,降低成本,缩短产品上市时间。2)根据彭博社,亚马逊合伙人贝索斯、英伟达等大型科技公司将投资人机器人初创公司Figure AI ,为了为人工智能找到新的应用程序,英伟达和亚马逊附属基金将提供5000万美元。

英伟达进入ASIC,推理阶段的计算能力需求继续超出预期。1)据路透社报道,英伟达计划为云计算公司和其他企业设计定制芯片(ASIC)包括先进人工智能在内的新业务部门(AI)处理器。2)根据CSET报告,ASIC为特定用户和特定电子系统的需求而设计制造的集成电路具有体积小、功耗低、可靠性提高、性能提高、保密性增强、成本降低等优点 Chips:What They Are and Why They Matter,与CPU相比,ASIC芯片训练效率约为100-1000倍,速度约为10~1000倍,推理优于GPU。因此,我们认为在谷歌中、一方面,英伟达进入ASIC,有利于抢占市场,避免资源流失;另一方面,也是推理阶段计算能力竞争的早期布局,预计未来计算能力行业将呈现持续的高繁荣趋势。

投资目标:中科曙光、海光信息、浪潮信息、利通电子、新易盛、高新技术发展、中科旭创、工业富联、寒武纪、中国数字、恒为科技、软通动力、润建股份、万马科技、云赛智联、拓息、烽火通信等。

风险提示:技术迭代低于预期,经济低迷超出预期,行业竞争加剧。

报告正文

01英伟达的表现和指导超出预期,继续验证行业的高繁荣

英伟达2024财年第四季度业绩超出预期,数据中心约40%的收入来自人工智能推理。第四季度收入达到创纪录的221亿美元,环比增长22%,同比增长265%。

数据中心业务:Nvidia,2024财年第四季度 Hopper 在GPU计算平台和Infiniband端到端网络的推动下,数据中心的收入达到184亿美元,创历史新高,环比增长27%,同比增长409%。2024财年数据中心约40%的收入来自人工智能推理。

游戏业务:2024财年第四季度收入为28.7亿美元,环比持平,同比增长56%。假期期间,消费者对Nvidia G Force RTXGPU的强劲需求优于我们的预期。年收入为104.5亿美元,增长15%。

专业可视化业务:2024财年第四季度收入4.63亿美元,环比增长11%,同比增长105%,财年收入15.5亿美元,增长1%。本季度的持续增长是由RTX数据架构的丰富组合和GPU的持续增长驱动的。为了支持数据准备、大模型、微调和检索、增强生成等与生成人工智能相关的工作负荷,企业正在更新其工作站。

汽车业务:2024财年第四季度收入为2.81亿美元,环比增长8%,同比下降4%。由于汽车制造商继续采用Nvidia驱动平台,年收入达到10.9亿美元,增长21%,首次突破10亿美元大关。

英伟达的表现和指导超出预期,继续验证行业的高繁荣

Q1 FY25展望超出预期,总收入预计为240亿美元。预计英伟达Q1 FY25总收入240亿美元,上下波动2%;游戏的季节性下降部分将抵消数据中心和专业版本的环比增长;GAPP和非GAPP的毛利率预计分别为76.3%和77%,上下浮动50个基点。随着公司继续投资面前的巨大机遇,2025财年GAPP和非GAPP的运营成本预计将增长30%左右;GAPP和非GAPP的其他收入预计为1.5亿美元,不包括非相关投资的损益;GAPP和非GAPP的税率预计为17%,上下波动为1%(不包括任何离散项目)。

这一次,英伟达到了第四季度的业绩,Q1 除了FY25指南超出预期外,人工智能推理需求占数据中心业务的40%,为市场增添了一剂强心剂。此前,市场对2025年人工智能计算能力进入推理阶段影响英伟达业绩的担忧在一定程度上得到了解决,并继续验证行业的高繁荣。

02成立了具体的智能研究小组,全面参与机器人、游戏和生成基础模型

英伟达高级科学家成立了智能研究小组,建立了通用能力人工智能。杰米米,英伟达高级科学家 Fan在推特上说:“我将和老队友Yukee一起 Zhu在英伟达成立了一个新的研究小组——GEAR,通用特定的智能体研究。未来,每台移动机器都将是独立的,机器人和模拟智能体将像iPhone一样无处不在。正在构建一个基本的智能体:一个具有一般能力的人工智能,可以在许多虚拟和现实世界中学习如何熟练地行动。”

英伟达的表现和指导超出预期,继续验证行业的高繁荣

此前,NVIDIA 创始人兼首席执行官黄仁勋 COMPUTEX 在主题演讲中推出了新的独立移动机器人(AMR)平台 Isaac AMR,它可以为移动机器人带来先进的测绘、独立和模拟能力。现场视频演示 Isaac AMR 9号公司使用的机器人底盘是机器人移动平台RMP Lite 220。Isaac AMR 它是一个模拟、验证、部署、优化和管理独立移动机器人团队的平台。它包括从边缘到云的软件服务、计算,以及一套可以加速的参考传感器和机器人硬件 AMR 开发和部署速度,降低成本,缩短产品上市时间。

英伟达的表现和指导超出预期,继续验证行业的高繁荣

英伟达的表现和指导超出预期,继续验证行业的高繁荣

机器人的开发过程相当复杂,时间长,挑战大,成本高,NVIDIA Isaac 机器人开发平台提供端到端解决方案,降低开发成本,简化开发流程,加快产品部署。缺乏结构化的环境在许多用例和场景中也很常见。NVIDIA Isaac 机器人开发平台解决了这些挑战,端到端解决方案有助于降低成本,简化开发流程,加快产品上市。

英伟达的表现和指导超出预期,继续验证行业的高繁荣

贝佐斯和英伟达将加入我们 OpenAI 投资人形机器人初创公司 Figure。据彭博社报道,亚马逊合作伙伴贝索斯、英伟达等大型科技公司将投资人机器人初创公司 Figure AI ,为人工智能寻找新的应用。通过他的公司,贝索斯 Explore Investments LLC承诺投资1亿美元,微软将投资9500万美元,英伟达和亚马逊附属基金将提供 5,000 万美元。

03英伟达进入ASIC,推理阶段的计算能力需求继续超过预期

英伟达成立了一个新的业务部门,并进入了定制芯片(ASIC)。据路透社报道,英伟达计划建立一个专注于为云计算公司和其他公司定制芯片的计划(ASIC)包括先进人工智能在内的新业务部门(AI)处理器。

英伟达的表现和指导超出预期,继续验证行业的高繁荣

我们认为:

l首先,抓住市场,避免资源流失。英伟达的客户竞相购买英伟达芯片,以便在快速崛起的生成人工智能领域竞争。然而,许多海外科技公司已经开始根据具体需求开发内部处理器。

其次,英伟达进入ASIC领域,是推理阶段计算能力竞赛的提前布局。

ASIC具有体积小、成本低的优点。ASIC是为特定用户和特定电子系统的需求而设计和制造的集成电路。ASIC的特点是面向特定用户的需求。ASIC具有体积小、功耗低、可靠性提高、性能提高、保密性增强、成本降低等优点.

ASIC推理明显优于GPU。根据CSET报告AIC Chips:What They Are and Why They Matter,与CPU相比,ASIC芯片训练效率约为100-1000倍,速度约为10~1000倍,推理优于GPU。

英伟达的表现和指导超出预期,继续验证行业的高繁荣

AIGC浪潮已经到来,进一步促进了对芯片和计算能力的需求。目前,由于互联网公司、云计算提供商和企业客户渴望将生成人工智能应用于自己的业务,计算能力供应短缺已成为该行业的普遍热点。

1、训练侧:GPT3.5对应数千张H100,多模态需求增加数倍至十倍。

GPT3.同级模型大约需要数千张H100进行训练。根据GPU 据Utils报道,Inflection表示,他们使用了大约3500个H100进行训练,与GPT3.5相当的大语言模型。2)同时,对于初创公司来说,需要几千个H100来培训大语言模型,几十个或者几百个H100来微调。

考虑到H100的价格约为每张3-4万美元,计算能力投资约为1亿美元。据快速科技报道,H100的价格约为人民币24万元,对应于每张3-4万美元。考虑到以Inflection为代表的公司的计算能力投资为3500,总投资约为1亿美元。

GPT4或数万张A100,GPT5或数万张H100。1)根据GPU 据Utils报道,GPT4可能在1000-25000张A100上训练。GPT5可能需要25000-5000张H100进行训练。2)GPT4的需求量与GPT3.5大约几千张H100相比,、GPT5等相对成熟的多模态模型的计算能力需求提高了几倍到十倍左右。

2、推理侧:只考虑文字问答场景,需要数万张H100,多模态提升空间广阔。

一、每日访问量:6000万。

2023年6月6日,据《科技创新板日报》报道,根据SimilarWeb的最新数据,2023年4月,OpenAI网站访问次数达到18亿次,每日访问次数约为6000万次。

2)用户平均访问时间:5分钟。

据《科技创新板日报》报道,每次访问时间约为5分21秒。

3)单个token输出所需时间:62.5ms;每秒生成token的数量:16个。

根据百度智能云的一些案例,Batch Size为1时,输出8个token大约需要353ms;Batch 当Size增加到16时,8个token的输出大约需要833ms。输出8个token的时间中值约为500ms(即0.5秒),即单个token的计算时间约为62.5ms(即0.0625秒),每秒生成约16个token。

4)平均实时并发:333.33万token//s。

6000万*(5*60)s*16token/s/(24*60*60)s=33.33万个token/s。

计算能力利用率:20%。

Transformer是自回归模型,这意味着在原始状态下,每生成一个新的token,都需要重新计算所有输入的token。

根据百度智能云技术研究,以175BGPT-3模型为例,输入1000个token,生成250个token:

•Context(即Encoder)阶段激活Shape[B,1000,1288],B是batch_size,第二维是输入token数,第三维是hidden size。

•对于Generation(Decoder)在阶段,由于每个输入输出都是一个固定的token,多个输出token是通过多个循环生成的,因此generation阶段激活shape的第二维度始终为1,generation的激活显存占用率远低于context阶段。

因此,Context是一项计算密集型的任务,而Generation是一项访问密集型存储的任务。这也意味着在推理阶段,由于显存带宽的限制,硬件的计算能力利用率将显著降低。

英伟达的表现和指导超出预期,继续验证行业的高繁荣

英伟达的表现和指导超出预期,继续验证行业的高繁荣

据百度智能云报道,一般来说,在线服务的GPU利用率不高,约为20%。此外,如果部署其用户态方案,确保在线服务的SLA相同,GPU资源利用率可提高到35%。

6)峰值倍数:10倍

推理服务的典型负载模式是一天中峰谷波动明显,短期流量会激增。据百度智能云统计,我们假设峰值倍数约为10倍。

7)计算能力总量:5.83*10^19FLOPS。

2*1750亿参数*333.33万token/s*计算利用率10倍/20%=5.83*10^19FLOPS。

8)H100数量:1.5-6万张。

根据英伟达官网,H1000 SXM INT8、FP16、TF32对应的计算能力为3958TOPS、1979TFLOPS、989TFLOPS对应的H100数量约为1.47、2.95、5.90万张。

英伟达的表现和指导超出预期,继续验证行业的高繁荣

我们认为,目前广泛使用的文本交互只是Chatgpt和AIGC应用形式的开始。语音、图片、视频等多模式的输入和输出可能会给内容创作领域带来革命性的变化。

更广泛的数据形式、更多的应用场景和更深入的用户体验也将大大提高支持人工智能的计算能力需求。英伟达进入ASIC,为推理阶段的计算能力需求提前计划,计算能力可能迎来一个快速扩张的时代。

相关阅读
  • 《我是80年代的后妈》火了,短剧如何实现弯道超车?

    《我是80年代的后妈》火了,短剧如何实现弯道超车?

    最近《我是80年代的后妈》火了。这是一部以穿越为主题的短剧。这部短剧在上线当天被曝充值了2000多万元。与此同时,全网登上了抖音、微博、哔哩哔哩等社交媒体的热门榜单。短剧《土》味爆火短剧,又称“微短剧”、“小剧...

    2024-02-25 09:33:39
  • 中国证监会责令张顺平因使用证券账户组操纵11只股票而被罚款最

    中国证监会责令张顺平因使用证券账户组操纵11只股票而被罚款最

    2月22日,中国证监会一次挂网6份行政处罚书,涉及内幕交易、市场操纵等违法行为。具体来说,五人因内幕交易恒一石化有限公司(以下简称恒一石化)受到处罚,其中陆长水、张伟阳被中国证监会罚款约2595万元。六人因操纵市场而被罚...

    2024-02-25 09:34:45
  • CJ煤炭指数上涨5.03%,云煤股份(10.12%)

    CJ煤炭指数上涨5.03%,云煤股份(10.12%)

    截至2月22日收盘,CJ煤炭指数上涨5.03%,在32个行业中排名第一。云煤股份(10.12%),平煤股份(+10.02%)、新能源(+9.30%)、山西焦煤(+8.83%)涨幅最高。#安全监管刺激市场情绪+高股息风格占主导地位,共同加持煤炭涨幅引领市场...

    2024-02-24 19:01:45
  • 股票最新资讯动态,投资机会在这里!

    股票最新资讯动态,投资机会在这里!

    记录今天的操作,大家一起学习进步!①人工智能-OpenAI发布了第一个文学视频模型Sora,可以使用文本指令生成一分钟的高清视频;《经济日报》:中央企业需要加快人工智能的发展 (AI视频/信雅达、国脉文化、华阳联众、维海德等。...

    2024-02-25 18:27:20
  • 紫光股份发布新IM2210-NB模块,让通信模块真正全国化,股票行情分析

    紫光股份发布新IM2210-NB模块,让通信模块真正全国化,股票行情分析

    第10 紫光股份的增长能力:收入复合增长11.02%,非净利润复合增长2.85%。经营净现金流复合增长为负主要产品:ICT基础设施和服务是最重要的收入来源,收入占68.82%,毛利率25.44%。公司亮点:紫光股份旗下新华三集团正式发布新...

    2024-02-25 18:35:22

本文英伟达的表现和指导超出预期,继续验证行业的高繁荣由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们! 分享到: 新浪微博 微信

扫描左侧二维码
看手机移动端,随时随地看 股票 新闻