要闻频道: 行情 / 知识 / 新股 / 要闻 / 基金 /
第一,苹果在等什么缺席大模型?

2022年底,ChatGPT “大模型”的诞生使“大模型”成为全球科技领域的关键词。整个2023年,所有模型玩家都在使用它 GPT-4 追赶作为目标。原因很简单。在这场先发制人游戏中,推理能力被认为是唯一的衡量标准。

苹果无疑是世界上所有科技公司中的“替代品”。在所有主流智能手机制造商甚至全球科技公司中,苹果是唯一一家尚未正式发布大型产品的制造商,甚至很少积极提及。就连马斯克去年7月成立的人工智能公司XAI也将立即发布第一款人工智能大型Grok 1.5。

在披露苹果大模型进展的有限信息中,苹果给人一种感觉,苹果不追求绝对领先的大模型性能,而是更关注大模型着陆的可能性。

二、发力多模态

之前有一个笑话(也可能是真的),说大模型无法获得人机验证,因为人工智能被设置为无法撒谎,所以无法选择“我不是机器人”。

去年10月,苹果还以论文的形式公布了一项研究成果:Feret大模型,自行完成了谷歌人机验证。

苹果大模型对未来智能应用场景的前瞻性

远远领先于GPT4。

不久前,苹果公布了更多Ferret模型的细节和功能。

苹果大模型对未来智能应用场景的前瞻性

与GPT4相比,Feret的领先地位在于,它不仅能准确识别和处理图像内容,还能用算法区分图像中的各种元素(人、物等)。),并根据用户指令找到相应的元素。

苹果大模型对未来智能应用场景的前瞻性

这种多模态理解能力使Feret能够同时处理用户输入的图像和自然语言,而Feret能够准确地理解图像中的元素,如“图像右上角”,因为它的算法能够准确地分割和定位图像中的元素、“靠近沙发”这样的指令。

苹果大模型对未来智能应用场景的前瞻性

与疯狂的自然语言处理相比,这种基于图像的交互使信息更加直观。

苹果大模型对未来智能应用场景的前瞻性

第三,苹果首次宣布其第一个大模型系列MM1

最近,苹果研发团队成员发表了一篇题为《MM1》的文章: Methods, Analysis & Insights from Multimodal LLM Pre-training》该论文正式展示了其300亿参数多模态大模型(MLLMs)。在研究中,研发团队专注于如何构建高性能、多模式、大模型,重点研究各种架构组件和数据选择的重要性。通过仔细、全面地剥离图像编码器、视觉语言连接器和各种预训练数据的选择,团队总结了一些关键的设计经验。R&D团队建立了一系列多模式模型MM1,其中模型的最大参数为300亿。据说这些模型在预训练指标中是“最先进的”,在一系列已经建立的多模式基准测试中,经过监督和微调,实现了“有竞争力”的性能。

通过扩大显示配方,他们构建了 MM1 包括密集模型和专家混合在内的系列多模态模型(MoE)这些模型在预训练指标中实现了变体 SOTA,并在监督微调后,在一系列既定的多模态基准测试中表现出竞争力。由于大规模预训练,MM1 它具有吸引人的特点,如提高上下文学习能力和多图像推理能力,使其能够通过少量样本提示进行思维链推理。

这篇论文向业界详细介绍了他们的实验方法:

● 架构:研究团队调查了各种预训练的图像编码器,并以不同的方式探索了这些编码器和语言模型(LLMs)整合策略。

● 数据处理:分析了各种数据类型及其在模型训练中的相对重要性,以确定其混合重量。

● 培训策略:详细讨论了多模态大型语言模型(MLLM)训练过程,包括超参数设置和模型的哪些部分应该在什么时候进行训练。

苹果通过对这些关键领域的实证实验和简化,成功评估了不同配置下模型的性能,最终确定了最佳模型和数据配置方案。

四、大模型神仙打架

1.谷歌发布世界模型Genie

2月26日,谷歌牺牲了基本的世界模型——Genie(Generative Interactive Environments)。Genie 是一个 110 基本的世界模型可以通过单个图像提示生成可玩的交互式环境。我们可以用它从未见过的图像来提示,然后与我们想象中的虚拟世界互动。无论是合成图像、照片,甚至是手绘草图,Genie 它可以产生无尽的可玩世界。

2.英伟达最强通用大型Nemotron-4登场!

最近,英伟达团队在8T中推出了Nemotron-4、150亿参数的全新模型 训练在token上完成。值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。与相同参数规模的模型相比,在7个评估基准中,Nemotron-4 15B表现出色。即使是性能超过4倍的模型,以及专门用于多语言任务的模型。

大模型时代的到来标志着人工智能技术的新时代。

五、苹果大模型对未来智能应用场景的前瞻性

随着 MM1 苹果在多模式人工智能领域的研究成果显著,不仅展示了其技术创新的实力,而且为未来的应用开发奠定了坚实的基础。苹果公司生成了人工智能(GenAI)深度投资,特别是在多模态大模型的开发中,不仅是对当前技术趋势的响应,也是对未来智能应用场景的前瞻性。

MM1通过整合视觉和语言处理能力 模型有望在多个领域发挥重要作用,包括但不限于增强现实(AR)、虚拟助手,内容创作,教育和娱乐等。

此外,苹果在多模态大模型研究中的进展也可能给其产品线带来创新变化。例如,Siri 通过整合,可以整合功能 MM1 该模型得到了极大的扩展和改进,不仅可以处理语音指令,还可以理解和生成图像内容,为用户提供更丰富、更直观的互动体验。同时,这也为苹果在智能家居、教育技术和娱乐领域的产品提供了新的可能性,使其能够提供更智能、更多样化的服务。

在这个竞争激烈的领域,许多参与者展示了他们的实力,谁能脱颖而出,成为这个行业,值得我们继续关注。海涵金融

六、相关受益标的:

计算能力:高科技发展、神州数码、拓息、泰嘉股份、海光信息、开普云、恒为科技、能科技、科远智慧等;

AI应用:润达医疗、科大讯飞、同花顺、福鑫软件、金山办公、佳发教育、金桥信息、汉仪股份。

相关阅读
  • B100散热模式可升级为液体冷却

    B100散热模式可升级为液体冷却

    事件:黄透露英伟达下一代DGX AI系统将采用液冷技术升级到液冷是一个重要趋势:从功率的角度来看,A100服务器的最大功耗是6.5kw,实际功耗约5kw,H100服务器最大功耗约10kw。随着GPU芯片和人工智能服务器的进一步迭代升级,风...

    2024-03-13 15:41:49
  • 特斯拉年内美股三大指数集体收跌近35%

    特斯拉年内美股三大指数集体收跌近35%

    今日消息面:【特斯拉年内美股三大指数集体收跌近35%】隔夜美股高开低走,三大指数集体收跌。道指跌0.35%,纳指跌0.3%,标普500指数跌0.29%。特斯拉下跌超过4%,年内累计下跌近35%;英伟达下跌了3%以上。【外资巨头转向“看多”...

    2024-03-15 15:49:02
  • 23年GDC大会期间,人工智能已经渗透到更多的生产环节

    23年GDC大会期间,人工智能已经渗透到更多的生产环节

    1、GDC是全球游戏行业最具影响力的产业峰会。23年GDC大会期间,游戏在AI领域的布局更加清晰,也推动了板块的上涨。2、微软、英伟达、24年GDC大会将在3/18-3/22举行Unity、腾讯网易等将出席会议。从会议主题可以看出,人工...

    2024-03-13 15:47:05
  • 投资要点 云南复产犹豫不决

    投资要点 云南复产犹豫不决

      投资要点  云南复产犹豫不决,供应量大。截至2024年3月7日,中国电解铝产能4734.90万吨,开工4202.80万吨。近日,市场传出云南复产消息。目前,云南电解铝企业有两种态度:1、受政府鼓励,个别企业已开始准备复产,复产开始时...

    2024-03-14 12:39:37
  • 今天315,晚上看晚会有没有公司“中标”,春哥会及时点评分析

    今天315,晚上看晚会有没有公司“中标”,春哥会及时点评分析

    春哥祝大家平安吉祥,万事如意,愿山河无恙,众生皆安。昨天春哥的文章和视频说,今天的市场应该结束连阴,收出正K线,关注英伟达晚上的股价表现,这将直接影响今天的科技股。昨天,英伟达下跌了3%以上,科技股直接“尿”了一地。今天...

    2024-03-15 18:42:29

本文苹果大模型对未来智能应用场景的前瞻性由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们! 分享到: 新浪微博 微信

扫描左侧二维码
看手机移动端,随时随地看 股票 新闻