英特尔的Lunar Lake在大模型中表现出出色的AI推理能力

发表于： 2024-09-29 分类于： News

字数：134 阅读：≈ 1分钟浏览：

近日，英特尔的 Lunar Lake Core Ultra 9 288V 处理器在最新发布的 Meta LLaMA 3.2 模型上展示了令人瞩目的 AI 推理性能，令人惊喜。

Intel Lunar Lake

Meta 刚刚推出了 LLaMA 3.2，为 AI 项目提供了更多的模型选择。最初的 LLaMA（大型语言模型 Meta AI）于去年 2 月发布，目的是通过响应查询来满足用户需求，但当时的参数数量仅限于 80 亿和 700 亿。如今，LLaMA 扩展到了新的参数规模，并全面支持英特尔的 AI 硬件平台。

英特尔副总裁兼客户端 AI 与技术营销总经理 Robert Hallock 在 LinkedIn 上表示，英特尔 Lunar Lake Core Ultra 处理器在 LLaMA 3.2 上的表现令人印象深刻。旗舰级的英特尔酷睿 Ultra 9 288V “Lunar Lake” 处理器在处理 32 个输入Tokens时的延迟仅为 28.5 毫秒，而在处理 1024 个输入Tokens时延迟也仅为 31.4 毫秒，相当于每秒生成约 32-35 个令牌。

Meta LLaMA 3.2 为基础的文本任务引入了额外的 10 亿和 30 亿参数的纯文本模型，这在最初的 3.0 版本中是没有的。最新版本还推出了一个 110 亿参数的多模态模型，能够处理更复杂的任务，例如解释图像、图表和图形。

在实际应用中，英特尔 AI PC 用户可以运行视觉推理，分析和解释视觉数据，获得有意义的响应。例如，搭载内置 Arc 140V GPU 的英特尔酷睿 Ultra 9 288V “Lunar Lake” 处理器在 LLaMA 3.2 11B Vision Instruct 模型中，能够识别图像中的对象、分析元素并提供基于文本的解释。

此外，英特尔一直在致力于开发名为 OpenVINO 的 AI 推理框架。该框架优化了英特尔硬件的性能，提高了 PC 和边缘设备的效率。英特尔的 AI 硬件还在英特尔酷睿平台上引入了神经处理单元（NPU），并在内置的英特尔 Arc GPU 上加入了英特尔 Xe 矩阵扩展加速。这些技术有助于英特尔 AI PC 实现更高的推理性能，特别是在 LLaMA 3.2 的 11B 模型中用于边缘图像推理。

英特尔 Lunar Lake 平台与 Meta LLaMA 3.2 模型的结合，展示了在 AI 推理领域的巨大潜力。这不仅体现了英特尔在硬件和 AI 技术方面的领先地位，也为未来更复杂的 AI 应用铺平了道路。