英特尔锐炫显卡驱动升级，总经理高宇：轻薄本可跑160亿参数大模型

2023-08-29 | 浏览：

新浪科技讯8月29日晚间消息，近日，英特尔宣布旗下锐炫显卡迎来驱动重要升级。与此同时，通过软件生态的构建和模型优化，英特尔正与PC产业伙伴合作推动生成式AI在轻薄本、全能本、游戏本等消费终端的应用，致力于让广大用户在日常生活和工作中，也能通过AI的辅助来提高效率。

当前，一谈到生成式AI，大家往往想到的是云端运行，基于英伟达等企业的大型GPU运行。那么，生成式AI能不能在PC端、轻薄笔记本上运行呢？在与新浪科技等媒体沟通中，英特尔中国区技术部总经理高宇给出了确定答案。

“肯定的，轻薄本也可以运营大模型，请大家拭目以待。”高宇表示。据他介绍，通过对模型优化，英特尔降低了模型对硬件资源的需求，进而提升了模型的推理速度，让社区开源模型能够很好地运行在个人电脑上。

以大语言模型为例，英特尔通过第13代英特尔酷睿处理器XPU的加速、low-bit量化以及其它软件层面的优化，让最高达160亿参数的大语言模型，运行在16GB及以上内存容量的个人电脑上。

此外，基于OpenVINOPyTorch后端方案，英特尔可以通过PytorchAPI让社区开源模型运行在英特尔的客户端处理器、集成显卡、独立显卡和专用AI引擎上。

以图形视觉为例，由于集成了英特尔OpenVINO工具包，StableDiffusion实现的Automatic1111WebUI，已经能通过上述方式，在英特尔客户端平台的CPU和GPU（包括集成显卡和独立显卡）上运行FP16精度的模型，用户可以在文字生成图片、图片生成图片以及局部修复等功能上获得良好的使用体验。

在现场演示中，英特尔展示了接入StableDiffusion及基于ChatGLM-6b、Llama2-13b模型的运行结果。其中，ChatGLM-6b可以做到首个token生成firstlatency241.7ms，后续token平均生成率afterlatency55.63ms/token。同时Llama2-13b则执行了更为复杂的中文与英文生成，在几乎不影响阅读速度的情况下，笔记本也能够做到快速的生成效果。

英特尔锐炫显卡驱动升级，总经理高宇：轻薄本可跑160亿参数大模型

一组由国外专业人士测评提供的数据显示，将集成英特尔OpenVINO工具包的StableDiffusionWebUI与英特尔ArcA77016GB显卡配合使用，可实现比未集成前54%的工作效率提升，在相同场景下，Arc A750同样实现了40%的提升。这一性能，已经超越了未集成OpenVINO工具包的英伟达RTX4060显卡，且A77016GB也紧随RTX4060Ti后。

英特尔锐炫显卡驱动升级，总经理高宇：轻薄本可跑160亿参数大模型

据介绍，为适应当下快速发展的大语言模型生态，目前，英特尔已兼容了HuggingFace上的Transformers模型。已经验证过的模型包括但不限于LLAMA/LLAMA2、ChatGLM/ChatGLM2、MPT、Falcon、MOSS、Baichuan、QWen等。此外，英特尔还提供了Transformers、LangChain等易用API接口，并支持Windows、Linux操作系统。

“随着英特尔后续几代产品进一步扩展，规模和数量的大幅增长将让数亿人轻松享受AI加速体验，并实现更优的智能协作、更快的处理速度和更强的功能特性实现前所未有的体验变革。”英特尔表示。

生成式AI外，英特尔还通过对GameOn驱动的升级发布，提升了锐炫显卡在运行一系列DirectX11游戏的性能，为用户带来平均约19%的帧率提升，平均约20%的99thPercentile帧率流畅度提升。

此外，为帮游戏开发者、发烧友们更好地了解游戏运行及相关软硬件资源使用情况，英特尔还升级发布了名为“PresentMon”的工具，帮助衡量和评估系统性能，并根据个人需求进行优化。目前PresentMon首个Beta测试版已经放出，适用于评估所有GPU厂商，并且可以在DirectX9、11、12和Vulkan上运行。

据介绍，自台式机显卡发布以来，英特尔已累积发布30次驱动更新，为57款新游戏提供发售首日（Gameon）优化支持。由AI驱动的英特尔XeSS技术，现已获得超过70款游戏的支持。（文猛）

TAGS：英特尔