(原标题:开源技俩鼓励下,CUDA将兼容非Nvidia GPU?)
公众号谨记加星标??,第一时辰看推送不会错过。
起首:内容编译自techspot。
CUDA 与 AMD 和 Intel GPU 的兼容性不再是梦思。
Nvidia 于 2006 年推出 CUDA,看成私有 API 和软件层,最终成为开释 GPU 宽敞并行筹办身手的重要。CUDA 在东谈主工智能、科学筹办和高性能模拟等领域贯通着贫乏作用。但 CUDA 代码的启动在很猛经由上仍然受限于 Nvidia 硬件。咫尺,一个开源技俩正在辛勤破损这一封锁。
通过使 CUDA 欺骗重要大略在 AMD、英特尔和其他公司的第三方 GPU 上启动,这一辛勤不错大大膨胀硬件接管,减少供应商锁定,并使顽强的 GPU 筹办比以往更容易得回。
Zluda 团队最近发布了最新的季度更新,说明该技俩仍竭力于于在非 Nvidia 图形加快器上全面竣事 CUDA 兼容性。Zluda 的见解是在 AMD、Intel 和其他 GPU 架构上提供 CUDA 的径直替代决策,让用户和蛊卦者大略以“接近原生”的性能启动未经修改的基于 CUDA 的欺骗重要。
Zluda 最令东谈主鼎沸的变化是其团队界限扩大了一倍。咫尺有两名全职蛊卦东谈主员在淡雅该技俩。新加入的蛊卦东谈主员名为“Violet”,她也曾为该器具在GitHub上的官方开源仓库作念出了隆起孝敬。
其他贫乏更新包括对 ROCm/HIP GPU 启动时的改动,咫尺该启动时应该大略在 Linux 和 Windows 上可靠启动。CUDA 和 ROCm 等 GPU 启动时旨在在启动时编译 GPU 代码,从而确保为旧硬件蛊卦的代码经常不错在较新的 GPU 架构上编译和启动,而且问题最少。
Zluda 咫尺在非 Nvidia GPU 上实施未修改的 CUDA 二进制文献的性能也显耀普及。之前,该器具要么忽略某些指示修饰符,要么无法以王人备精度实施它们。咫尺,改动后的代码不错搞定一些最辣手的情况,万生优配,万生优配网,万生优配,万生优配官网,国家允许的配资平台,最安全的杠杆炒股平台举例 cvt 指示,并达到位精度。
全面相沿 CUDA 欺骗重要的重要一步是通过禁锢的日记记载来跟踪代码与 API 的交互姿首。Zluda 在这方面也得到了改动。它咫尺不错拿获之前被忽略的交互,致使不错搞定中间的 API 调用。
蛊卦东谈主员在相沿 llm.c方面也取得了紧要进展。llm.c 是一个纯 CUDA 测试竣事(用 C 话语编写),适用于 GPT-2 和 GPT-3 等话语模子。Zluda 咫尺已在 llm.c 中竣事了 44 个函数中的 16 个,团队但愿很快就能全面启动该测试。
终末,Zluda 在对 32 位 PhysX 代码的潜在相沿方面略有超越。Nvidia 在基于 Blackwell 架构的 GeForce 50 系列 GPU 上同期淹没了对该中间件的硬件和软件相沿,这给老游戏的粉丝们带来了内容上不错说是倒霉或低劣的体验。
上个季度,Zluda 收到了与 32 位 PhysX 相沿关联的小更新。早先的重心是高效汇集 CUDA 日记以识别潜在诞妄,这些诞妄最终也可能影响 64 位 PhysX 代码。然则,蛊卦东谈主员领导称,好意思满的 32 位 PhysX 相沿可能需要第三方蛊卦东谈主员的多数孝敬。
https://www.techspot.com/news/108557-open-source-project-making-strides-bringing-cuda-non.html
*免责声明:本文由作家原创。著述内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或相沿,要是有任何异议,接待关联半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第4086期内容,接待关怀。
加星标??第一时辰看推送,小号防走丢
求保举