CUDA Tile和cuTile Python打通了这个瓶颈。英伟达在开发者博客中提到,一个15行的Python内核性能可以媲美200行手动优化的CUDA C++代码。
机器之心报道机器之心编辑部几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」这个自 2006 年 CUDA 平台诞生以来规模最大、最全面的更新包括:NVIDIA CUDA ...
很少有人像他一样,在 通用CPU、移动SoC、车载SoC、AI加速器 上都做过一线设计和架构决策。近几年他频繁在TSMC、三星等论坛谈未来工艺与架构,被称为「半导体设计传奇」。
在科技的快速发展中,NVIDIA再次以其创新力引领潮流。12月7日,NVIDIA正式推出了CUDA 13.1,这是自2006年CUDA平台诞生以来的最大升级。这次更新不仅是功能上的增强,更是GPU编程范式的一次重大革新,带来了全新的CUDATile编程模型。
CUDA 13.1的意义,不仅在于新增功能或优化性能,更在于为构建新一代高层、跨架构的GPU计算库和框架奠定了基础,通过引入Tile IR和高层抽象,NVIDIA在硬件和软件之间增加了一个更厚的中间层。
NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将 ...
【TechWeb】NVIDIA日前正式推出CUDA 13.1版本,官方称其为自2006年平台诞生以来最大、最全面的升级。此次更新的核心在于引入了革命性的CUDA Tile编程模型,标志着GPU编程范式迈向一个更高抽象层级的新阶段。
IT之家 12 月 7 日消息,英伟达本周四发布了全新的 CUDA 13.1,这是自 2006 年 CUDA 平台问世以来规模最大的一次功能扩展更新。 英伟达介绍称,本次更新的重点在于引入了一种名为 CUDA Tile 的全新 GPU ...
在科技快速发展的今天,英伟达再次引领潮流。12月7日,英伟达发布了全新的CUDA 13.1,这是自2006年CUDA平台问世以来最大的一次功能扩展更新。这次更新不仅仅是对旧版本的简单升级,而是引入了一种名为CUDATile的全新GPU编程方式,旨在让更广泛的开发者群体能够轻松地运用强大的AI与加速计算能力。
NVIDIA近日正式推出CUDA Toolkit 13.1版本,官方宣称这是该平台自2006年问世以来最具颠覆性的重大更新。此次升级引入基于分块(Tile)的编程模型、Green Context运行时API支持、cuBLAS库性能优化等核心功能,为GPU编程带来全新范式。 最引人注目的CUDA ...
雷锋网 AI 开发者按:近日,NVIDIA 开源了适用于 Python 的视频处理框架「VideoProcessingFramework(VPF)」。该框架为开发人员提供了一个简单但功能强大的 Python 工具,可用于硬件加速的视频编码、解码和处理类等任务。 同时,由于 Python 绑定下的 C ++代码,它使开发 ...
NVIDIA近日宣布推出CUDA 13.1版本,其中最引人注目的是全新引入的CUDA Tile编程模型。这项技术革新被业界视为CUDA平台发展历程中的关键突破,尤其针对新一代Blackwell架构GPU进行了深度优化,旨在显著降低AI开发的复杂度并提升整体效率。 传统CUDA编程模式要求开发者精细控制每个线程的执行路径,而CUDA ...