NVIDIA lanza CUDA 9 en la GTC 2017 con algunas referencias a Volta

 

Aunque para los gamers no representa nada, NVIDIA ha lanzado hoy CUDA 9 durante la GTC 2017 con importantes mejores para la industria de la computación por GPU y desarrollo de Inteligencia Artificial. La novena versión del software de NVIDIA ya estaba disponible desde hace algún tiempo en beta, pero no ha sido hasta hoy donde se ha lanzado oficialmente y se han publicado todo su listado de bondades para la computación vía GPU:

 

  • Speed up high-performance computing (HPC) and deep learning apps with new GEMM kernels in cuBLAS.
  • Execute image and signal processing apps faster with performance optimizations across multiple GPU configurations in cuFFT and NVIDIA Performance Primitives.
  • Solve linear and graph analytics problems common in HPC with new algorithms in cuSOLVER and nvGRAPH.
  • Express rich parallel algorithms with threads from sub-tiles to warps, blocks, and grids.
  • Manage and reuse threads efficiently within an application with new API and function primitives.
  • Optimize and pre-fetch memory access by identifying source code causing page faults in unified memory.
  • Inspect unified memory performance bottlenecks with new event filters based on virtual address, migration reason and page fault access type.

 

Por otro lado hemos podido ver un listado de referencias a NVIDIA Volta, su próxima arquitectura de GPU e incluso alguna mejora para arquitecturas anteriores:

 

  • Replace warp-synchronous programming with robust programming model on Kepler architecture and above.
  • Execute AI applications faster with Tensor Cores performing 5X faster than Pascal GPUs.
  • Scale multi-GPU applications with next-generation NVLink delivering 2X throughput of prior generation.
  • Increase GPU utilization with Volta Multi-Process Service (MPS).
  • Profile PCIe usage by analyzing bandwidth of memory transfers, latency, and comparison with NVLink.

 

Las mejoras en Volta pasan por una mejora de rendimiento del 500% en los Tensor Cores y mejoras en multiGPU gracias a un NVLink el doble de rápido que en las soluciones Pascal. También se han añadido mejoras de cara a optimizar el uso de GPU gracias al Volta Multi-Process Service (MPS), que permitirá ejecutar varios procesos simultáneamente aprovechando todo el potencial de estas nuevas GPU basadas en Volta.