NEWS-CENTER

NVIDIA etabliert neuen Standard für High-Performance-Computing durch Tesla-GPUs mit Kepler-Architektur

Dreifache Energieeffizienz und vereinfachte Programmierung von GPU-beschleunigten Systemen

Weitere Informationen:  
NVIDIA
Susanna Tatár
statar@nvidia.com


Gebhardt Böhles Public Relations GmbH
Boris Böhles
Geschäftsführender Gesellschafter
Tel. +49 (0) 89 9230 6709 22
boehles@gbpublic.de


San Jose, Kalifornien, GPU Technology Conference, 16. Mai 2012 – NVIDIA hat heute die nächste Generation Tesla-GPUs vorgestellt, die auf der revolutionären NVIDIA-Kepler-GPU-Computing-Architektur basiert. Mit ihr wird GPU-beschleunigtes Computing für eine Vielzahl von wissenschaftlichen und technischen High-Performance-Computing-(HPC)-Anwendungen leichter und zugänglicher.

Die neuen Tesla-K10- und K20-GPUs sind Computing-Beschleuniger, die für die komplexesten HPC-Problematiken der Welt gebaut wurden. Der Fokus beim Design lag auf hoher Rechenleistung und extremer Energieeffizienz. Dadurch ist Kepler dreimal so effizient wie die Vorgänger-Architektur NVIDIA Fermi, die vor zwei Jahren bereits einen neuen Standard für paralleles Computing etablierte.

“Fermi war im Computing-Bereich ein eklatanter Schritt nach vorne”, sagt Bill Dally, Chief Scientists and Senior Vice President of Research bei NVIDIA. „GPU-beschleunigtes Computing wurde ein grundlegender Bestandteil von High Performance Computing und brachte hunderttausende Entwickler zur GPU-Computing-Plattform. Kepler wird eine vergleichbare Wirkung haben und GPUs flächendeckend bei technischem Computing etablieren, da sie benutzerfreundlich, vielseitig einsetzbar und effizient sind.“

Die Tesla-K10- und K20-GPUs sind auf der GPU Technology Conference (GTC) als eine von vielen NVIDIA-Neuerungen vorgestellt worden. Weitere Meldungen von der GTC finden Sie im GTC online press room.

NVIDIA hat eine Reihe von innovativen Architektur-Technologien entwickelt, die für die Leistungsfähigkeit und die Energieeffizienz der Kepler-GPUs verantwortlich sind und sie für eine größere Anzahl von Entwicklern und Anwendungen einsatzbar machen. Die größten Innovationen sind:

  • SMX-Streaming-Multiprozessor – Das Herzstück jeder GPU ist der SMX-Streaming-Multiprozessor. Er wurde von Grund auf neu konstruiert, um hohe Leistung zu liefern und gleichzeitig energieeffizient zu arbeiten. Er bietet nun bis zu dreimal mehr Leistung pro Watt als der Fermi-Streaming-Multiprozessor. Dies ermöglicht den Bau von Supercomputern, die eine Rechenleistung von einem Petaflop erreichen und dabei nur zehn Server-Racks benötigen. Die Energieeffizienz des SMX-Streaming-Multiprozessors wurde durch die Vervierfachung der Anzahl der CUDA-Architektur-Kerne bei gleichzeitiger Reduzierung der Taktraten jedes Kerns erzielt. Außerdem werden nicht genutzte Teile der GPU im Ruhemodus abgeschaltet und ein größerer Bereich der GPU für Parallelprozessorkerne anstelle von Kontrolleinheiten verwendet.
  • Dynamic Parallelism – Diese Funktion ermöglicht es GPU-Threads, dynamisch neue Threads zu erzeugen, indem die GPU dynamisch Daten abgleicht. Die Technologie vereinfacht die Parallelprogrammierung enorm und ermöglicht GPU-Beschleunigung mittels einer Reihe populärer Algorithmen wie „Adaptive Mesh Refinement“, „Fast Multipole Methods“ und „Multigrid Methods“.
  • Hyper-Q – Diese Technologie erlaubt mehreren CPU-Kernen gleichzeitig auf die CUDA-Architektur-Kerne einer einzelnen Kepler-GPU zuzugreifen. Die GPU-Nutzung erhöht sich dramatisch, CPU-Idle-Zeiten verkürzen sich und die Programmierbarkeit wird verbessert. Hyper-Q eignet sich ideal für Cluster-Anwendungen, die MPI benutzen.

“Wir haben Kepler im Hinblick auf drei Dinge konstruiert: Leistung, Effizienz und Zugänglichkeit”, sagt Jonah Alben, Senior Vice President of GPU Engineering and Principal Architect of Kepler bei NVIDIA. „Die Architektur bedeutet einen wichtigen Meilenstein bei GPU-beschleunigtem Computing und wird zukünftige Durchbrüche in der computergestützten Forschung herbeiführen.“

NVIDIA Tesla K10 und K20
Die NVIDIA-Tesla-K10-GPU liefert die weltweit höchsten Durchsatzraten für Signal-, Bild- und seismische Rechenanwendungen. Ein einzelnes Tesla-K10-Beschleuniger-Board beherbergt zwei GK104-Kepler-GPUs, die eine Gesamtrechenleistung von 4,58 Teraflops (peak single-precision floating point) abliefern und eine Speicherbandbreite von 320 Gigabyte pro Sekunde bieten.

Bei der NVIDIA-Tesla-K20-GPU handelt es sich um das Flaggschiff der Tesla-GPU-Familie. Sie wurde für besonders rechenaufwendige HPC-Umgebungen geschaffen und stellt die weltweit schnellste und energieeffizienteste GPU dar. Die geplante Markteinführung ist für das vierte Quartal 2012 vorgesehen.

Die Tesla K20 basiert auf der GK110-Kepler-GPU. Diese GPU liefert dreimal mehr Double-Precision im Vergleich zu den Tesla-Produkten auf Basis der Fermi-Architektur. Außerdem unterstützt die GPU die Funktionen Hyper-Q und Dynamic Parallelism. Es wird erwartet, dass die GK110-GPU im neuen Titan-Supercomputer im Oak Ridge National Laboratory in Tennessee und im Blue Waters-System des National Center for Supercomputing Applications der University of Illinois at Urbana-Champaign zum Einsatz kommt.

“In den zwei Jahren nach der Fermi-Einführung hat sich hybrides Computing zu einem weit verbreiteten Verfahren entwickelt, um höhere Performance bei verschiedenen, kritischen HPC-Anwendungen zu erzielen“, sagt Earl C. Joseph, Program Vice President of High-Performance-Computing bei IDC. „In den nächsten zwei Jahren erwarten wir, dass GPUs noch stärker dazu genutzt werden, höhere Leistungen bei vielen Anwendungen zu erreichen.“

Vorschau auf die CUDA 5 Parallel Programming Platform
Zeitgleich zur Kepler-Architektur hat NVIDIA seinen 20.000 Mitgliedern des NVIDIA GPU Computing Registered Developer Program heute eine Vorschau auf die CUDA 5 Parallel Programming Platform gegeben. Die Programmierplattform ermöglicht es Entwicklern, die Vorteile der neuen Kepler-GPUs inklusive der dynamischen Parallelität kennenzulernen.

Das CUDA-5-Parallelprogrammierungs-Modell wird großflächig im dritten Quartal 2012 erhältlich sein. Entwickler erhalten Zugang zu einer Vorabversion nach der Registrierung beim GPU Computing Registered Developer Program auf der CUDA-Webseite.

Über NVIDIA-Tesla-GPUs
NVIDIA-Tesla-GPUs sind leistungsstarke Parallelbeschleuniger, die auf NVIDIAs Parallel-Computing-Plattform CUDA basieren. Tesla-GPUs sind von Grund auf für energieeffizientes High Performance Computing, computergestützte Naturwissenschaften und Supercomputing entwickelt. Sie ermöglichen eine deutlich höhere Beschleunigung für eine Vielzahl von wissenschaftlichen und kommerziellen Anwendungen als reine CPU-basierte Lösungen. Aktuell beschleunigen Tesla-GPUs drei der weltweiten Top-Fünf-Supercomputer. Weitere Informationen gibt es unter http://www.nvidia.de/page/tesla_computing_solutions.html.

Über die GTC
Die GPU Technology Conference stärkt die globale Aufmerksamkeit in den Bereichen GPU-Computing und Visualisierung sowie deren Bedeutung für zukünftige Wissenschaften und Innovationen. Weitere Informationen über NVIDIA und seine Partner finden Sie im GTC online press room.

Über NVIDIA
NVIDIA (NASDAQ: NVDA) hat durch die Erfindung des Grafikprozessors (GPU) im Jahr 1999 die Computergrafik revolutioniert. Heute setzt eine Vielzahl von Produkten auf NVIDIA-Prozessoren wie Smartphones bis hin zu Supercomputern. NVIDIAs Mobilprozessoren kommen in Mobiltelefonen, Tablets und Infotainment-Systemen im Automobilbereich zum Einsatz.  PC-Gamer schwören auf NVIDIA-GPUs, die für spektakuläre Spielewelten sorgen. Professionelle Anwender entwerfen mit ihrer Hilfe 3D-Grafiklösungen und visuelle Effekte für die Filmindustrie und Produkte wie Fahrzeuge, Gebäude oder komplette Landschaften. Darüber hinaus nutzen Forscher High-Performance-Computer mit NVIDIA-GPUs, um in der Wissenschaft neue Meilensteine zu setzen. Das Unternehmen hält weltweit über 4.500 Patente. Weitere Informationen finden Sie unter www.nvidia.de.