NEWS-CENTER

NVIDIA Tesla P100 beschleunigt Anwendungen für High Performance Computing um mehr als das 30-Fache

Auf Basis der Pascal-Architektur bietet der Tesla P100 große Fortschritte beim Datendurchsatz für Rechenzentren

Weitere Informationen:  
Jens Neuschaefer
NVIDIA
PR Manager Enterprise
jneuschafer@nvidia.com

Tesla-P100

Frankfurt — ISC 2016 — 20. Juni 2016 – NVIDIA hat heute den NVIDIA Tesla P100 GPU-Beschleuniger für PCIe-Server vorgestellt. Durch die Performance- und Wertvorteile gegenüber CPU-basierten Systemen ermöglicht der Tesla P100 modernen Rechenzentren extreme Leistungssteigerungen, um den ständig wachsenden Anforderungen nachzukommen.

Der Bedarf für Supercomputing ist so hoch wie nie zuvor. Viele Forschungseinrichtungen haben derzeit keinen ausreichenden Zugriff auf Supercomputing-Systeme, um ihre Arbeit adäquat zu unterstützen. Zudem werden immer mehr High-Performance-Computing (HPC)-Technologien benötigt, um rechenintensive Deep-Learning-Anwendungen auszubauen und die Forschung im Bereich künstlicher Intelligenz zu fördern.

Der Tesla P100 GPU-Beschleuniger kommt diesen neuen Rechenanforderungen mit der starken Performance und Effizienz der NVIDIA Pascal GPU-Architektur nach. Die neue Technologie ermöglicht die Entwicklung von „Superknoten“, die den Durchsatz von mehr als 32 herkömmlichen CPU-basierten Rechenknoten bei bis zu 70 Prozent geringeren Kosten1 erlauben.

Der Tesla P100 für PCIe ist im PCIe-Standardformat erhältlich und mit aktuellen GPU-beschleunigten Servern kompatibel. Sie wurde optimiert, um die rechenintensivsten Anwendungen für künstliche Intelligenz und HPC-Rechenzentren voranzubringen. Ein einziger mit dem Tesla P100-beschleunigter Server liefert eine höhere Leistung als 50 CPU-Serverknoten bei Ausführung des AMBER Molekular-Dynamik-Codes2 und ist schneller als 32 CPU-Knoten bei Ausführung der VASP Materialwissenschaftsanwendung3.

Noch in diesem Jahr werden die Tesla P100-Beschleuniger für PCIe im Zuge eines Upgrades auch in Europas schnellstem Supercomputer, dem Piz-Daint-System im Swiss National Supercomputing Center in Lugano, eingesetzt.

„Tesla P100-Beschleuniger bieten neue Ebenen an Leistung und Effizienz, um einige der wichtigsten Rechenherausforderungen unserer Zeit meistern zu können“, sagt Thomas Schulthess, Professor für Computational Physics an der ETH Zürich und Direktor des Swiss National Supercomputing Center. „Das Upgrade von 4.500 GPU-beschleunigten Rechenknoten in Piz Daint zu den Tesla P100-GPUs wird die Leistung des Systems mehr als verdoppeln und Durchbrüche in den unterschiedlichsten Bereichen wie Kosmologie, Materialwissenschaften, Seismologie und Klimawissenschaften ermöglichen.“

Der Tesla P100 für PCIe ist die neueste Erweiterung der NVIDIA Tesla Accelerated Computing Platform. Sie bietet unter anderem:

  • Unerreichte Anwendungs-Performance für gemischte HPC-Workloads — Sie bietet 4,7 Teraflops Double-Precision- bzw. 9,3 Teraflops Single-Precision-Peak-Performance. Ein einziger Pascal-basierter Tesla P100 Rechenknoten bietet die Leistung von mehr als 32 herkömmlichen CPU-Servern.
  • CoWoS mit HBM2 für unerreichte Effizienz — Der Tesla P100 vereint Prozessor und Daten in einem einzigen Paket, um unerreichte Recheneffizienz zu bieten. Ein innovativer Ansatz im Memory-Design – Chip on Wafer on Substrate (CoWoS) mit HBM2 – bietet eine Verdreifachung der Memory-Bandbreite-Performance, bzw. eine Steigerung um 720GB/Sek, verglichen mit der NVIDIA Maxwell-Architektur.
  • Page Migration Engine für vereinfachtes paralleles Programmieren — Ermöglicht Entwicklern, sich auf die Leistungsoptimierung zu konzentrieren anstatt auf die Verwaltung von Datenbewegungen achten zu müssen. Außerdem erlaubt es Anwendungen mit der Unterstützung von virtuellem Memory-Paging über die physische Memory-Größe der GPU hinaus zu betreiben. Die vereinte Memory-Technologie verbessert die Produktivität erheblich, indem Entwickler nun in die Lage versetzt werden, den Memory-Speicher eines Knotens auf einen Blick zu sehen.
  • Leistungsfähige Anwendungsunterstützung — Mit 410 GPU-beschleunigten Anwendungen, einschließlich neun der Top 10 HPC-Anwendungen, ist die Tesla-Plattform die weltweit führende HPC-Rechenplattform.

Spezifikationen - Tesla P100 für PCIe

  • 4,7 Teraflops Double-Precision-Performance, 9,3 Teraflops Single-Precision-Performance und 18,7 Teraflops Half-Precision-Performance mit der NVIDIA GPU BOOST™-Technologie
  • Unterstützung für PCIe Gen 3-Interconnect (32GB/Sek bi-direktionale Bandbreite)
  • Erweiterte Programmierbarkeit mit Page Migration Engine und vereintem Memory
  • ECC-Schutz für höhere Zuverlässigkeit
  • Server-optimiert für höchste Datendurchsätze in Rechenzentren und Verlässlichkeit
  • Verfügbar in zwei Konfigurationen:
    • 16GB CoWoS HBM2 Stacked Memory für 720GB/Sek Memory-Bandbreite
    • 12GB CoWoS HBM2 Stacked Memory, für 540GB/Sek Memory-Bandbreite

Verfügbarkeit
Der NVIDIA Tesla P100 GPU-Beschleuniger für PCIe-basierte Systeme wird voraussichtlich zu Beginn des vierten Quartals 2016 bei NVIDIA-Partnerhändlern und Server-Herstellern wir Cray, Dell, Hewlett Packard Enterprise, IBM und SGI verfügbar sein.

# # #

(1)CPU server: Dual socket Intel E5-2680v3 12 cores, 128 GB DDR4 per node, FDR IB / GPU server: 8x Tesla P100 for PCIe with Dual Socket Intel E5-2680v3

(2)Simulations on SDSU Comet Supercomputer

(3)VASP 5.4.1_05Feb16, Si-Huge Dataset. 16, 32 Nodes are estimated based on same scaling from 4 to 8 nodes.

Bleiben Sie bei NVIDIA auf dem Laufenden:


Über NVIDIA
NVIDIA (NASDAQ: NVDA) leistet seit 1993 Pionierarbeit auf dem Gebiet des visuellen Computings. Die Technologien des Unternehmens transformieren Bildschirmwelten in eine Welt von interaktiven Erlebnissen für Gamer und Wissenschaftler, für Endkunden und Unternehmen. Weitere Informationen gibt es unter http://www.nvidia.de und http://www.nvidia.de/page/newsandevents.html.