NVIDIA Software
 

MASSIV-PARALLELE BERECHNUNGEN UND GRAFIKLEISTUNG
NVIDIA® Parallel Nsight™ in Verbindung mit Visual Studio macht die Entwicklung von Grafikprozessoranwendungen für massiv-parallele Berechnungen zu einem Kinderspiel. Mit seinen nativen Zusatzfunktionen Grafikprozessor-Debugging und Profiling stellt Parallel Nsight ein höchst effizientes Mittel zur Verfügung, um den Grafikprozessorcode zu debuggen, zu profilen und zu optimieren. Zudem gewährt Parallel Nsight mit der Analyseverfolgung Einsicht in die heterogene Ausführung der Anwendung, so dass die Verwendung von Multi-Core-CPUs und die Beschleunigung mehrerer Grafikprozessoren und mehrerer APIs maximiert werden können.

Multiple Cores Ob Sie ein Wissenschaftler sind, der nach einer Möglichkeit sucht, seine Forschung 10-mal schneller durchzuführen, ein Anwendungsentwickler, der den Grafikprozessor für die Visualisierung hoch entwickelter 3D-Grafik und für wissenschaftliche Verarbeitung nutzt, oder ein Grafikentwickler, der die Grenzen von DirectX durchbrechen will – mit Parallel Nsight können Sie diese Ziele effizienter erreichen als mit jeder anderen Entwicklungsumgebung.

CUDA-ENTWICKLUNG
Icon Parallel Nsight

NVIDIA Parallel Nsight für Berechnungsentwicklungen auf dem Grafikprozessor
Die Software NVIDIA Parallel Nsight ist branchenweit die erste Entwicklungsumgebung für massiv-parallele Berechnungen, die direkt in Microsoft Visual Studio, die weltweit beliebteste Entwicklungsumgebung, integriert ist. Parallel Nsight ist ein leistungsfähiges Werkzeug, mit dem Programmierer in Microsoft Visual Studio Code für Grafikprozessoren und für CPUs entwickeln können.

*NEU* in Parallel Nsight 2.1
   - Unterstützung für CUDA 4.1.
   - NEU sind die Ansicht „CUDA Warp Watch“ und die CUDA-Infoseite für ein verbessertes Debugging von
     Anwendungen mit übermäßig vielen Threads.
   - Tests mit dem weiterentwickelten CUDA-Profiler sorgen für tiefgreifendere Leistungsanalysen von Kerneln.
   - Die Unterstützung für Laptops mit Optimus ermöglicht CUDA-Entwicklern auf einem einzelnen System die volle
     Funktionalität von Parallel Nsight.

NVIDIA OPTIMUS

CUDA DEBUGGER CUDA-DEBUGGER
>  *NEU* Die CUDA-Infoseite gibt detailliert Auskunft über den
    Status der CUDA-Starts in der Anwendung des Benutzers.
    Der Benutzer kann nach Ausnahmen, Asserts, Haltepunkten
    und MMU-Fehlern filtern und detaillierte Informationen dazu
    erhalten; danach kann er zu einem bestimmten Warp wechseln,
    der ihn besonders interessiert, um die Probleme zu debuggen.
>  *NEU* CUDA Warp Watch bietet eine effizientere Methode,
    durch die residenten Threads zu navigieren und die Zustände
    eines Threads im Warp sichtbar zu machen.
>  *NEU* Die Seite Systeminformationen zeigt Informationen
    zum System auf dem Monitor an und gibt detailliert Auskunft
     über alle CUDA-Geräte, z. B. das Treibermodell, die
    Grafikprozessorarchitektur oder den Speicher.
>  *NEU* Der Grafikprozessor wird unterbrochen, wenn eine
    CUDA-Zusicherung erfolgt ist.
>  Debuggen Sie CUDA-C/C++ und DirectCompute-Kernel
    direkt auf der Grafikprozessor-Hardware.
>  Untersuchen Sie Tausende parallel ausgeführte Threads über
    die vertrauten Visual-Studio-Fenster Lokal, Überwachung,
    Speicher und Haltepunkte.
>  Lassen Sie sich den Grafikprozessorspeicher direkt in Visual
    Studio im Standardfenster Speicher anzeigen.
>  Verwenden Sie bedingte Haltepunkte, um Fehler in
    massiv-parallelen Codes schnell zu identifizieren und
    zu beheben.
>  Identifizieren Sie Speicherzugriffsverletzungen mit dem
    CUDA C/C++ Memory Checker.
 
Analyzer

CUDA PROFILER AND APPLICATION TRACE

CUDA-PROFILER UND ANWENDUNGSVERFOLGUNG
>  *NEU* Mit CUDA-Profiling-Tests können Entwickler
    Probleme der Programmausführung nachvollziehen, wenn diese
    einer der folgenden Ursachen zuzuschreiben sind:

  • Threadabweichungen oder Codeverzweigungen,
  • Speicherstatistik,
  • Statistik wegen Ausfällen,
  • Effizienz von Anweisungsproblemen,
  • Erreichte Anzahl FLOPS.


>  *NEU* Bei nachverfolgten Auslastungen kann der Entwickler
    nun durch die Abhängigkeiten navigieren und den Stack
    aufrufen, um die Auslastungen des Grafikprozessors, die
    entsprechenden API-Aufrufe und den Hostcode durchzugehen,
    die die Aktivität ausgelöst haben.
>  *NEU* CUDA Trace gibt zusätzliche Unterstützung für die
    gleichzeitige Nachverfolgung von Speicherkopien und
    Speichersätzen.
>  *NEU* Die Systemverfolgung gibt zusätzliche Unterstützung
    für die Erfassung von Daten aus einem 64-Bit-Prozess, die
    ursprünglich aus einem 32-Bit-Prozess stammen.
>  *NEU* Unterstützung der API-Trace für OpenCL 1.1.
>  *NEU* Die Berichtsseiten NVTX und Direct3D Performance
    Marker unterstützen nun Statistikanzeigen für alle CUDA ,
    OpenCL , Direct3D und OpenGL-API-Aufrufe, die während
    eines Bereichs gemacht wurden, sowie für alle
    Grafikprozessoraufgaben, die von den API-Aufrufen
    eingereicht wurden.
>  *NEU* Das Bezugsfenster erlaubt Data-Mining von Daten,
    die vorher in Berichtstabellen oder der Zeitleistenansicht
    ausgewählt wurden.
>   DirectCompute-Shader-Profiling.
>  Erfassen Sie Ereignisse auf CPU und Grafikprozessorebene,
    darunter: API-Aufrufe, Kernelstarts, Speichertransfers und
    eigene Anmerkungen zu Anwendungen.
>  Alle erfassten Ereignisse werden auf einer einzigen
    Bezugszeitleiste angezeigt.
>  Tools zur Untersuchung auf der Zeitleiste ermöglichen die
    Prüfung von Abhängigkeiten von der Arbeitslast.
>  Filtern und Sortieren Sie erfasste Ereignisse in speziellen
    Berichtansichten.
>  Profilen Sie CUDA-Kernel mit Zählern für die
    Grafikprozessorleistung.

GRAFIKENTWICKLUNG
Icon Parallel Nsight

NVIDIA Parallel Nsight™ für Grafikentwicklungen auf dem Grafikprozessor
Die Software NVIDIA Parallel Nsight ist weltweit die erste Grafikentwicklungsumgebung, die direkt in Microsoft Visual Studio, die weltweit beliebteste Entwicklungsumgebung, integriert ist. Das ermöglicht die Entwicklung in DirectX 10 und DirectX 11 mit nativem Grafikprozessor und API-Debugging und eine fortgeschrittene Leistungsoptimierung.

*NEU* in Parallel Nsight 2.1
   - Dynamic Shader Editing ermöglicht die Bearbeitung und Neukompilierung von Shadern während der Ausführung
     Ihrer Anwendung. Das kann beim Debuggen von Renderproblemen oder auch beim On-the-Fly-Austesten
     von Optimierungen hilfreich sein.
   - Die Seite „Frame Timings“ ermöglicht die schnelle Erstellung von Profilen zu einem gespeicherten Frame, um
     zugunsten einer schnellen Profiling-Bearbeitungszeit zu jedem Draw-Call verschiedene Timings zu sehen.

GRAPHICS INSPECTOR AND DEBUGGER GRAPHICS INSPECTOR UND DEBUGGER
>  *NEU* Dynamic Shader Editing während der Ausführung der
    Anwendung.
>  *NEU* Die Seite „Shader Inspector“ zeigt fortwährend den Puffer
    zusammen mit den HLSL-Variablennamen.
>  *NEU* Nsight HUD für Grafik-Debugging außerhalb von Visual
    Studio.
>  Echtzeitprüfung von DirectX-Renderaufrufen.
>  Interaktive Statusprüfung der Grafikprozessor-Pipeline inklusive
    der Visualisierung gebundener Texturen und von Geometrie
    und Compute-Buffern.
>  Die Pixel-Historie zeigt alle Aktionen, die einen bestimmten
    Pixel betreffen.
>  Debugging aller HLSL-Grafikshader direkt auf der
    Grafikprozessor-Hardware.
>  Untersuchen Sie parallel ausgeführte Shader über die vertrauten
    Visual-Studio-Fenster Lokal, Überwachung, Speicher
    und Haltepunkte.
>  Lassen Sie sich alle von der Anwendung geladenen Shader auf
    Quellcodeebene anzeigen und interagieren Sie mit ihnen.
>  Identifizieren Sie mit bedingten Haltepunkten Shader, die sich
    auf bestimmte Primitive oder Pixel auswirken.
 
GRAPHICS PROFILER AND APPLICATION TRACE

GRAPHICS PROFILER AND APPLICATION TRACE
GRAFIK-PROFILER UND ANWENDUNGSVERFOLGUNG
>  *NEU* Die Seite Frame Timings gibt ausführlich Auskunft über
    Drawcall-Timings.
>  *NEU* Frame-Profiler-Sitzungen können abgespeichert und
    aufbewahrt werden, um gemeinsam genutzt zu werden.
>  *NEU* Die Systemverfolgung gibt zusätzliche Unterstützung für
    die Erfassung von Daten aus einem 64-Bit-Prozess, die
    ursprünglich aus einem 32-Bit-Prozess stammen.
>  *NEU* Unterstützung für die Verfolgung von DirectX und OpenGL-
    Auslastungen, Speichertransfers und des Rückbezugs von
    diesen zu Befehlspuffern und API-Aufrufen.
>  API-Trace für Direct3D, OpenGL und Cg.
>  Der Frame-Profiler identifiziert Leistungsengpässe und die
    Verwendung des Grafikprozessors.
>  Speichern Sie Frames für die Offline-Weiterverarbeitung und
    –Analyse.