Seminar CUDA Performance & Profiling: Nsight, Memory, Occupancy, Tuning

Seminar / Training CUDA Performance & Profiling: Nsight, Memory, Occupancy, Tuning

Inhaltsverzeichnis

  • Abstract
  • Zielgruppe und Voraussetzungen
  • Lernziele
  • Inhalte und Module
  • Praxisübungen und Fallstudien
  • Agenda

Abstract

Das Seminar fokussiert Performance Engineering für CUDA. Im Mittelpunkt stehen Messmethoden, Profiling-Workflows und konkrete Optimierungstechniken für Speicherzugriffe, Auslastung und Parallelität. Teilnehmende lernen, Performanceprobleme reproduzierbar zu isolieren, Metriken korrekt zu interpretieren und Optimierungen iterativ zu verifizieren. Hands-on-Übungen führen von „Baseline“ über Messung bis zur stabilen Beschleunigung mit dokumentierten Trade-offs.

Zielgruppe und Voraussetzungen

  • Zielgruppe: CUDA-Entwicklung, Performance Engineering, HPC
  • Voraussetzungen: sichere CUDA-Grundlagen (Kernel, Memory, Synchronisation). Empfehlenswert: Seminar CUDA Programmierung Grundlagen: Kernels, Memory, Toolchain oder gleichwertig

Lernziele

  • Profiling-Workflow: Hypothese → Messung → Optimierung → Verifikation
  • Bottlenecks identifizieren: Memory-bound vs compute-bound
  • Kernel-Tuning: Occupancy, Registerdruck, Shared Memory, Divergenz, Launch-Konfiguration
  • Performance-Regressions vermeiden: Benchmarking und Messdisziplin

Inhalte und Module

  • Metriken und Denkmodelle: Throughput, Latenz, Roofline, Amdahl/Overheads
  • Profiling-Werkzeuge (konzeptionell + Praxis): System- vs Kernelprofiling
  • Speicheroptimierung: Coalescing, Alignment, Cache-Nutzung, Shared Memory als Cache
  • Compute-Optimierung: Instruction Mix, ILP, Warp-Effizienz, Divergenz-Reduktion
  • Launch-Tuning: Blockgrößen, Occupancy, Limits durch Register/Shared Memory
  • Asynchronität-Grundlagen: Streams (als Performance-Hebel, Basislevel)
  • Benchmarking: Warmup, Wiederholungen, Varianz, Pinning, Takt-/Power-Effekte (praxisnah)

Praxisübungen und Fallstudien

  • Profiling eines gegebenen Kernels und Ableitung von Hypothesen
  • Speichergebundene Fallstudie: Layout/Coalescing verbessern
  • Computegebundene Fallstudie: Divergenz reduzieren, ILP erhöhen
  • Occupancy-Lab: Blockgröße und Registerdruck gegeneinander abwägen
  • Mini-Performance-Report als Ergebnisartefakt

Agenda

  • Tag 1
    • Messmethodik und Profiling-Workflow
    • Speicher-Tuning und Cache-/Shared-Strategien
    • Übungen: Speichergebundene Optimierung
  • Tag 2
    • Compute-Tuning, Divergenz, Launch-Konfiguration
    • Occupancy, Registerdruck, Trade-offs
    • Übungen: Iteratives Tuning + Verifikation

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminar und Anbieter vergleichen

Öffentliche Schulung

Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.

Mehr dazu...

Inhausschulung

Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.

Mehr dazu...

Webinar

Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.

Mehr dazu...

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminardetails

   
Dauer: 2 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr
Preis: Öffentlich und Webinar: CHF 1.198 zzgl. MwSt.
Inhaus: CHF 3.400 zzgl. MwSt.
Teilnehmeranzahl: min. 2 - max. 8
Teilnehmer: CUDA-Entwicklung, Performance Engineering, HPC
Vorausetzung: sichere CUDA-Grundlagen (Kernel, Memory, Synchronisation). Empfehlenswert: Seminar CUDA Programmierung Grundlagen: Kernels, Memory, Toolchain oder gleichwertig
Standorte: Basel, Bern, Luzern, Sankt Gallen, Winterthur, Zürich
Methoden: Vortrag, Demonstrationen, praktische Übungen am System
Seminararten: Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht
Durchführungsgarantie: ja, ab 2 Teilnehmern
Sprache: Deutsch - bei Firmenseminaren ist auch Englisch möglich
Seminarunterlage: Dokumentation auf Datenträger oder als Download
Teilnahmezertifikat: ja, selbstverständlich
Verpflegung: Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch)
Support: 3 Anrufe im Seminarpreis enthalten
Barrierefreier Zugang: an den meisten Standorten verfügbar
  Weitere Informationen unter +41 (800) 225127

Seminartermine

Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.

Seminar Startdatum Enddatum Ort Dauer
Sankt Gallen 2 Tage
Basel 2 Tage
Winterthur 2 Tage
Zürich 2 Tage
Stream live 2 Tage
Stream gespeichert 2 Tage
Luzern 2 Tage
Bern 2 Tage
Inhaus / Firmenseminar 2 Tage
Inhaus / Firmenseminar 2 Tage
Sankt Gallen 2 Tage
Basel 2 Tage
Winterthur 2 Tage
Zürich 2 Tage
Stream live 2 Tage
Stream gespeichert 2 Tage
Luzern 2 Tage
Bern 2 Tage
Luzern 2 Tage
Bern 2 Tage
Inhaus / Firmenseminar 2 Tage
Sankt Gallen 2 Tage
Basel 2 Tage
Winterthur 2 Tage
Zürich 2 Tage
Stream live 2 Tage
Stream gespeichert 2 Tage
Stream gespeichert 2 Tage
Luzern 2 Tage
Bern 2 Tage
Inhaus / Firmenseminar 2 Tage
Sankt Gallen 2 Tage
Basel 2 Tage
Winterthur 2 Tage
Zürich 2 Tage
Stream live 2 Tage
Stream live 2 Tage
Stream gespeichert 2 Tage
Luzern 2 Tage
Bern 2 Tage
Nach oben
Seminare als Stream SRI zertifiziert
© 2026 www.seminar-experts.ch All rights reserved.  | Kontakt | Impressum | Nach oben