Seminar OSISM – Troubleshooting und Incident Response

Inhaltsverzeichnis

  • Seminarbeschreibung
  • Lernziele
  • Seminarinhalte
  • Praxisübungen
  • Zielgruppe
  • Voraussetzungen
  • Methodik

Seminarbeschreibung

Das Seminar vermittelt eine schichtenübergreifende Methode zur Diagnose und Wiederherstellung von OSISM-Plattformen. Manager, Automation, Hosts, OpenStack, Ceph, Netzwerk, Identity und Telemetrie werden entlang von Symptomen, Zeitlinien und Abhängigkeiten untersucht.

Im Mittelpunkt steht die kontrollierte Bearbeitung unter Betriebsdruck: Auswirkung begrenzen, Evidenz sichern, Hypothesen prüfen, Service wiederherstellen und anschließend Ursache sowie dauerhafte Maßnahmen belastbar dokumentieren.

Lernziele

  • Architektur, Abhängigkeiten und Betriebsziele im Themenfeld „Incident-Triage“ fachlich einordnen.
  • Aufgaben im Bereich „Zeitlinie und Evidenz“ mit klaren Vorbedingungen und Prüfpunkten vorbereiten.
  • Konfiguration und Umsetzung im Bereich „Manager und Automation“ nachvollziehbar und reproduzierbar durchführen.
  • Betriebszustände im Bereich „OpenStack-Diagnose“ mit geeigneten technischen Prüfungen bewerten.
  • Typische Fehlerbilder im Themenfeld „Ceph-Diagnose“ systematisch eingrenzen und sicher bearbeiten.
  • Änderungen, Nachweise und wiederholbare Verfahren für „Netzwerk-Diagnose“ dokumentieren.

Seminarinhalte

Modul 1: Incident-Triage

  1. Ausgangslage, Ziel und Abhängigkeiten für Incident-Triage erfassen; dabei Symptom, Auswirkung, Beginn und betroffene Nutzer erfassen.
  2. Schweregrad, Verantwortliche und Kommunikationsrhythmus festlegen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. riskante Änderungen stoppen und Stabilisierung priorisieren; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Modul 2: Zeitlinie und Evidenz

  1. Ausgangslage, Ziel und Abhängigkeiten für Zeitlinie und Evidenz erfassen; dabei letzte Deployments, Konfigurationsänderungen und Alarme zusammentragen.
  2. Logs, Metriken, Request IDs und Jobausgaben sichern; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. Zeitstempel und Ereignisreihenfolge über Systeme hinweg normalisieren; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Modul 3: Manager und Automation

  1. Ausgangslage, Ziel und Abhängigkeiten für Manager und Automation erfassen; dabei Jobstatus, Queue, Container und Ausführungsumgebung prüfen.
  2. ersten Automatisierungsfehler von Folgefehlern trennen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. sichere Wiederholung oder manuelle Stabilisierung entscheiden; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Modul 4: OpenStack-Diagnose

  1. Ausgangslage, Ziel und Abhängigkeiten für OpenStack-Diagnose erfassen; dabei API, Datenbank, Messaging und Agentenpfade unterscheiden.
  2. Scheduling-, Spawn-, Netzwerk- und Volumefehler eingrenzen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. Ressourcen- und Dienstzustand nach Wiederherstellung prüfen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Modul 5: Ceph-Diagnose

  1. Ausgangslage, Ziel und Abhängigkeiten für Ceph-Diagnose erfassen; dabei Gesundheitswarnungen und betroffene Failure Domain bewerten.
  2. Clientwirkung, Recovery und Kapazitätslage korrelieren; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. Wartungsflags und Wiederherstellungsmaßnahmen kontrolliert einsetzen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Modul 6: Netzwerk-Diagnose

  1. Ausgangslage, Ziel und Abhängigkeiten für Netzwerk-Diagnose erfassen; dabei erwarteten Paketpfad vom Mandanten bis zum Underlay zeichnen.
  2. OVN-, OVS-, Host- und Switchzustände vergleichen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. MTU-, VLAN-, Routing-, ACL- und Bindingprobleme isolieren; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Modul 7: Identity und Zugriff

  1. Ausgangslage, Ziel und Abhängigkeiten für Identity und Zugriff erfassen; dabei Anmelde-, Rollen-, Token- und Zertifikatsfehler unterscheiden.
  2. Service- und Benutzeridentitäten getrennt prüfen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. Notfallzugriff ohne Verlust der Nachvollziehbarkeit einsetzen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Modul 8: Recovery und Nachkontrolle

  1. Ausgangslage, Ziel und Abhängigkeiten für Recovery und Nachkontrolle erfassen; dabei kleinste wirksame Wiederherstellungsmaßnahme auswählen.
  2. Servicefunktion, Datenintegrität und Seiteneffekte testen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. temporäre Maßnahmen und Rest-Risiko transparent halten; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Modul 9: Post-Incident-Arbeit

  1. Ausgangslage, Ziel und Abhängigkeiten für Post-Incident-Arbeit erfassen; dabei technische Ursache und begünstigende Faktoren analysieren.
  2. Runbooks, Alarme, Tests und Architekturkontrollen verbessern; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
  3. Maßnahmen mit Verantwortung und Termin nachverfolgen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
  4. Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.

Praxisübungen

  • Planungsübung zu Incident-Triage mit Zielbild, Abhängigkeiten und Abnahmekriterien.
  • Konfigurationsübung zu Manager und Automation einschließlich Vorprüfung und kontrollierter Umsetzung.
  • Betriebsübung zu Ceph-Diagnose mit Statusprüfung, Messwerten und dokumentierter Entscheidung.
  • Störungsszenario zu Post-Incident-Arbeit mit Triage, Ursachenprüfung, Wiederherstellung und Nachtest.
  • Dokumentationsübung: Aus den Arbeitsschritten entsteht ein wiederverwendbares Runbook mit Verantwortlichkeiten und Rückfallpunkten.

Zielgruppe

On-Call- und Betriebsteams, Senior-Administratoren, SRE, technischer Second- und Third-Level-Support sowie Incident Manager.

Voraussetzungen

Gute praktische Kenntnisse in Linux und Netzwerken sowie Grundkenntnisse von OSISM, OpenStack und Ceph. Erfahrung mit Logs und Monitoring wird vorausgesetzt.

Methodik

Fachvortrag, moderierte Architekturarbeit, Demonstrationen und praktische Übungen am System. Jeder Arbeitsblock folgt der Reihenfolge Analyse, Vorbereitung, Umsetzung, Prüfung und Dokumentation. Konfigurationsänderungen werden vor der Ausführung kontrolliert und nach der Ausführung durch definierte Funktionsprüfungen bestätigt.

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminar und Anbieter vergleichen

Öffentliche Schulung

Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.

Mehr dazu...

Inhausschulung

Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.

Mehr dazu...

Webinar

Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.

Mehr dazu...

Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner

Seminardetails

   
Dauer: 3 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage: 09:00 Uhr
Preis: Öffentlich und Webinar: CHF 1.797 zzgl. MwSt.
Inhaus: CHF 5.100 zzgl. MwSt.
Teilnehmeranzahl: min. 2 - max. 8
Teilnehmer: On-Call- und Betriebsteams, Senior-Administratoren, SRE, technischer Second- und Third-Level-Support sowie Incident Manager.
Voraussetzungen: Gute praktische Kenntnisse in Linux und Netzwerken sowie Grundkenntnisse von OSISM, OpenStack und Ceph. Erfahrung mit Logs und Monitoring wird vorausgesetzt.
Standorte: Basel, Bern, Luzern, Sankt Gallen, Winterthur, Zürich
Methoden: Vortrag, Demonstrationen, moderierte Architekturarbeit und praktische Übungen am System
Seminararten: Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht
Durchführungsgarantie: ja, ab 2 Teilnehmern
Sprache: Deutsch - bei Firmenseminaren ist auch Englisch möglich
Seminarunterlage: Dokumentation auf Datenträger oder als Download
Teilnahmezertifikat: ja, selbstverständlich
Verpflegung: Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch)
Support: 3 Anrufe im Seminarpreis enthalten
Barrierefreier Zugang: an den meisten Standorten verfügbar
  Weitere Informationen unter +41 (800) 225127

Seminartermine

Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.

Seminar Startdatum Enddatum Ort Dauer
Stream live 3 Tage
Stream gespeichert 3 Tage
Luzern 3 Tage
Bern 3 Tage
Inhaus / Firmenseminar 3 Tage
Sankt Gallen 3 Tage
Basel 3 Tage
Winterthur 3 Tage
Zürich 3 Tage
Zürich 3 Tage
Stream live 3 Tage
Stream gespeichert 3 Tage
Bern 3 Tage
Luzern 3 Tage
Inhaus / Firmenseminar 3 Tage
Sankt Gallen 3 Tage
Basel 3 Tage
Winterthur 3 Tage
Winterthur 3 Tage
Zürich 3 Tage
Stream live 3 Tage
Stream gespeichert 3 Tage
Luzern 3 Tage
Bern 3 Tage
Inhaus / Firmenseminar 3 Tage
Sankt Gallen 3 Tage
Basel 3 Tage
Basel 3 Tage
Winterthur 3 Tage
Zürich 3 Tage
Stream live 3 Tage
Stream gespeichert 3 Tage
Luzern 3 Tage
Bern 3 Tage
Inhaus / Firmenseminar 3 Tage
Sankt Gallen 3 Tage
Sankt Gallen 3 Tage
Basel 3 Tage
Winterthur 3 Tage
Zürich 3 Tage
Nach oben
Seminare als Stream SRI zertifiziert
© 2026 www.seminar-experts.ch All rights reserved.  | Kontakt | Impressum | Nach oben