Inhaltsverzeichnis
- Seminarbeschreibung
- Lernziele
- Seminarinhalte
- Praxisübungen
- Zielgruppe
- Voraussetzungen
- Methodik
Seminarbeschreibung
Das Seminar behandelt den Aufbau einer betriebsrelevanten Beobachtbarkeit für OSISM, OpenStack, Ceph, Netzwerk und unterstützende Dienste. Messziele, Metriken, Dashboards, Alarmierung, Protokollkorrelation, Aufbewahrung und Betriebsreaktion werden zusammengeführt.
Nicht die Menge der Daten, sondern deren Nutzbarkeit steht im Mittelpunkt. Die Teilnehmenden leiten aus Servicezielen konkrete Signale ab, reduzieren Alarmrauschen und erstellen Diagnoseansichten, die eine Störung über mehrere Plattformebenen verfolgen können.
Lernziele
- Architektur, Abhängigkeiten und Betriebsziele im Themenfeld „Messziele und Serviceindikatoren“ fachlich einordnen.
- Aufgaben im Bereich „Metrikquellen und Sammlung“ mit klaren Vorbedingungen und Prüfpunkten vorbereiten.
- Konfiguration und Umsetzung im Bereich „Dashboards“ nachvollziehbar und reproduzierbar durchführen.
- Betriebszustände im Bereich „Alerting“ mit geeigneten technischen Prüfungen bewerten.
- Typische Fehlerbilder im Themenfeld „Logging und Ereignisse“ systematisch eingrenzen und sicher bearbeiten.
- Änderungen, Nachweise und wiederholbare Verfahren für „Störungsdiagnose mit Telemetrie“ dokumentieren.
Seminarinhalte
Modul 1: Messziele und Serviceindikatoren
- Ausgangslage, Ziel und Abhängigkeiten für Messziele und Serviceindikatoren erfassen; dabei kritische Nutzer- und Plattformfunktionen benennen.
- Verfügbarkeit, Latenz, Fehler und Sättigung als Signale ableiten; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- SLOs, Schwellenwerte und Eskalationsbedarf festlegen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 2: Metrikquellen und Sammlung
- Ausgangslage, Ziel und Abhängigkeiten für Metrikquellen und Sammlung erfassen; dabei Manager-, Host-, OpenStack-, Ceph- und Netzwerkmetriken zuordnen.
- Labels und Dimensionen konsistent gestalten; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Erreichbarkeit, Zeitbezug und Datenlücken prüfen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 3: Dashboards
- Ausgangslage, Ziel und Abhängigkeiten für Dashboards erfassen; dabei Übersichts-, Dienst- und Diagnoseebenen trennen.
- Kapazität, Gesundheit und Veränderung sichtbar machen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Ansichten für Betrieb, On-Call und Management zielgerecht strukturieren; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 4: Alerting
- Ausgangslage, Ziel und Abhängigkeiten für Alerting erfassen; dabei Symptom- und Ursachenalarme unterscheiden.
- Schwellwerte, Dauer und Gruppierung gegen Rauschen optimieren; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Routing, Bereitschaft und Quittierungsprozess testen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 5: Logging und Ereignisse
- Ausgangslage, Ziel und Abhängigkeiten für Logging und Ereignisse erfassen; dabei Protokollquellen, Formate und Zeitstempel vereinheitlichen.
- Job-, API-, Dienst- und Systemereignisse korrelieren; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Zugriff, Mandantentrennung und Aufbewahrung regeln; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 6: Störungsdiagnose mit Telemetrie
- Ausgangslage, Ziel und Abhängigkeiten für Störungsdiagnose mit Telemetrie erfassen; dabei Zeitlinie aus Alarm, Metrik, Log und Änderung bilden.
- betroffene Schicht und Ausbreitungsrichtung eingrenzen; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Hypothese mit gezielter Prüfung bestätigen oder verwerfen; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Modul 7: Betrieb und kontinuierliche Verbesserung
- Ausgangslage, Ziel und Abhängigkeiten für Betrieb und kontinuierliche Verbesserung erfassen; dabei fehlende Signale aus Incidents ableiten.
- Dashboards und Alarme regelmäßig rezertifizieren; erforderliche Parameter, Verantwortlichkeiten und Prüfkriterien in einer Arbeitscheckliste festhalten.
- Kapazitäts-, Sicherheits- und Verfügbarkeitsberichte operationalisieren; die Umsetzung in der Laborumgebung ausführen und jeden Zwischenzustand technisch prüfen.
- Ergebnis mit Funktions-, Sicherheits- und Betriebsprüfungen bestätigen; Abweichungen, Rückfallpunkt und Wiederholungsweg dokumentieren.
Praxisübungen
- Planungsübung zu Messziele und Serviceindikatoren mit Zielbild, Abhängigkeiten und Abnahmekriterien.
- Konfigurationsübung zu Dashboards einschließlich Vorprüfung und kontrollierter Umsetzung.
- Betriebsübung zu Logging und Ereignisse mit Statusprüfung, Messwerten und dokumentierter Entscheidung.
- Störungsszenario zu Betrieb und kontinuierliche Verbesserung mit Triage, Ursachenprüfung, Wiederherstellung und Nachtest.
- Dokumentationsübung: Aus den Arbeitsschritten entsteht ein wiederverwendbares Runbook mit Verantwortlichkeiten und Rückfallpunkten.
Zielgruppe
Monitoring- und Plattformteams, SRE, Cloud- und Systemadministration, On-Call-Verantwortliche sowie technischer Support.
Voraussetzungen
Linux- und Netzwerkgrundkenntnisse sowie Verständnis von Metriken und Logs. OSISM-, OpenStack- oder Ceph-Grundkenntnisse sind hilfreich.
Methodik
Fachvortrag, moderierte Architekturarbeit, Demonstrationen und praktische Übungen am System. Jeder Arbeitsblock folgt der Reihenfolge Analyse, Vorbereitung, Umsetzung, Prüfung und Dokumentation. Konfigurationsänderungen werden vor der Ausführung kontrolliert und nach der Ausführung durch definierte Funktionsprüfungen bestätigt.
Seminar und Anbieter vergleichen
Öffentliche Schulung
Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.
Inhausschulung
Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.
Webinar
Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-

Michael Adler
Telefon: + 41 (800) 225127
E-Mail: michael.adler@seminar-experts.ch -

Stefano Conti
Telefon: + 41 (800) 225127
E-Mail: stefano.conti@seminar-experts.ch
Seminardetails
| Dauer: | 2 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage: 09:00 Uhr |
| Preis: |
Öffentlich und Webinar: CHF 1.198 zzgl. MwSt. Inhaus: CHF 3.400 zzgl. MwSt. |
| Teilnehmeranzahl: | min. 2 - max. 8 |
| Teilnehmer: | Monitoring- und Plattformteams, SRE, Cloud- und Systemadministration, On-Call-Verantwortliche sowie technischer Support. |
| Voraussetzungen: | Linux- und Netzwerkgrundkenntnisse sowie Verständnis von Metriken und Logs. OSISM-, OpenStack- oder Ceph-Grundkenntnisse sind hilfreich. |
| Standorte: | Basel, Bern, Luzern, Sankt Gallen, Winterthur, Zürich |
| Methoden: | Vortrag, Demonstrationen, moderierte Architekturarbeit und praktische Übungen am System |
| Seminararten: | Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
| Durchführungsgarantie: | ja, ab 2 Teilnehmern |
| Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
| Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
| Teilnahmezertifikat: | ja, selbstverständlich |
| Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
| Support: | 3 Anrufe im Seminarpreis enthalten |
| Barrierefreier Zugang: | an den meisten Standorten verfügbar |
| Weitere Informationen unter +41 (800) 225127 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
