Apache Hudi Überblick, Architektur und Entscheidungsgrundlagen
Dieses Überblicksseminar ordnet Apache Hudi fachlich und technisch im Data-Lakehouse-Umfeld ein. Im Mittelpunkt stehen Architektur, Tabellenkonzepte, typische Einsatzszenarien und die Frage, wann Hudi für mutable Datenbestände, CDC-Strecken und inkrementelle Verarbeitung die richtige Wahl ist. Die eintägige Dauer ist bewusst auf Orientierung und belastbare Entscheidungsgrundlagen zugeschnitten: kein Bauchladen, sondern das Fundament.
Zielgruppe
Geeignet für Architekten, technische Projektleitungen, Product Owner, Plattformverantwortliche und erfahrene Data Engineers, die vor einer Produkt- oder Architekturentscheidung stehen und Hudi sauber einordnen wollen.
Voraussetzungen
Erwartet wird ein solides Grundverständnis von Data Lakes, SQL, Dateiformaten wie Parquet sowie verteilten Datenplattformen. Tiefe Hudi-Erfahrung ist nicht erforderlich.
Seminarinhalte
- Grundidee und Positionierung von Apache Hudi im Data Lakehouse
- Zentrale Bausteine wie Timeline, Instants, Commits und Tabellenabstraktion
- Copy-on-Write und Merge-on-Read in Bezug auf Latenz, Kosten und Betriebsaufwand
- Snapshot-, Read-Optimized-, Incremental-, Time-Travel- und CDC-Abfragen
- Geeignete Einsatzfälle für CDC, inkrementelle ETL/ELT-Pipelines und mutable Datendomänen
- Rolle von Spark, Flink, Metastore/Katalog und Objekt- bzw. Dateispeichern
- Betriebsrelevante Grundbegriffe wie Compaction, Clustering, Cleaning, Indexing und Concurrency Control
- Entscheidungskriterien für Governance, Skalierung, Teamaufbau und Betrieb
Praxis und Übungen
Anhand einer Referenzarchitektur werden die wichtigsten Entwurfsentscheidungen Schritt für Schritt durchgesprochen. Kleine Bewertungsübungen helfen, unrealistische Erwartungen früh auszusortieren und den späteren Projektpfad sauber festzulegen.
Seminardetails
| Dauer: | 1 Tag ca. 6 h, Beginn 10:00 Uhr |
| Preis: |
Öffentlich und Webinar: CHF 599 zzgl. MwSt. Inhaus: CHF 1.700 zzgl. MwSt. |
| Teilnehmeranzahl: | min. 2 - max. 8 |
| Teilnehmer: | Architekten, technische Projektleitungen, Product Owner, Plattformverantwortliche und erfahrene Data Engineers |
| Voraussetzungen: | Grundverständnis von Data Lakes, SQL, Parquet und verteilten Datenplattformen; tiefe Hudi-Erfahrung ist nicht erforderlich |
| Standorte: | Basel, Bern, Luzern, Sankt Gallen, Winterthur, Zürich |
| Methoden: | Vortrag, Demonstrationen, Architektur-Workshops, moderierte Diskussionen |
| Seminararten: | Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
| Durchführungsgarantie: | ja, ab 2 Teilnehmern |
| Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
| Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
| Teilnahmezertifikat: | ja, selbstverständlich |
| Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
| Support: | 3 Anrufe im Seminarpreis enthalten |
| Barrierefreier Zugang: | an den meisten Standorten verfügbar |
| Weitere Informationen unter +41 (800) 225127 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
