Apache Spark Datenanalyse mit PySpark und SQL
Seminarprofil
Dieses Seminar baut Apache Spark systematisch für die tägliche Datenarbeit auf. Im Mittelpunkt stehen PySpark, Spark SQL, DataFrames, saubere Schemas, Joins, Aggregationen und die robuste Verarbeitung großer Datenmengen. Drei Tage sind notwendig, weil Grundlagen, API-Arbeit, SQL-Denke, Dateiformate und praktische Übungen erst im Zusammenspiel wirklich tragfähig werden. Halb verstanden ist bei verteilten Systemen meist schon falsch verstanden.
Schwerpunkte
- Arbeiten mit SparkSession, Schemas und DataFrame-Operationen
- Transformationen, Joins, Aggregationen und Window-Funktionen
- Kombination von PySpark-Code und Spark SQL
- Umgang mit CSV, JSON, Parquet und partitionierten Datenbeständen
- Lesbare und wartbare Pipeline-Muster für wiederkehrende Jobs
- Fehlerbilder, Debugging und sauberes Schreiben von Resultaten
- Grundlagen für Performance ohne frühzeitige Voodoo-Optimierung
Praxisbezug
Die Übungen arbeiten mit realistischen Analyse- und ETL-Szenarien. Ziel ist nicht nur, dass ein Job irgendwie läuft, sondern dass Datenflüsse nachvollziehbar, reproduzierbar und wartbar bleiben.
Zielgruppe
Geeignet für Data Engineers, Entwickler, Data Analysts und technische Fachkräfte, die Apache Spark mit PySpark und SQL produktiv einsetzen oder vorhandene Jobs sauber weiterentwickeln möchten.
Seminar und Anbieter vergleichen
Öffentliche Schulung
Diese Seminarform ist auch als Präsenzseminar bekannt und bedeutet, dass Sie in unseren Räumlichkeiten von einem Trainer vor Ort geschult werden. Jeder Teilnehmer hat einen Arbeitsplatz mit virtueller Schulungsumgebung. Öffentliche Seminare werden in deutscher Sprache durchgeführt, die Unterlagen sind teilweise in Englisch.
Inhausschulung
Diese Seminarform bietet sich für Unternehmen an, welche gleiche mehrere Teilnehmer gleichzeitig schulen möchten. Der Trainer kommt zu Ihnen ins Haus und unterrichtet in Ihren Räumlichkeiten. Diese Seminare können in Deutsch - bei Firmenseminaren ist auch Englisch möglich gebucht werden.
Webinar
Diese Art der Schulung ist geeignet, wenn Sie die Präsenz eines Trainers nicht benötigen, nicht Reisen können und über das Internet an einer Schulung teilnehmen möchten.
Fachbereichsleiter / Leiter der Trainer / Ihre Ansprechpartner
-

Michael Adler
Telefon: + 41 (800) 225127
E-Mail: michael.adler@seminar-experts.ch -

Stefano Conti
Telefon: + 41 (800) 225127
E-Mail: stefano.conti@seminar-experts.ch
Seminardetails
| Dauer: | 3 Tage ca. 6 h/Tag, Beginn 1. Tag: 10:00 Uhr, weitere Tage 09:00 Uhr |
| Preis: |
Öffentlich und Webinar: CHF 1.797 zzgl. MwSt. Inhaus: CHF 5.100 zzgl. MwSt. |
| Teilnehmeranzahl: | min. 2 - max. 8 |
| Teilnehmer: | Data Engineers, Entwickler, Data Analysts, technische Fachkräfte aus Analytics und BI |
| Voraussetzungen: | Sichere Grundlagen in Python oder SQL sowie Erfahrung mit relationalen Daten und Dateiformaten |
| Standorte: | Basel, Bern, Luzern, Sankt Gallen, Winterthur, Zürich |
| Methoden: | Vortrag, Demonstrationen, praktische Übungen am System |
| Seminararten: | Öffentlich, Webinar, Inhaus, Workshop - Alle Seminare mit Trainer vor Ort, Webinar nur wenn ausdrücklich gewünscht |
| Durchführungsgarantie: | ja, ab 2 Teilnehmern |
| Sprache: | Deutsch - bei Firmenseminaren ist auch Englisch möglich |
| Seminarunterlage: | Dokumentation auf Datenträger oder als Download |
| Teilnahmezertifikat: | ja, selbstverständlich |
| Verpflegung: | Kalt- / Warmgetränke, Mittagessen (wahlweise vegetarisch) |
| Support: | 3 Anrufe im Seminarpreis enthalten |
| Barrierefreier Zugang: | an den meisten Standorten verfügbar |
| Weitere Informationen unter +41 (800) 225127 |
Seminartermine
Die Ergebnissliste kann durch Anklicken der Überschrift neu sortiert werden.
