Cloudera Training Partner Logo

Preparing with Cloudera Data Engineering

powered by Apache Spark, Hive, and Airflow

Cloudera Training Partner Logo

Dieser praxisorientierte Kurs vermittelt die wichtigsten Konzepte und Kenntnisse, die Entwickler benötigen, um mit Apache Spark hochleistungsfähige, parallele Anwendungen auf der Cloudera Data Platform (CDP) zu entwickeln. 

Praktische Übungen ermöglichen, das Schreiben von Spark-Anwendungen zu üben, die mit CDP-Kernkomponenten integriert werden. Sie lernen die Verwendung von Spark SQL zur Abfrage strukturierter Daten, die Verwendung von Hive-Funktionen zum Einlesen und Denormalisieren von Daten und die Arbeit mit "Big Data", die in einem verteilten Dateisystem gespeichert sind.

Nach diesem Kurs sind Sie in der Lage, sich realen Herausforderungen zu stellen. Sie können Anwendungen erstellen, um schnellere und bessere Entscheidungen zu treffen. Weiterhin können Sie Interaktive Analysen durchführen, die auf eine Vielzahl von Anwendungsfällen, Architekturen und Branchen angewendet werden.

Kursinhalt

  • HDFS Introduction
  • YARN Introduction
  • Working with RDDs
  • Working with DataFrames
  • Introduction to Apache Hive
  • Working with Apache Hive
  • Hive and Spark Integration
  • Distributed Processing Challenges
  • Spark Distributed Processing
  • Spark Distributed Persistence
  • Data Engineering Service
  • Workload XM
  • Appendix: Working with Datasets in Scala

E-Book Symbol Die englischsprachigen Original-Unterlagen von Cloudera erhalten Sie als E-Book (pdf).

Zielgruppe

Dieser Kurs ist für Entwickler und Dateningenieure gedacht. 

Voraussetzungen

Es wird erwartet, dass Sie über grundlegende Linux-Kenntnisse und Grundkenntnisse der Programmiersprachen Python oder Scala verfügen. Grundkenntnisse in SQL sind hilfreich. Vorkenntnisse in Spark und Hadoop sind nicht erforderlich.

Hierzu empfehlen wir Ihnen auch unsere Trainings im Bereich Programmiersprachen und Softwareentwicklung sowie Linux.

Kursziel

  • Verteilen, Speichern und Verarbeiten von Daten in einem CDP-Cluster
  • Schreiben, Konfigurieren und Bereitstellen von Apache Spark-Anwendungen
  • Verwendung der Spark-Interpreter und Spark-Anwendungen zur Erkundung, Verarbeiten und Analysieren von verteilten Daten
  • Abfragen von Daten mit Spark SQL, DataFrames und Hive-Tabellen
  • Bereitstellen einer Spark-Anwendung auf dem Data Engineering Service

Classroom Training

Bevorzugen Sie die klassische Trainingsmethode? Ein Kurs in einem unserer Training Center, mit einem kompetenten Trainer und dem direkten Austausch zwischen allen Teilnehmern? Dann buchen Sie einen der Classroom Training Termine!

Online Training

Möchten Sie einen Kurs online besuchen? Zu diesem Kursthema bieten wir Ihnen Online-Kurstermine an. Als Teilnehmer benötigen Sie dazu einen PC mit Internet-Anschluss (mindestens 1 Mbit/s), ein Headset, falls Sie per VoIP arbeiten möchten und optional eine Kamera. Weitere Informationen und technische Empfehlungen finden Sie hier.

Inhouse-Schulung

Benötigen Sie einen maßgeschneiderten Kurs für Ihr Team? Neben unserem Standard-Angebot bieten wir Ihnen an, Kurse speziell nach Ihren Anforderungen zu gestalten. Gerne beraten wir Sie hierzu und erstellen Ihnen ein individuelles Angebot.
Inhouse-Schulung jetzt anfragen >>>
PDF SymbolDie gesamte Beschreibung dieses Kurses mit Terminen und Preisen zum Download als PDF.

Dieser praxisorientierte Kurs vermittelt die wichtigsten Konzepte und Kenntnisse, die Entwickler benötigen, um mit Apache Spark hochleistungsfähige, parallele Anwendungen auf der Cloudera Data Platform (CDP) zu entwickeln. 

Praktische Übungen ermöglichen, das Schreiben von Spark-Anwendungen zu üben, die mit CDP-Kernkomponenten integriert werden. Sie lernen die Verwendung von Spark SQL zur Abfrage strukturierter Daten, die Verwendung von Hive-Funktionen zum Einlesen und Denormalisieren von Daten und die Arbeit mit "Big Data", die in einem verteilten Dateisystem gespeichert sind.

Nach diesem Kurs sind Sie in der Lage, sich realen Herausforderungen zu stellen. Sie können Anwendungen erstellen, um schnellere und bessere Entscheidungen zu treffen. Weiterhin können Sie Interaktive Analysen durchführen, die auf eine Vielzahl von Anwendungsfällen, Architekturen und Branchen angewendet werden.

Kursinhalt

  • HDFS Introduction
  • YARN Introduction
  • Working with RDDs
  • Working with DataFrames
  • Introduction to Apache Hive
  • Working with Apache Hive
  • Hive and Spark Integration
  • Distributed Processing Challenges
  • Spark Distributed Processing
  • Spark Distributed Persistence
  • Data Engineering Service
  • Workload XM
  • Appendix: Working with Datasets in Scala

E-Book Symbol Die englischsprachigen Original-Unterlagen von Cloudera erhalten Sie als E-Book (pdf).

Zielgruppe

Dieser Kurs ist für Entwickler und Dateningenieure gedacht. 

Voraussetzungen

Es wird erwartet, dass Sie über grundlegende Linux-Kenntnisse und Grundkenntnisse der Programmiersprachen Python oder Scala verfügen. Grundkenntnisse in SQL sind hilfreich. Vorkenntnisse in Spark und Hadoop sind nicht erforderlich.

Hierzu empfehlen wir Ihnen auch unsere Trainings im Bereich Programmiersprachen und Softwareentwicklung sowie Linux.

Kursziel

  • Verteilen, Speichern und Verarbeiten von Daten in einem CDP-Cluster
  • Schreiben, Konfigurieren und Bereitstellen von Apache Spark-Anwendungen
  • Verwendung der Spark-Interpreter und Spark-Anwendungen zur Erkundung, Verarbeiten und Analysieren von verteilten Daten
  • Abfragen von Daten mit Spark SQL, DataFrames und Hive-Tabellen
  • Bereitstellen einer Spark-Anwendung auf dem Data Engineering Service

Classroom Training

Bevorzugen Sie die klassische Trainingsmethode? Ein Kurs in einem unserer Training Center, mit einem kompetenten Trainer und dem direkten Austausch zwischen allen Teilnehmern? Dann buchen Sie einen der Classroom Training Termine!

Online Training

Möchten Sie einen Kurs online besuchen? Zu diesem Kursthema bieten wir Ihnen Online-Kurstermine an. Als Teilnehmer benötigen Sie dazu einen PC mit Internet-Anschluss (mindestens 1 Mbit/s), ein Headset, falls Sie per VoIP arbeiten möchten und optional eine Kamera. Weitere Informationen und technische Empfehlungen finden Sie hier.

Inhouse-Schulung

Benötigen Sie einen maßgeschneiderten Kurs für Ihr Team? Neben unserem Standard-Angebot bieten wir Ihnen an, Kurse speziell nach Ihren Anforderungen zu gestalten. Gerne beraten wir Sie hierzu und erstellen Ihnen ein individuelles Angebot.
Inhouse-Schulung jetzt anfragen >>>

PDF SymbolDie gesamte Beschreibung dieses Kurses mit Terminen und Preisen zum Download als PDF.