Cloudera Training Partner Logo

Developer Training for Spark & Hadoop

Cloudera Training Partner Logo

Hinweis: Dieser Kurs wird von Cloudera nicht mehr angeboten, da die Zertifizierung zum CCA Spark and Hadoop Developer eingestellt wurde.

Dieser praxisorientierte Kurs vermittelt die wichtigsten Konzepte und Fachkenntnisse, die Entwickler benötigen, um mit Apache Spark parallele Hochleistungsanwendungen zu entwickeln. Die Teilnehmer lernen, wie sie mit Spark SQL strukturierte Daten abfragen und mit Stream Streaming Daten aus verschiedenen Quellen in Echtzeit verarbeiten können. Die Entwickler üben auch das Schreiben von Anwendungen, die Core Spark verwenden, um ETL-Verarbeitung und iterative Algorithmen auszuführen. In diesem Kurs wird erläutert, wie Sie mit „Big Data“ arbeiten, die in einem verteilten Dateisystem gespeichert sind, und Spark-Anwendungen in einem Hadoop-Cluster ausführen. Nach diesem Kurs sind die Teilnehmer bereit, sich den Herausforderungen der realen Welt zu stellen und Anwendungen zu entwickeln, um schnellere Entscheidungen, bessere Entscheidungen und interaktive Analysen durchzuführen, die in einer Vielzahl von Anwendungsfällen, Architekturen und Branchen angewendet werden.

Kursinhalt

  • Introduction
  • Introduction to Apache Hadoop and the Hadoop Ecosystem
  • Apache Hadoop File Storage
  • Distributed Processing on an Apache Hadoop Cluster
  • Apache Spark Basics
  • Working with DataFrames and Schemas
  • Analyzing Data with DataFrame Queries
  • RDD Overview
  • Transforming Data with RDDs
  • Aggregating Data with Pair RDDs
  • Querying Tables and Views with SQL
  • Working with Datasets in Scala
  • Writing, Configuring, and Running Spark Applications
  • Spark Distributed Processing
  • Distributed Data Persistence
  • Common Patterns in Apache Spark Data Processing
  • Introduction to Structured Streaming
  • Structured Streaming with Apache Kafka
  • Aggregating and Joining Streaming DataFrames
  • Conclusion
  • Message Processing with Apache Kafka

E-Book Symbol Die englischsprachigen Original-Unterlagen von Cloudera erhalten Sie als E-Book (pdf).

Zielgruppe

Dieser Kurs richtet sich an Entwickler und Ingenieure mit Programmiererfahrung. Vorkenntnisse von Spark und Hadoop sind jedoch nicht erforderlich.

Voraussetzungen

Apache Spark-Beispiele und praktische Übungen werden in Scala und Python vorgestellt. Die Fähigkeit, in einer dieser Sprachen zu programmieren, ist erforderlich. Es wird vorausgesetzt, dass Sie mit der Linux-Befehlszeile vertraut sind. Grundkenntnisse in SQL sind hilfreich.

Classroom Training

Bevorzugen Sie die klassische Trainingsmethode? Ein Kurs in einem unserer Training Center, mit einem kompetenten Trainer und dem direkten Austausch zwischen allen Teilnehmern? Dann buchen Sie einen der Classroom Training Termine!

Online Training

Möchten Sie einen Kurs online besuchen? Zu diesem Kursthema bieten wir Ihnen Online-Kurstermine an. Als Teilnehmer benötigen Sie dazu einen PC mit Internet-Anschluss (mindestens 1 Mbit/s), ein Headset, falls Sie per VoIP arbeiten möchten und optional eine Kamera. Weitere Informationen und technische Empfehlungen finden Sie hier.

Inhouse-Schulung

Benötigen Sie einen maßgeschneiderten Kurs für Ihr Team? Neben unserem Standard-Angebot bieten wir Ihnen an, Kurse speziell nach Ihren Anforderungen zu gestalten. Gerne beraten wir Sie hierzu und erstellen Ihnen ein individuelles Angebot.
Inhouse-Schulung jetzt anfragen >>>
PDF SymbolDie gesamte Beschreibung dieses Kurses mit Terminen und Preisen zum Download als PDF.

Hinweis: Dieser Kurs wird von Cloudera nicht mehr angeboten, da die Zertifizierung zum CCA Spark and Hadoop Developer eingestellt wurde.

Dieser praxisorientierte Kurs vermittelt die wichtigsten Konzepte und Fachkenntnisse, die Entwickler benötigen, um mit Apache Spark parallele Hochleistungsanwendungen zu entwickeln. Die Teilnehmer lernen, wie sie mit Spark SQL strukturierte Daten abfragen und mit Stream Streaming Daten aus verschiedenen Quellen in Echtzeit verarbeiten können. Die Entwickler üben auch das Schreiben von Anwendungen, die Core Spark verwenden, um ETL-Verarbeitung und iterative Algorithmen auszuführen. In diesem Kurs wird erläutert, wie Sie mit „Big Data“ arbeiten, die in einem verteilten Dateisystem gespeichert sind, und Spark-Anwendungen in einem Hadoop-Cluster ausführen. Nach diesem Kurs sind die Teilnehmer bereit, sich den Herausforderungen der realen Welt zu stellen und Anwendungen zu entwickeln, um schnellere Entscheidungen, bessere Entscheidungen und interaktive Analysen durchzuführen, die in einer Vielzahl von Anwendungsfällen, Architekturen und Branchen angewendet werden.

Kursinhalt

  • Introduction
  • Introduction to Apache Hadoop and the Hadoop Ecosystem
  • Apache Hadoop File Storage
  • Distributed Processing on an Apache Hadoop Cluster
  • Apache Spark Basics
  • Working with DataFrames and Schemas
  • Analyzing Data with DataFrame Queries
  • RDD Overview
  • Transforming Data with RDDs
  • Aggregating Data with Pair RDDs
  • Querying Tables and Views with SQL
  • Working with Datasets in Scala
  • Writing, Configuring, and Running Spark Applications
  • Spark Distributed Processing
  • Distributed Data Persistence
  • Common Patterns in Apache Spark Data Processing
  • Introduction to Structured Streaming
  • Structured Streaming with Apache Kafka
  • Aggregating and Joining Streaming DataFrames
  • Conclusion
  • Message Processing with Apache Kafka

E-Book Symbol Die englischsprachigen Original-Unterlagen von Cloudera erhalten Sie als E-Book (pdf).

Zielgruppe

Dieser Kurs richtet sich an Entwickler und Ingenieure mit Programmiererfahrung. Vorkenntnisse von Spark und Hadoop sind jedoch nicht erforderlich.

Voraussetzungen

Apache Spark-Beispiele und praktische Übungen werden in Scala und Python vorgestellt. Die Fähigkeit, in einer dieser Sprachen zu programmieren, ist erforderlich. Es wird vorausgesetzt, dass Sie mit der Linux-Befehlszeile vertraut sind. Grundkenntnisse in SQL sind hilfreich.

Classroom Training

Bevorzugen Sie die klassische Trainingsmethode? Ein Kurs in einem unserer Training Center, mit einem kompetenten Trainer und dem direkten Austausch zwischen allen Teilnehmern? Dann buchen Sie einen der Classroom Training Termine!

Online Training

Möchten Sie einen Kurs online besuchen? Zu diesem Kursthema bieten wir Ihnen Online-Kurstermine an. Als Teilnehmer benötigen Sie dazu einen PC mit Internet-Anschluss (mindestens 1 Mbit/s), ein Headset, falls Sie per VoIP arbeiten möchten und optional eine Kamera. Weitere Informationen und technische Empfehlungen finden Sie hier.

Inhouse-Schulung

Benötigen Sie einen maßgeschneiderten Kurs für Ihr Team? Neben unserem Standard-Angebot bieten wir Ihnen an, Kurse speziell nach Ihren Anforderungen zu gestalten. Gerne beraten wir Sie hierzu und erstellen Ihnen ein individuelles Angebot.
Inhouse-Schulung jetzt anfragen >>>

PDF SymbolDie gesamte Beschreibung dieses Kurses mit Terminen und Preisen zum Download als PDF.