Cloudera Training Partner Logo

Cloudera Data Scientist Training

Cloudera Training Partner Logo
Dieser Workshop befasst sich mit Enterprise Data Science und maschinenunterstütztem Lernen mit Apache Spark in Cloudera Data Science Workbench (CDSW). Die Teilnehmer verwenden Spark SQL, um Daten zu laden, zu untersuchen, zu bereinigen, zu verbinden und zu analysieren. Weiterhin wird Spark MLlib genutzt, um Pipelines für maschinenunterstütztes Lernen zu spezifizieren, zu trainieren, zu bewerten, abzustimmen und einzusetzen. Sie tauchen in die Grundlagen der Spark-Architektur und des Ausführungsmodells ein, die notwendig sind um ihre Spark-Anwendungen effektiv zu konfigurieren, zu überwachen und abzustimmen. Die Teilnehmer lernen auch, wie Spark mit Schlüsselkomponenten der Cloudera-Plattform wie HDFS, YARN, Hive, Impala und Hue sowie mit ihren bevorzugten Python- oder R-Paketen integriert wird.
 
Die Lerninhalte werden in Form einer Reihe von kurzen Vorlesungen, interaktiven Vorführungen, umfangreichen praktischen Übungen und Diskussionen vermittelt. Die Vorführungen und Übungen zu Apache Spark werden mit Python (mit PySpark) und R (mit sparklyr) in der Cloudera Data Science Workbench (CDSW) durchgeführt.

Kursinhalt

  • Data Science Overview
  • Cloudera Data Science Workbench (CDSW)
  • Science Workbench
  • Workbench Works
  • Workbench
  • Case Study
  • Apache Spark
  • Summarizing and Grouping DataFrames
  • Window Functions
  • Exploring DataFrames
  • Apache Spark Job Execution
  • Processing Text and Training and Evaluating Topic Models
  • Training and Evaluating Recommender Models
  • Running a Spark Application from (CDSW)
  • Columns of a DataFrame
  • Inspecting a Spark SQL DataFrame
  • Transforming DataFrames
  • Monitoring, Tuning, and Configuring Spark Applications
  • Machine Learning Overview
  • Training and Evaluating Regression Models
  • Working with Machine Learning Pipelines
  • Deploying Machine Learning Pipelines
  • Transforming DataFrame Columns
  • Complex Types
  • User-Defined Functions
  • Reading and Writing Data
  • Combining and Splitting DataFrames
  • Training and Evaluating Classification Models
  • Tuning Algorithm Hyperparameters Using Grid Search
  • Training and Evaluating Clustering Models
  • Overview of sparklyr
  • Introduction to Additional CDSW Features

E-Book Symbol Die englischsprachigen Original-Unterlagen von Cloudera erhalten Sie als E-Book (pdf).

Zielgruppe

Der Workshop wird für Data Scientists angeboten, die Python oder R einsetzen, um kleinere Datensätze auf einem einzigen Endgerät zu bearbeiten und die ihre Analysen und Modelle für maschinenunterstütztes Lernen nach oben skalieren müssen, um mit großen Datensätzen und verteilten Clustern arbeiten zu können. Mitarbeiter, die für Datenverarbeitung verantwortlich sind, sowie Entwickler mit Grundkenntnissen in Data Science und maschinenunterstütztem Lernen profitieren ebenfalls von diesem Workshop.

Voraussetzungen

Die Teilnehmer sollten Grundkenntnisse zu Python oder R sowie zu Erarbeitung und Analyse von Daten und der Entwicklung statistischer und maschinenunterstützter Lernmodelle haben. Kenntnisse zu Hadoop oder Spark werden nicht vorausgesetzt.

Classroom Training

Bevorzugen Sie die klassische Trainingsmethode? Ein Kurs in einem unserer Training Center, mit einem kompetenten Trainer und dem direkten Austausch zwischen allen Teilnehmern? Dann buchen Sie einen der Classroom Training Termine!

Online Training

Möchten Sie einen Kurs online besuchen? Zu diesem Kursthema bieten wir Ihnen Online-Kurstermine an. Als Teilnehmer benötigen Sie dazu einen PC mit Internet-Anschluss (mindestens 1 Mbit/s), ein Headset, falls Sie per VoIP arbeiten möchten und optional eine Kamera. Weitere Informationen und technische Empfehlungen finden Sie hier.

Inhouse-Schulung

Benötigen Sie einen maßgeschneiderten Kurs für Ihr Team? Neben unserem Standard-Angebot bieten wir Ihnen an, Kurse speziell nach Ihren Anforderungen zu gestalten. Gerne beraten wir Sie hierzu und erstellen Ihnen ein individuelles Angebot.
Inhouse-Schulung jetzt anfragen >>>
PDF SymbolDie gesamte Beschreibung dieses Kurses mit Terminen und Preisen zum Download als PDF.

Dieser Workshop befasst sich mit Enterprise Data Science und maschinenunterstütztem Lernen mit Apache Spark in Cloudera Data Science Workbench (CDSW). Die Teilnehmer verwenden Spark SQL, um Daten zu laden, zu untersuchen, zu bereinigen, zu verbinden und zu analysieren. Weiterhin wird Spark MLlib genutzt, um Pipelines für maschinenunterstütztes Lernen zu spezifizieren, zu trainieren, zu bewerten, abzustimmen und einzusetzen. Sie tauchen in die Grundlagen der Spark-Architektur und des Ausführungsmodells ein, die notwendig sind um ihre Spark-Anwendungen effektiv zu konfigurieren, zu überwachen und abzustimmen. Die Teilnehmer lernen auch, wie Spark mit Schlüsselkomponenten der Cloudera-Plattform wie HDFS, YARN, Hive, Impala und Hue sowie mit ihren bevorzugten Python- oder R-Paketen integriert wird.
 
Die Lerninhalte werden in Form einer Reihe von kurzen Vorlesungen, interaktiven Vorführungen, umfangreichen praktischen Übungen und Diskussionen vermittelt. Die Vorführungen und Übungen zu Apache Spark werden mit Python (mit PySpark) und R (mit sparklyr) in der Cloudera Data Science Workbench (CDSW) durchgeführt.

Kursinhalt

  • Data Science Overview
  • Cloudera Data Science Workbench (CDSW)
  • Science Workbench
  • Workbench Works
  • Workbench
  • Case Study
  • Apache Spark
  • Summarizing and Grouping DataFrames
  • Window Functions
  • Exploring DataFrames
  • Apache Spark Job Execution
  • Processing Text and Training and Evaluating Topic Models
  • Training and Evaluating Recommender Models
  • Running a Spark Application from (CDSW)
  • Columns of a DataFrame
  • Inspecting a Spark SQL DataFrame
  • Transforming DataFrames
  • Monitoring, Tuning, and Configuring Spark Applications
  • Machine Learning Overview
  • Training and Evaluating Regression Models
  • Working with Machine Learning Pipelines
  • Deploying Machine Learning Pipelines
  • Transforming DataFrame Columns
  • Complex Types
  • User-Defined Functions
  • Reading and Writing Data
  • Combining and Splitting DataFrames
  • Training and Evaluating Classification Models
  • Tuning Algorithm Hyperparameters Using Grid Search
  • Training and Evaluating Clustering Models
  • Overview of sparklyr
  • Introduction to Additional CDSW Features

E-Book Symbol Die englischsprachigen Original-Unterlagen von Cloudera erhalten Sie als E-Book (pdf).

Zielgruppe

Der Workshop wird für Data Scientists angeboten, die Python oder R einsetzen, um kleinere Datensätze auf einem einzigen Endgerät zu bearbeiten und die ihre Analysen und Modelle für maschinenunterstütztes Lernen nach oben skalieren müssen, um mit großen Datensätzen und verteilten Clustern arbeiten zu können. Mitarbeiter, die für Datenverarbeitung verantwortlich sind, sowie Entwickler mit Grundkenntnissen in Data Science und maschinenunterstütztem Lernen profitieren ebenfalls von diesem Workshop.

Voraussetzungen

Die Teilnehmer sollten Grundkenntnisse zu Python oder R sowie zu Erarbeitung und Analyse von Daten und der Entwicklung statistischer und maschinenunterstützter Lernmodelle haben. Kenntnisse zu Hadoop oder Spark werden nicht vorausgesetzt.

Classroom Training

Bevorzugen Sie die klassische Trainingsmethode? Ein Kurs in einem unserer Training Center, mit einem kompetenten Trainer und dem direkten Austausch zwischen allen Teilnehmern? Dann buchen Sie einen der Classroom Training Termine!

Online Training

Möchten Sie einen Kurs online besuchen? Zu diesem Kursthema bieten wir Ihnen Online-Kurstermine an. Als Teilnehmer benötigen Sie dazu einen PC mit Internet-Anschluss (mindestens 1 Mbit/s), ein Headset, falls Sie per VoIP arbeiten möchten und optional eine Kamera. Weitere Informationen und technische Empfehlungen finden Sie hier.

Inhouse-Schulung

Benötigen Sie einen maßgeschneiderten Kurs für Ihr Team? Neben unserem Standard-Angebot bieten wir Ihnen an, Kurse speziell nach Ihren Anforderungen zu gestalten. Gerne beraten wir Sie hierzu und erstellen Ihnen ein individuelles Angebot.
Inhouse-Schulung jetzt anfragen >>>

PDF SymbolDie gesamte Beschreibung dieses Kurses mit Terminen und Preisen zum Download als PDF.