Performing Data Engineering on Microsoft HDInsight

1,500.00

Lo scopo principale del corso è fornire agli studenti il ​​piano di abilità e implementare flussi di lavoro di big data su HDInsight.

Descrizione

Chi dovrebbe partecipare

Il target principale di questo corso è costituito da ingegneri di dati, architetti di dati, data scientist e sviluppatori di dati che intendono implementare flussi di lavoro di ingegneria di big data su HDInsight.

 

Prerequisiti

Oltre alla loro esperienza professionale, gli studenti che frequentano questo corso dovrebbero avere:

  • Esperienza di programmazione con R e familiarità con i pacchetti R comuni
  • Conoscenza dei metodi statistici comuni e delle migliori pratiche di analisi dei dati.
  • Conoscenza di base del sistema operativo Microsoft Windows e delle sue funzionalità principali.
  • Conoscenza operativa di database relazionali.

 

Obiettivi del Corso

Dopo aver completato questo corso, gli studenti saranno in grado di:

  • Distribuire i cluster HDInsight.
  • Autorizzazione degli utenti ad accedere alle risorse.
  • Caricamento dei dati in HDInsight.
  • Risoluzione dei problemi di HDInsight.
  • Implementare soluzioni batch.
  • Progettare soluzioni ETL in batch per big data con Spark
  • Analizzare i dati con Spark SQL.
  • Analizzare i dati con Hive e Phoenix.
  • Descrivere Stream Analytics.
  • Implementare Spark Streaming utilizzando l’API DStream.
  • Sviluppare soluzioni di elaborazione in tempo reale di Big Data con Apache Storm.
  • Creare soluzioni che utilizzano Kafka e HBase.

Contenuti del Corso

  • Introduzione a HDInsight
  • Distribuzione di cluster HDInsight
  • Autorizzazione degli utenti ad accedere alle risorse
  • Caricamento dei dati in HDInsight
  • Risoluzione dei problemi di HDInsight
  • Implementazione di soluzioni batch
  • Progettare soluzioni ETL in batch per big data con Spark
  • Analizzare i dati con Spark SQL
  • Analizzare i dati con Hive e Phoenix
  • Stream Analytics
  • Implementazione di soluzioni di streaming con Kafka e HBase
  • Sviluppa soluzioni di elaborazione in tempo reale di big data con Apache Storm
  • Crea applicazioni Spark Streaming

Informazioni aggiuntive

durata

5 giorni

erogazione

Flex, in Aula, On Site, Remoto