Descrizione
Chi dovrebbe partecipare
Questo corso è progettato per chi intende analizzare grandi dataset in ambienti di tipo big data. E’ anche consigliato per gli sviluppatori che necessitano di integrare R analysis nelle loro soluzioni.
Prerequisiti
In aggiunta alla loro esperienza professionale, gli studenti che partecipano a questo corso dovrebbe avere:
- Esperienza nell’utilizzo di R, e famigliarità con i pacchetti di R.
- Conoscenza di metodi statistici e best practices in ambito data analysis.
- Conoscenza base del sistema operativo Microsoft Windows e delle sue funzionalità.
- Esperienza lavorativa su database relazionali.
Obiettivi del Corso
- Spiegare come funzionano Microsoft R Server & Microsoft R Client
- Usare R Client con R Server per esplorare big data in data stores differenti
- Visualizzare dati utilizzando grafici e plots
- Trasformare e pulire big data set
- Implementare opzioni per Split Analysis Jobs in task paralleli
- Costruire e valutare modelli di regresso generati da big data
- Creare e distribuire modelli generati da big data
- Usare R in ambienti SQL Server e Hadoop
Corso successivo consigliato
Contenuti del Corso
Questo corso insegna come utilizzare Microsoft R Server per creare ed eseguire analisi su grandi dataset, e mostra come utilizzarlo in un contesto di tipo Big Data, come Hadoop, Spark cluster o SQL Server database.