Pachyderm
Impara l’arte del data versioning e della gestione delle pipeline con il nostro corso su Pachyderm. Impara a installare, configurare e utilizzare Pachyderm per l’elaborazione e l’analisi scalabile dei dati. Esplora argomenti come la creazione di pipeline, l’integrazione con OpenCV e la gestione efficiente del flusso di dati. Che tu sia un ingegnere dei dati o un professionista dell’apprendimento automatico, DSAI106 ti fornisce gli strumenti e le tecniche per ottimizzare i flussi di lavoro dei dati e migliorare la produttività.
CODE: DSAI106
Category: Corso Intelligenza Artificiale
Metodologia didattica
Il corso prevede laboratori didattici in cui ogni studente potrà svolgere esercizi di formazione che forniranno esperienza pratica nell’uso dello strumento, per ognuno degli argomenti trattati durante il corso.
Prerequisiti
- Comprensione dei comandi Linux di base per la gestione dei file, la navigazione del sistema e l’installazione dei pacchetti.
- Comprensione di base dei concetti di Docker.
- Comprensione dei concetti base di Python.
La seguente è una panoramica dei contenuti del corso:
- Installazione di Pachyderm: Questa sezione ti guida attraverso il processo di installazione di Pachyderm, uno strumento open-source per il versioning dei dati e la gestione delle pipeline, assicurandoti una configurazione senza problemi nel tuo ambiente.
- Concetti chiave: Esplora i concetti fondamentali alla base di Pachyderm, tra cui il versioning dei dati, il data lineage, le pipeline e l’elaborazione dei dati a controllo di versione.
- Pipeline: Impara a creare, gestire ed eseguire le pipeline in Pachyderm, consentendoti di automatizzare i flussi di lavoro di elaborazione dei dati e di semplificare le attività di trasformazione dei dati.
- Integrazione di OpenCV: Approfondisci l’integrazione di Pachyderm con OpenCV, una popolare libreria di computer vision, che ti permetterà di eseguire un’elaborazione e un’analisi avanzata delle immagini all’interno delle tue pipeline di dati.
- Elaborazione multimediale: Esplora le tecniche di elaborazione multimediale con Pachyderm, compresa la gestione di immagini, video e dati audio all’interno dei tuoi flussi di lavoro, con particolare attenzione all’elaborazione e all’analisi efficiente.
- Gestione dei flussi di dati: Scopri come gestire efficacemente i flussi di dati in Pachyderm, affrontando argomenti come l’ingestione dei dati in tempo reale, l’elaborazione dei flussi e l’integrazione con le fonti di dati in streaming.
Al termine del corso, i partecipanti saranno in grado di:
- Installare e configurare Pachyderm su un sistema Linux.
- Creare e gestire pipeline di dati utilizzando Pachyderm per l’elaborazione e l’analisi dei dati.
- Utilizzare OpenCV per l’elaborazione di immagini e video in ambienti Docker.
- Applicare trasformazioni e filtri a immagini e video utilizzando le funzioni di OpenCV.
- Utilizzare Pachyderm per una gestione efficiente dei flussi di dati in ambienti di sviluppo e di produzione.
- Implementare complessi flussi di lavoro di elaborazione dei dati utilizzando Pachyderm e Docker per ottenere risultati scalabili e riproducibili.
Durata – 1 giorno
Erogazione – in aula, in loco, da remoto
Requisiti PC e SW:
- Connessione a Internet
- Browser web, Google Chrome
- Zoom
Lingua
- Istruttore: Italiano
- Laboratori: Inglese
- Slides: Inglese