DSS Online #10 MLOps, quando si smette di giocare

Il prossimo appuntamento con il DataScienceSeed online è previsto per lunedi 5 luglio, come al solito a partire dalle ore 18:00. Questa volta parleremo di MLOps con Simone Merello, Head of Deep AI presso Perceptolab.

Registrati su eventbrite per ricevere il link all’evento online:

Ogni giorno sempre più modelli vengono sviluppati per creare nuove funzionalità. Sfortunatamente non appena si ha a che fare con più modelli, dataset e data scientists le cose si complicano. Ciascun esperimento ha molte dipendenze e l’effetto  “changing anything changes everything” rende difficile tenere traccia di cosa sta accadendo. Una soluzione ML-driven richiede di tracciare come un modello è stato prodotto, scelto, distribuito e come si comporta in produzione: il modello di ML è solo un pezzo del puzzle. Simone ci mostrerà alcuni dei problemi più comuni che grosse AI companies hanno nel sviluppare soluzioni basate sul ML e come risolverli.

Simone Merello, inizia la sua carriera come ricercatore in ambito ML presso l’università NTU di Singapore. Successivamente esce dall’ambito accademico per diventare prima Research Scientist ed ora Head of Deep AI presso Perceptolab.

DSS Online #9 – Rumenta Intelligente… ovvero: Economia Circolare e AI

Al prossimo meetup, venerdi 7 maggio a partire dalle ore 18:00, parleremo di un tema “green” ovvero Economia Circolare e Intelligenza Artificiale. Ne discuteremo con Giorgio Spreafico e  Daniele Bonventre di algoWatt S.p.A., green tech solution company che progetta, sviluppa e integra soluzioni per la gestione dell’energia e delle risorse naturali.

Registrati come al solito su eventbrite per ricevere il link all’evento online:

Giorgio e Daniele ci parleranno di soluzioni innovative basate su reti neurali per il supporto alle decisioni nella cosiddetta “biodigestione” di rifiuti solidi urbani.

Un biodigestore è un impianto che funziona trasformando la frazione organica di rifiuti solidi urbani (FORSU) e altre matrici organiche, i quali vengono miscelati con batteri per ottenere biogas (una miscela di diversi tipi di gas composti in prevalenza da metano ed anidride carbonica) tramite un processo di fermentazione in condizioni di assenza di ossigeno e, come residuo, producendo del compost di qualità da utilizzare in agricoltura o compost grigio per la riambientazione di emergenze ambientali

Questi impianti possono essere considerati come fonti di energia rinnovabile, riducendo l’emissione di gas serra. Il recupero energetico dalla produzione di biogas da parte di un biodigestore può arrivare a diversi GWh/anno, producendo milioni di metri cubi di biogas, facendo risparmiare ogni anno milioni tonnellate di CO2 e riducendo il consumo di suolo per lo smaltimento dei rifiuti.

In un primo intervento, Giorgio ci introdurrà l’argomento e le problematiche collegate, seguito da Daniele che invece ci racconterà qualche dettaglio in più dal punto di vista tecnico sulle soluzioni adottate.

Giorgio Spreafico Laurea magistrale in Fisica, ha pluridecennale esperienza di modellistica nei settori ambientali e industriale e di modellazione geostatistica. Attualmente è il responsabile della Divisione Prodotti di algoWatt.

Daniele Bonventre Ha una Laurea magistrale in Fisica presso l’Università degli Studi di Genova. Ha lavorato due anni presso i laboratori Smart Materials dell’Istituto Italiano di Tecnologia ed ora, in qualità di Data Scientist, si occupa dello sviluppo di prodotti basati su Intelligenza Artificiale ed algoritmi di analisi tensoriale.

algoWatt S.p.A. progetta, sviluppa e integra soluzioni per la gestione dell’energia e delle risorse naturali, in modo sostenibile e socialmente responsabile, garantendo un vantaggio competitivo. La Società fornisce sistemi di gestione e controllo che integrano dispositivi, reti, software e servizi con una chiara focalizzazione settoriale: digital energy e utilities, smart cities & enterprises e green mobility.

DSS Online #8 – Apache Spark, un ecosistema poliedrico.

Lascia un feedback su questo evento

Cosa è Apache Spark? Sicuramente una delle più inflazionate buzzword nel mondo del Big Data Analytics ma soprattutto un consolidato standard per il Massive Parallel Processing.

Nel mondo dello streaming tanti sono i competitor ma quando si parla di batch processing, “no way” Spark è un must assoluto. Ci piace definire Spark un ecosistema!

Infatti, grazie alle funzionalità ad esso collegate, come MlLib, Hive, Delta e tante altre rende possibile lo sviluppo di una pipeline end-to-end di dato partendo dall’ingestion, fino alla visualization passando per il Machine Learning. La combinazione di Spark con le sue tecnologie satellite spinge ad un altro livello lo sviluppo di datalake aziendali che permettano una gestione ottimale anche in use case tipici dei classici DWH ma su di una architettura open source molto più economica.

Vediamo insieme come l’ecosistema Spark può essere impiegato per estrarre valore da massive moli di dato sfruttandone al massimo le potenzialità tecniche e commerciali.

Download slide (5M PDF)

 

Andrea Picasso è un Senior Big Data Engineer presso NTTData. Il suo background accademico è in ingegneria del software con specializzazione in Big Data architecture e Machine Learning modeling. Andrea ha preso parte in progetti di ricerca nel mondo dell’intelligenza artificiale nel periodo in cui si trovava a Singapore. Tornato in Italia circa 2 anni fa si è concentrato nell’applicare la sua conoscenza nel mondo dell’industria del Big Data. Le sue attività principali sono il design e lo sviluppo di architetture Big Data per workflow di ETL ed Analytics. Il suo focus tecnologico verte principalmente su tool per il processing distribuito di dato come Spark e Flink, inoltre è un grande promoter del paradigma di programmazione funzionale e del linguaggio Scala.

DSS Online #2: AI e immagini satellitari: UNOSAT AI4EO challenge

 

Continuano gli incontri online di DataScienceSeed, la 2a edizione ha avuto luogo Mercoledi 17 Giugno a partire dalle 18:30. A seguito della vittoria nella UNOSAT AI4EO Challenge, Cristiano Nattero, Andrea Rapuzzi e Marco Chini ci hanno raccontato la loro esperienza alle prese con questa entusiasmante sfida.

Se hai assistito all’incontro o ne hai seguito i video online, lasciaci un Feedback!

Il Challenge è stato lanciato da UNOSAT, un importante programma delle Nazioni Unite per fornire analisi di immagini satellitari, insieme a ESA e CERN openlab ed era volto realizzazione di una soluzione AI4EO (Artificial Intelligence for Earth Observation) per il rilevamento di impronte di edifici in Iraq,  allo scopo supportare il governo locale nella pianificazione di attività di ricostruzione e sviluppo nell’area.

Come hanno affrontato Cristiano, Andrea e Marco le differenti fasi della gara (segmentazione semantica e per istanze di aree urbane in immagini satellitari)? Perchè l’Earth Observation (EO) sta diventando un tema sempre più centrale dell’AI? Quali sono i suoi aspetti peculiari e le sue sfide originali (piattaforme, problematiche specifiche, algoritmi)?

Cristiano Nattero ha un dottorato di ricerca in Ingegneria Matematica e Simulazione, ed un forte background in ottimizzazione combinatoria. Oggi è senior developer in FadeOut Software, dove si occupa principalmente di WASDI, una piattaforma web distribuita a supporto di chi fa analisi di immagini satellitari.

 

Slides di Cristiano (3Mb)

Marco Chini, ingegnere elettronico, ha un dottorato in geofisica. Dal 2013 lavora al Luxembourg Institute of Science and Technology. Tra il 2003 ed il 2012 ha collaborato con il Dipartimento di Ingegneria dell’Informazione, Elettronica e Telecomunicazioni all’Università La Sapienza. Tra il 2006 ed il 2008 è stato Visiting Researcher nel “Department of Aerospace Engineering Science, University of Colorado”, Boulder, dove ha partecipato a progetti di monitoraggio urbano con immagini ottiche ad altissima risoluzione spaziale. Tra il 2008 e il 2012 ha lavorato con il gruppo di telerilevamento dell’ Istituto Nazionale di Geofisica e Vulcanologia, Roma. E’ stato coinvolto in progetti per la mappatura di aree allagate, per individuare i danni causati da terremoti e per la definizione del rischio. I suoi interessi di ricerca includono l’analisi di dati multitemporali, la classificazione, l’estrazione di feature, la data fusion e la segmentazione con immagini SAR ed ottiche, e l’interferometria SAR per applicazioni geofisiche.

Slides di Marco (3Mb)

 

Andrea Rapuzzi è il fondatore di A-SIGN, un’azienda che progetta e sviluppa soluzioni software per diversi domini dell’ingegneria (aerospazio, navale, reti idriche, telecomunicazioni). Ingegnere elettronico per formazione, da 23 anni progetta e sviluppa architetture software. I suoi interessi più recenti di ricerca e sviluppo coinvolgono Machine Learning, Deep Learning, Reinforcement Learning e Probabilistic Programming.

Slides di Andrea (3Mb)

Al talk si sono affiancati Marta Ziosi e Gabriele Graffieti, cofounder e head of research di AI for People, che avevamo già incontrato a Gennaio, con un aggiornamento sul progetto di analisi immagini satellitari nato proprio al meetup di Gennaio.  AI for People  è un’associazione che ha come obiettivo quello di capire e promuovere l’uso dell’intelligenza artificiale per il bene sociale, la cui strategia è quella di condurre analisi, progetti e proposte che comprendono AI e società. L’associazione è formata da un team eterogeneo di persone che ha come scopo quello di creare un cambiamento positivo nella società attraverso l’uso consapevole ed etico della tecnologia.

Slides AI for People (2Mb)