L’intervento si propone di focalizzare l’impatto potenziale del quantum computing sulle applicazioni di data science e di presentare alcune esperienze che possano aiutare a capire se e come iniziare a prendere in considerazione gli algoritmi quantici nello sviluppo di soluzioni innovative. Una prima parte presenterà una introduzione generale al tema ed alle linee di ricerca di QC connesse in particolare alla data science, illustrandone i punti cruciali dal punto di vista computazionale. Una seconda parte si focalizzerà su alcuni esempi di applicazioni e sugli strumenti software per iniziare a lavorare con computer quantistici, almeno a livello di simulazione, nell’attesa di avere uno sulla scrivania…
Ennio Ottaviani è un fisico teorico ed imprenditore. E’ direttore scientifico di OnAIR, dove coordina progetti di ricerca sulle applicazioni di IA in diversi settori dell’industria e dei servizi. E’ docente di Metodi Predittivi nel corso di laurea in Statistica Matematica a Genova.
Francesco Rosasco è un informatico e lavora in OnAIR dalla laurea, specializzandosi sulla computer vision ed i sistemi di riconoscimento automatico. In queste applicazioni cura in particolare anche gli aspetti di parallelizzazione e di efficienza computazionale.
Torniamo a parlare di Machine Learning e di Explanations, ma questa volta con un paradigma del tutto nuovo: Explanatory Learning.
Come possiamo costruire macchine capaci di formulare teorie originali e arricchire la nostra conoscenza, proprio come fanno gli scienziati?
O per essere più precisi: come facciamo a scoprire automaticamente la spiegazione simbolica che ci permetta di effettuare previsioni accurate su un nuovo fenomeno diverso da tutti quelli incontrati prima? Questo problema alla base dell’intelligenza artificiale è stato affrontato dalla Program Synthesis e, più recentemente, dall’Explanatory Learning. La differenza fondamentale tra questi due paradigmi risiede nella natura dell’interprete che dovrebbe digerire la spiegazione generata. In Program Synthesis l’interprete è un rigido compilatore progettato da un uomo, su cui in ultima analisi ricade l’onere di dare un significato alla spiegazione (programma) in output. In Explanatory Learning invece l’interprete non è dato, e deve essere appreso da una raccolta limitata di spiegazioni esistenti abbinate a osservazioni dei corrispondenti fenomeni.
Seguendo l’esempio del Reinforcement Learning con i giochi Atari, in questa chiacchierata illustreremo le sfide dell’Explanatory Learning con Odeen, un gioco che simula l’impresa scientifica in un semplice universo stile Flatlandia. Introdurremo quindi le Critical Rationalist Networks, un approccio basato sul deep learning (Transformers) che si ispira alla teoria epistemologica di Popper per risolvere problemi di EL. Infine confronteremo le CRNs con approcci neurali end-to-end e di Program Synthesis su Odeen, discutendo prestazioni, garanzie, flessibilità ed effettiva spiegabilità dei diversi metodi.
Antonio Norelli è un dottorando di Informatica alla Sapienza di Roma nel laboratorio di ricerca GLADIA, dove lavora con il prof. Emanuele Rodolà su AI e Deep Learning. Fisico di formazione, ha conseguito la laurea magistrale in Informatica e il diploma di eccellenza della SSAS, la Scuola Superiore di Studi Avanzati della Sapienza. Ha lavorato come Research Intern a Spiketrap (startup di San Francisco, USA) e come Applied Scientist Intern ad Amazon Science (Laboratorio Lablet a Tubinga, Germania).
I sistemi più recenti di intelligenza artificiale, come ad esempio quelli basati su deep learning, benché solitamente molto accurati, spesso non consentono una facile compresione delle dinamiche che li portano a generare le proprie “predizioni”.
L’Explainable AI è un campo di ricerca che studia come meglio comprendere ed interpretare sistemi opachi, quali ad esempio le reti neurali, attraverso l’uso di “spiegazioni”. Tali spiegazioni consentono di identificare i meccanismi di funzionamento interni di questi sistemi e conseguentemente di capire se potervi fare affidamento per prendere decisioni. Ad esempio una spiegazione per una predizione corretta generata da una rete neurale consente di capire se tale predizione è corretta per i motivi giusti. Oppure una spiegazione può aiutare a capire per quali ragioni un sistema basato su AI produce una predizione sbagliata e, conseguentemente, può aiutare a capire come migliorare il sistema (o i dati utilizzati per addestrarlo).
In questo intervento vedremo una panoramica sul campo dell’explainable AI, illustrando alcune delle tecniche più conosciute per la generazione di spiegazioni; a seguire verranno presentate delle tecniche di Explainable AI specifiche per sistemi che utilizzano AI per task di data management. Infine vedremo come alcune spiegazioni possono operativamente essere utilizzate per migliorare i sistemi stessi.
Tommaso Teofili è Principal Software Engineer a Red Hat e dottorando all’Università Roma Tre. Svolge attività di ricerca e sviluppo nel campo dell’Explainable AI, nonché appassionato di tematiche di NLP e Information Retrieval. Contribuisce attivamente a diversi progetti open source come membro dell’Apache Software Foundation.
Nel prossimo meetup DataScienceSeed parleremo di un prodotto basato su AI che è partito da Genova, per raggiungere il mercato in USA con l’acquisizione da parte di una multinazionale. Stiamo parlando di Pillo, il robot assistente alla salute, ed i nostri relatori saranno Emanuele Baglini e Antonello Scalmato, che incontreremo online il 23 Marzo a partire dalle 18:00.
Pillo è stato il primo social robot destinato alla salute al mondo. E’ un assistente vocale, in grado di erogare dosi di medicinali in maniera proattiva. Il device riconosce la persona a cui deve dispensare le medicine, erogandole al destinatario alla giusta ora. Pillo aiuta anche i familiari e caregiver a monitorare lo stato di assunzione della terapia, consentendo loro di intervenire.
Pillo Health ha raccolto nel tempo 13 milioni di dollari da diversi investitori, tra cui Stanley Venture e Samsung Venture, ed è passato da solo una idea ad un prodotto realizzato in migliaia di esemplari e commercializzato in USA.
Pillo è stato pluripremiato in diverse occasioni, tra cui alcuni dei più prestigiosi sono stati l’”Intelligent Assistant Award 2019” ad HIMSS 2019 di Orlando e l’”Innovation Award 2019” al CES di Las Vegas.
Nel corso del talk ripercorreremo la crescita di Pillo Health, dall’idea fino all’acquisto da parte di Stanley Black+Decker e passeremo in rassegna gli aspetti chiave dello sviluppo di un prodotto così complesso partendo da zero e con risorse limitate, tra cui avere il team giusto ed una precisa strategia per velocizzare lo sviluppo e utilizzare ogni possibile componente messa a disposizione dal mercato, senza reinventare la ruota.
Emanuele Baglini – Emanuele ha oltre 20 anni di esperienza nell’ingegneria (hardware, software e produzione). Dopo la laurea in ingegneria informatica, ha lavorato nel gruppo di ricerca di robotica dell’Università di Genova. Ha approfondito la conoscenza dei sistemi embedded, delle reti di sensori e, più in generale, di vari campi della robotica. Emanuele ha gestito team di ricerca e sviluppo e ha maturato una profonda esperienza nella gestione, sviluppo e produzione di prodotti complessi. È stato responsabile della gestione operativa e finanziaria di piccole imprese, per le quali ha ricoperto la carica di amministratore delegato. È coautore di articoli accademici e inventore di brevetti internazionali. Emanuele è stato CTO in Pillo Health, dove ha diretto la ricerca e lo sviluppo del prodotto, portandolo da un’idea al prodotto realizzato in migliaia di unità. Attualmente è uno dei co-fondatori di Ermit, dove ricopre il ruolo di CEO.
Antonello Scalmato, Ph.D. – Antonello ha un dottorato di ricerca in Robotica e Ambient Intelligence. Ha lavorato per più di 10 anni in diversi campi dell’intelligenza artificiale, con una specializzazione sulla rappresentazione della conoscenza, ed è autore di oltre 20 articoli su questi temi di ricerca. È coautore di diversi brevetti, in particolare di uno relativo al Context Awareness in Smart Home e di uno dei brevetti di Pillo Health relativi al Robot e alle sue funzionalità. Negli anni è diventato un esperto di architettura di servizi basati sul cloud. In Pillo Health è stato il Director of Cloud and AI services. Attualmente è uno dei co-fondatori di Ermit, dove ricopre il ruolo di Director of Cloud & Intelligent Services.
Ultimo appuntamento dell’anno con i meetup di datascienceseed. Con la nuova formula ibrida con l’incontro in presenza aperto agli iscritti all’associazione, insieme al nostro usuale streaming sul canale youtube, ci vediamo poco prima di natale Giovedi 16 Dicembre, a partire dalle ore 18:00 per parlare di buchi e crepe.
Registrazione su eventbrite seguendo il link qui sotto: La prenotazione su eventbrite riguarda per il momento l’accesso web. Dobbiamo ancora avere le conferme finali per consentire ai soci dell’associazione DataScienceSeed di partecipare in presenza.
Andrea Ranieri, ricercatore del CNR-IMATI di Genova, ci descriverà una applicazione del deep-learning ad un problema ben noto a chiunque abbia percorso una strada asfaltata: la manutenzione del manto stradale.
L’infrastruttura stradale è uno dei pilastri delle moderne società: essa rende possibile il trasporto efficiente di persone e merci laddove altre modalità di trasporto non potrebbero competere in termini di costo.
Tuttavia l’asfalto stradale tende a deteriorarsi col tempo, con l’utilizzo e a causa dei fenomeni atmosferici ed ambientali. E’ proprio la capillarità dell’infrastruttura stradale, il suo maggior pregio, che la rende anche molto difficile e costosa da monitorare e manutenere – solo negli US, sia i danni agli automobilisti che per la manutenzione delle strade sono stimati in “billions USD/year”.
Ad oggi, in Italia come anche nella maggioranza dei Paesi nel mondo, il rilevamento dei danni al manto stradale avviene manualmente, con operatori specializzati in campo e costose attrezzature. Questo limita molto l’efficacia del monitoraggio da parte degli enti preposti alla manutenzione.
Il CNR di Genova ha recentemente iniziato ad applicare la Computer Vision, le Reti Neurali e l’Intelligenza Artificiale al problema della pothole e crack detection sul manto stradale. L’approccio scelto è quello di eseguire la segmentazione semantica di immagini stradali per individuare in modo molto preciso sia buche che fessurazioni.
Andrea ci racconterà come è possibile fare tutto questo, e quali sono gli scenari futuri resi possibili dall’utilizzo di self-supervised learning e telecamere RGB-D.
Andrea Ranieri è ricercatore presso il Consiglio Nazionale delle Ricerche, Istituto di Matematica Applicata e Tecnologie Informatiche (IMATI), dove si occupa di Deep Learning e AI principalmente in ambito Computer Vision. Andrea ha una laurea in Ingegneria Informatica, un Dottorato di Ricerca in Scienze ed Ingegneria dello Spazio e un background tecnologico estremamente vario che va da networking e sistemi distribuiti a robotica e perception. Usa Linux quotidianamente da più di 15 anni e Python e Fast.ai da neanche 3. I suoi interessi di ricerca vanno dalla segmentazione di immagini al self-supervised learning, passando per tecniche “context-aware” per la data augmentation.
Finalmente, dopo più di un anno passato pandemicamente online, i meetup DataScienceSeed tornano a svolgersi parzialmente in presenza, per il momento (per motivi di capienza dei locali) limitatamente ai soci iscritti all’associazione.
Carlo Nardone, Senior Solution Architect ad NVIDIA ci ha presentato alcuni trend dei modelli Deep Learning allo stato dell’arte e le conseguenze dal punto di vista dell’infrastruttura necessaria, con esempi concreti proposti da NVIDIA partendo dalle scale estreme fino agli strumenti software disponibili per la più ampia platea possibile di sviluppatori di applicazioni d’Intelligenza Artificiale.
Fisico di formazione, Carlo Nardone si è occupato di calcolo ad alte prestazioni (HPC) sviluppando codici di simulazione numerica su piattaforme massicciamente parallele sin dai tempi della Connection Machine ormai 30 anni fa. Oggi tutti hanno facilmente accesso a una piattaforma dello stesso tipo grazie alle GPU, mentre nel frattempo la vera “killer app” dell’HPC e del Calcolo Parallelo si è rivelata essere l’Intelligenza Artificiale grazie all’esplosione del Deep Learning. Dopo esperienze al CRS4, Quadrics (società Finmeccanica), Sun Microsystems, dieci anni fa ha puntato sull’adozione degli acceleratori NVIDIA come tecnologia innovativa per l’HPC aiutando fra l’altro una grande istituzione finanziaria italiana a portare i propri codici su CUDA. Da sette anni è in NVIDIA come Senior Solution Architect del team EMEA con focus sull’infrastruttura e sulle piattaforme dedicate all’IA: la famiglia NVIDIA DGX, DGX POD, DGX SuperPOD.
Demo Center NT Nuove Tecnologie per DataScienceSeed
Durante il meetup è stato presentato il demo center offerto per DataScienceSeed da NT Nuove Tecnologie, equipaggiato col supporto di NVIDIA ed ospitato nel data center di Liguria Digitale.
Ogni giorno sempre più modelli vengono sviluppati per creare nuove funzionalità. Sfortunatamente non appena si ha a che fare con più modelli, dataset e data scientists le cose si complicano. Ciascun esperimento ha molte dipendenze e l’effetto “changing anything changes everything” rende difficile tenere traccia di cosa sta accadendo. Una soluzione ML-driven richiede di tracciare come un modello è stato prodotto, scelto, distribuito e come si comporta in produzione: il modello di ML è solo un pezzo del puzzle. Simone ci mostrerà alcuni dei problemi più comuni che grosse AI companies hanno nel sviluppare soluzioni basate sul ML e come risolverli.
Simone Merello, inizia la sua carriera come ricercatore in ambito ML presso l’università NTU di Singapore. Successivamente esce dall’ambito accademico per diventare prima Research Scientist ed ora Head of Deep AI presso Perceptolab.
Al prossimo meetup, venerdi 7 maggio a partire dalle ore 18:00, parleremo di un tema “green” ovvero Economia Circolare e Intelligenza Artificiale. Ne discuteremo con Giorgio Spreafico e Daniele Bonventre di algoWatt S.p.A., green tech solution company che progetta, sviluppa e integra soluzioni per la gestione dell’energia e delle risorse naturali.
Registrati come al solito su eventbrite per ricevere il link all’evento online:
Giorgio e Daniele ci parleranno di soluzioni innovative basate su reti neurali per il supporto alle decisioni nella cosiddetta “biodigestione” di rifiuti solidi urbani.
Un biodigestore è un impianto che funziona trasformando la frazione organica di rifiuti solidi urbani (FORSU) e altre matrici organiche, i quali vengono miscelati con batteri per ottenere biogas (una miscela di diversi tipi di gas composti in prevalenza da metano ed anidride carbonica) tramite un processo di fermentazione in condizioni di assenza di ossigeno e, come residuo, producendo del compost di qualità da utilizzare in agricoltura o compost grigio per la riambientazione di emergenze ambientali
Questi impianti possono essere considerati come fonti di energia rinnovabile, riducendo l’emissione di gas serra. Il recupero energetico dalla produzione di biogas da parte di un biodigestore può arrivare a diversi GWh/anno, producendo milioni di metri cubi di biogas, facendo risparmiare ogni anno milioni tonnellate di CO2 e riducendo il consumo di suolo per lo smaltimento dei rifiuti.
In un primo intervento, Giorgio ci introdurrà l’argomento e le problematiche collegate, seguito da Daniele che invece ci racconterà qualche dettaglio in più dal punto di vista tecnico sulle soluzioni adottate.
Giorgio Spreafico Laurea magistrale in Fisica, ha pluridecennale esperienza di modellistica nei settori ambientali e industriale e di modellazione geostatistica. Attualmente è il responsabile della Divisione Prodotti di algoWatt.
Daniele Bonventre Ha una Laurea magistrale in Fisica presso l’Università degli Studi di Genova. Ha lavorato due anni presso i laboratori Smart Materials dell’Istituto Italiano di Tecnologia ed ora, in qualità di Data Scientist, si occupa dello sviluppo di prodotti basati su Intelligenza Artificiale ed algoritmi di analisi tensoriale.
algoWatt S.p.A. progetta, sviluppa e integra soluzioni per la gestione dell’energia e delle risorse naturali, in modo sostenibile e socialmente responsabile, garantendo un vantaggio competitivo. La Società fornisce sistemi di gestione e controllo che integrano dispositivi, reti, software e servizi con una chiara focalizzazione settoriale: digital energy e utilities, smart cities & enterprises e green mobility.
Cosa è Apache Spark? Sicuramente una delle più inflazionate buzzword nel mondo del Big Data Analytics ma soprattutto un consolidato standard per il Massive Parallel Processing.
Nel mondo dello streaming tanti sono i competitor ma quando si parla di batch processing, “no way” Spark è un must assoluto. Ci piace definire Spark un ecosistema!
Infatti, grazie alle funzionalità ad esso collegate, come MlLib, Hive, Delta e tante altre rende possibile lo sviluppo di una pipeline end-to-end di dato partendo dall’ingestion, fino alla visualization passando per il Machine Learning. La combinazione di Spark con le sue tecnologie satellite spinge ad un altro livello lo sviluppo di datalake aziendali che permettano una gestione ottimale anche in use case tipici dei classici DWH ma su di una architettura open source molto più economica.
Vediamo insieme come l’ecosistema Spark può essere impiegato per estrarre valore da massive moli di dato sfruttandone al massimo le potenzialità tecniche e commerciali.
Andrea Picasso è un Senior Big Data Engineer presso NTTData. Il suo background accademico è in ingegneria del software con specializzazione in Big Data architecture e Machine Learning modeling. Andrea ha preso parte in progetti di ricerca nel mondo dell’intelligenza artificiale nel periodo in cui si trovava a Singapore. Tornato in Italia circa 2 anni fa si è concentrato nell’applicare la sua conoscenza nel mondo dell’industria del Big Data. Le sue attività principali sono il design e lo sviluppo di architetture Big Data per workflow di ETL ed Analytics. Il suo focus tecnologico verte principalmente su tool per il processing distribuito di dato come Spark e Flink, inoltre è un grande promoter del paradigma di programmazione funzionale e del linguaggio Scala.
Continuano gli incontri online di DataScienceSeed, la 2a edizione ha avuto luogo Mercoledi 17 Giugno a partire dalle 18:30. A seguito della vittoria nella UNOSAT AI4EO Challenge, Cristiano Nattero, Andrea Rapuzzi e Marco Chini ci hanno raccontato la loro esperienza alle prese con questa entusiasmante sfida.
Il Challenge è stato lanciato da UNOSAT, un importante programma delle Nazioni Unite per fornire analisi di immagini satellitari, insieme a ESA e CERN openlab ed era volto realizzazione di una soluzione AI4EO (Artificial Intelligence for Earth Observation) per il rilevamento di impronte di edifici in Iraq, allo scopo supportare il governo locale nella pianificazione di attività di ricostruzione e sviluppo nell’area.
Come hanno affrontato Cristiano, Andrea e Marco le differenti fasi della gara (segmentazione semantica e per istanze di aree urbane in immagini satellitari)? Perchè l’Earth Observation (EO) sta diventando un tema sempre più centrale dell’AI? Quali sono i suoi aspetti peculiari e le sue sfide originali (piattaforme, problematiche specifiche, algoritmi)?
Cristiano Nattero ha un dottorato di ricerca in Ingegneria Matematica e Simulazione, ed un forte background in ottimizzazione combinatoria. Oggi è senior developer in FadeOut Software, dove si occupa principalmente di WASDI, una piattaforma web distribuita a supporto di chi fa analisi di immagini satellitari.
Marco Chini, ingegnere elettronico, ha un dottorato in geofisica. Dal 2013 lavora al Luxembourg Institute of Science and Technology. Tra il 2003 ed il 2012 ha collaborato con il Dipartimento di Ingegneria dell’Informazione, Elettronica e Telecomunicazioni all’Università La Sapienza. Tra il 2006 ed il 2008 è stato Visiting Researcher nel “Department of Aerospace Engineering Science, University of Colorado”, Boulder, dove ha partecipato a progetti di monitoraggio urbano con immagini ottiche ad altissima risoluzione spaziale. Tra il 2008 e il 2012 ha lavorato con il gruppo di telerilevamento dell’ Istituto Nazionale di Geofisica e Vulcanologia, Roma. E’ stato coinvolto in progetti per la mappatura di aree allagate, per individuare i danni causati da terremoti e per la definizione del rischio. I suoi interessi di ricerca includono l’analisi di dati multitemporali, la classificazione, l’estrazione di feature, la data fusion e la segmentazione con immagini SAR ed ottiche, e l’interferometria SAR per applicazioni geofisiche.
Andrea Rapuzzi è il fondatore di A-SIGN, un’azienda che progetta e sviluppa soluzioni software per diversi domini dell’ingegneria (aerospazio, navale, reti idriche, telecomunicazioni). Ingegnere elettronico per formazione, da 23 anni progetta e sviluppa architetture software. I suoi interessi più recenti di ricerca e sviluppo coinvolgono Machine Learning, Deep Learning, Reinforcement Learning e Probabilistic Programming.
Al talk si sono affiancati Marta Ziosi e Gabriele Graffieti, cofounder e head of research di AI for People, che avevamo già incontrato a Gennaio, con un aggiornamento sul progetto di analisi immagini satellitari nato proprio al meetup di Gennaio. AI for People è un’associazione che ha come obiettivo quello di capire e promuovere l’uso dell’intelligenza artificiale per il bene sociale, la cui strategia è quella di condurre analisi, progetti e proposte che comprendono AI e società. L’associazione è formata da un team eterogeneo di persone che ha come scopo quello di creare un cambiamento positivo nella società attraverso l’uso consapevole ed etico della tecnologia.