DataScienceSeed #11 – AI for People & Regione Liguria

Con il nuovo anno sono ripresi i meetups di DataScienceSeed! L’undicesima edizione ha visto ospiti AI for People, un’associazione che ha come obiettivo quello di capire e promuovere l’uso dell’intelligenza artificiale per il bene sociale, e l’ufficio cartografico di Regione Liguria, che ha presentato uno studio per l’estrazione di informazioni di interesse territoriale ed ambientale da immagini satellitari.

Se hai partecipato all’evento, lasciaci un feedback


Obiettivi, Rischi e contromisure nell’era dell’intelligenza artificiale

L’intelligenza artificiale (AI) ha avuto nell’ultimo decennio uno sviluppo ed un successo tale da trasformare in maniera definitiva la società in cui viviamo, rendendoci profondamente legati ad essa ed ai suoi servizi. Ma chi controlla l’intelligenza artificiale? Quali sono i rischi associati ad essa? Come possono intervenire le istituzioni per evitare che pochi individui controllino una tecnologia così fondamentale? In questo talk abbiamo esplorato i maggiori rischi tecnologici, etici e sociali associati ad uno scorretto sviluppo dell’AI, ed alcune contromisure per ridurli o evitarli. Sono stati inoltre presentati esempi e progetti in una visione di AI come tecnologia al servizio dei bisogni del cittadino.

Gabriele Graffieti  è uno studente di dottorato in Data Science and Computation all’università di Bologna, e Head of AI research ad AI for People. I suoi maggiori interessi sono modelli generativi, continual learning e bio-inspired artificial intelligence, in particolare il ruolo della capacità di generazione di informazioni durante l’apprendimento e la sua relazione con la memoria. Oltre a ciò è fortemente interessato nella filosofia e nell’etica dell’intelligenza artificiale, specialmente nell’individuazione e nella risoluzione dei rischi associati al suo sviluppo..

AI for People  è un’associazione che ha come obiettivo quello di capire e promuovere l’uso dell’intelligenza artificiale per il bene sociale. La nostra strategia è quella di condurre analisi, progetti e proposte che comprendono AI e società. Siamo un team eterogenero di persone che ha come scopo quello di creare un cambiamento positivo nella società attraverso l’uso consapevole ed etico della tecnologia.

 

 


Utilizzo di immagini satellitari gratuite per l’aggiornamento cartografico e lo studio del territorio in Regione Liguria

La costellazione europea di satelliti Sentinel ha incrementato le prospettive di ricerca nel settore del monitoraggio del territorio, dei cambiamenti climatici, dell’agricoltura, nella gestione delle emergenze e della sicurezza dei cittadini, fornendo dati gratuiti con elevata risoluzione spaziale, temporale e radiometrica. Avvalendosi di questi dati, l’ufficio cartografico di Regione Liguria (SITAR) sta sperimentando una serie di procedure per estrarre dalle immagini telerilevate informazioni di grande interesse territoriale ed ambientale, quali aree incendiate, variazioni di biomassa vegetale, evoluzione del tessuto urbanizzato. In questo ambito, lo sfruttamento delle potenzialità dell’AI potrebbe garantire un notevole miglioramento di tali procedure, incrementando sia l’estensione territoriale analizzata, che la frequenza di aggiornamento delle mappe tematiche.

Andrea De Felici è geologo e geomatico presso l’ufficio dei servizi informativi territoriali ed ambientali di Regione Liguria (SITAR) e si occupa di Sistemi Informativi Territoriali, Telerilevamento e reti GNSS. Il SITAR produce, aggiorna e distribuisce ai cittadini dati cartografici ed alfanumerici riguardanti il territorio e l’ambiente ligure, curando l’organizzazione e lo sviluppo del sistema informativo ambientale e territoriale e realizzando l’Infrastruttura per l’Informazione Geografica ligure integrata.

 


Il meetup DataScienceSeed fa parte delle iniziative dell’associazione

IAML, Italian Association for Machine Learning

DataScienceSeed#10 @C1A0 EXPO

Il decimo meetup di datascienceseed è stato ospitato nel contesto del C1A0 EXPO – Accessible Innovation, la fiera internazionale dedicata all’Intelligenza Artificiale, che si à svolta a Genova il 15-16 novembre 2019, a Palazzo San Giorgio.

Abbiamo avuto il piacere di ospitare tre relatori selezionati con call nazionale nei mesi scorsi. Il risultato è stata una carrellata approfondita tra le applicazioni principali del deep learning:
  • Natural Language Processing, con Cristiano De Nobili
  • Internet Of Things, con Emanuele Pomante
  • Computer Vision, con Alessandro Ferrari

Di seguito i video ed il materiale degli interventi!


State-of-the-art concepts in NLP and their limits

Come una macchina può comprendere il linguaggio? Quali erano e come stanno evolvendo gli algoritmi? Quali sono i successi e soprattutto i limiti? Alla base dei moderni algoritmi di deep learning per il linguaggio ci sono dei meccanismi molto semplici che hanno rivoluzionato il settore. Tra questi troviamo il concetto di Autoencoder e il meccanismo di Attenzione. Comprenderne la struttura, la base teorica che poi invoca la teoria dell’informazione classica è sia utile che interessante. L’idea è di mostrare con esempi semplici questi concetti ed enfatizzarne le applicazioni. Queste vanno dalla traduzione, alla generazione di testi fino alla diagnosi di malattie neurodegenerative. Ci sono però anche dei limiti, problemi che difficilmente una macchina è in grado di risolvere e che invece il nostro cervello comprende (quasi) al volo. E’ proprio navigando in questi limiti dell’intelligenza artificiale che comprendiamo quanto la nostra mente, oltre ad essere fonte di ispirazione per la ricerca, sia straordinaria.

Cristiano De Nobili è un fisico teorico delle particelle, con un Ph.D. in fisica statistica alla SISSA di Trieste. Partendo dalla computer vision, ora è scienziato senior di Deep Learning nel team AI che lavora attivamente sul linguaggio intelligente presso Harman, una società Samsung. Cristiano è anche istruttore di Machine / Deep Learning per Deep Learning Italia, per AINDO (Trieste) e recentemente anche per il Master in High Performance Computing (SISSA / ICTP) tenutosi a Trieste.

Slideset (2M pdf)


Applicazione su sensoristica IoT di reti neurali per la predizione

Le reti neurali possono essere utilizzate  per apprendere pattern ricorrenti su sequenze temporali di misure fisiche da sensoristica IoT. Nel caso d’uso che esamineremo, la rete neurale viene utilizzata per prevedere il consumo di energia elettrica di un edificio e monitorare il comportamento dei sensori IoT, con gli obiettivi di ottimizzare i consumi a partire dalle previsioni e di identificare la presenza di anomalie nei consumi o nel comportamento dei sensori. Le principali caratteristiche che rendono le reti neurali preferibili rispetto ad altri sistemi “classici” sono la capacità di adattarsi al compito e al contesto in cui operano e la loro velocità di esecuzione. Nell’ambito delle nuove sfide da affrontare per poter sfruttare a pieno le potenzialità offerte dall’intelligenza artificiale nel mondo dell’IoT, ci proponiamo di estendere i modelli di rete neurale a scenari più complessi (multi-edificio e multi-sensore) e implementare algoritmi “embedded” che consentano di fare inferenza direttamente sui device riducendo latenze ed instabilità di un sistema di machine learning.

Emanuele Pomante ha un dottorato in fisica all’università di Trieste, con studi focalizzati sull’analisi e sull’elaborazione di segnali spettrali molto deboli di origine astrofisica. Nel 2017 a Londra ha preso parte ad un programma intensivo di Data Science rivolto ai dottori di ricerca grazie al quale ha ottenuto il suo primo incarico in un progetto di AI presso un’azienda di Londra.
Dal 2018 è Data Scientist presso Gruppo Filippetti azienda leader in Italia per le tecnologie di smart safety, nei settori dell’ Internet of Things e dell’ Industria 4.0.

Slideset (7M pdf)


L’evoluzione della computer vision nell’era neurale: scienza & impresa

Nel corso di questo intervento esamineremo l’evoluzione del paradigma di detection, tracking e classification in computer vision: partendo dalla localizzazione di oggetti fino alla generazione di contenuti sintetici, con un excursus finale sugli “adversarial attack” anni ’90 (non “neurali”). Il caso d’uso che considereremo è CyclopEye, una Smart parking solution basata su reti neurali. CyclopEye è una soluzione personalizzabile e a basso costo per parcheggi intelligenti: consiste in un sensore video in grado di controllare lo stato occupazionale fino a sei posti auto contemporaneamente e di segnalarlo all’utente. Cyclopeye inoltre sfrutta la computer vision per fornire supporto alla gestione del parcheggio con funzionalità aggiuntive come: lettura targhe, riconoscimento oggetti abbandonati, parcheggio abusivo, riconoscimento volti, find-your-car e molti altri ancora. In altre parole una tecnologia che aiuta sia gli automobilisti che stanno cercando parcheggio, sia i responsabili dei parcheggi, che possono così monitorare lo stato della loro area controllando gli ingressi, identificando le categorie di veicoli che circolano e rilevando eventuali violazioni.

Alessandro Ferrari ha una Laurea Magistrale in Informatica e 10+ anni di esperienza in Computer Vision e del Machine Learning, con particolare attenzione a localizzazione, tracking e riconoscimento di oggetti. Nel 2016 fonda ARGO Vision (www.argo.vision), una startup innovativa che sviluppa soluzioni proprietarie AI-based per diversi mercati (AR, VR, Smart Parking, etc.).

Slideset (8M pdf)

 


Il meetup DataScienceSeed fa parte delle iniziative dell’associazione

IAML, Italian Association for Machine Learning

DataScienceSeed #10 verrà ospitato nel contesto di:

Palazzo San Giorgio, Genova
15-16 Novembre, 2019

 

DataScienceSeed#9 @ Linux Day Genova

Il Linux Day 2019 di Genova è stato organizzato in collaborazione tra Liguria Digitale ed il meetup Data Science Seed.
Si è svolto su due giorni e due sedi:
Venerdì 25 Ottobre dalle ore 15:30 agli Erzelli  – Linux Day +  Meetup #9 DataScienceSeed
Sabato 26 Ottobre in centro Genova  – Linux Day
L’agenda del meetup del Venerdi era molto fitta. Di seguito trovate i contenuti con il materiale presentato:

Ansible Use Case: Da zero a server di posta

Sia la gestione di grandi server farm sia quella di piccole installazioni può diventare un lavoro complesso, ma anche ripetitivo e noioso. Strumenti come Ansible nascono per automatizzare e orchestrare attività su una grande varietà di piattaforme e sistemi. In questo talk abbiamo visto come da un piccolo file di testo sia possibile arrivare alla completa installazione e configurazione di un servizio di posta elettronica.

Luca Berruti è senior engineer in SIR s.r.l. Responsabile della gestione e della conduzione di infrastrutture di sistemi in ambienti misti in ambito open source e proprietario. Ansible evangelist in azienda, si interessa di automazione, ottimizzazione e monitoraggio dei processi ICT.

(Semi)-automatic dataset preparation con youtube-dl e YOLOv3

Inutile girarci intorno, nel Deep Learning chi ha più dati vince. E come qualunque data scientist vi potrà confermare, la preparazione del dataset è la parte più lunga e “dolorosa” del lavoro. Fortunatamente, specialmente in ambito Computer Vision, i passi avanti nel Deep Learning e la potenza dei software rilasciati sono stati tali per cui oggi, il provetto data scientist, ha nella sua toolbox un set di strumenti formidabili in grado di alleggerire non poco il triste lavoro di raccolta, ritaglio e labeling delle immagini. In attesa di una coorte di assistenti virtuali che faranno tutto il lavoro al posto nostro, ci accontentiamo di YOLO (You Only Look Once), lo stato dell’arte nel campo dei real-time object detection systems, per dare un label e ritagliare gli oggetti che ci interessano a partire da semplici video di Youtube.

Andrea Ranieri è ricercatore presso il Consiglio Nazionale delle Ricerche, Istituto di Matematica Applicata e Tecnologie Informatiche (IMATI), dove si occupa di Deep Learning principalmente in ambito Computer Vision. Andrea ha una laurea in Ingegneria Informatica, un Dottorato di Ricerca in Scienze ed Ingegneria dello Spazio e un background tecnologico estremamente vario che va da networking e sistemi distribuiti a robotica e perception. Usa Linux e C++ quotidianamente da più di 15 anni e Python da meno di 1. I suoi interessi di ricerca vanno dalla semplice classificazione di immagini alla segmentazione al training di modelli per la Super-Resolution di immagini.

 


Adversarial Machine Learning, problematiche e rimedi

Gli algoritmi di machine learning sono vulnerabili a campioni di input ben progettati chiamati Adversarial Example. Si tratta di input realizzati con perturbazioni impercettibili per l’uomo, per esempio cambiando pochi pixel ben specifici in un’immagine, ma che possono facilmente ingannare gli algoritmi nella fase di test e funzionamento online, tanto da spingerli a sbagliare la classificazione. Si tratta di vulnerabilità da studiare, per evitare che un attaccante possa spingere un algoritmo a fare quello che lui vuole, magari con obiettivi fraudolenti per creare attacchi alla sicurezza di un sistema. In questo intervento abbiamo discusso problematiche e le tecniche per evitarle.

Roberto Marmo è formatore, consulente, professore a contratto di Informatica nella Facoltà di Ingegneria della Università di Pavia, laboratorio Computer Vision Multimedia Lab. Autore di una dozzina di libri sull’uso dei social media, estrazione ed analisi dati dai social media, visualizzazione scientifica. Interessato allo sviluppo di sistemi con computer vision e artificial intelligence.

Le slide di Roberto sono a questo link (pdf 1.5M) 


Docker per Machine/Deep Learning

Creare modelli di Deep Learning può essere complicato a causa della difficoltà di installare CUDA, cuDNN, e dipendenze multiple, oltre che per le differenze tra gli ambienti di sviluppo e di produzione. Inoltre, tipicamente le librerie di Deep Learning tendono a favorire un aggiornamento costante a discapito della compatibilità all’indietro: modifiche sostanziali accadono molto più di frequente che in altri contesti. La soluzione a tutti questi problemi consiste nel ridurre tutte le vostre dipendenze ad una sola: Docker. Nel corso del suo intervento Andrea Panizza ci ha introdotto Docker e ci ha spiegato perché rappresenta una soluzione molto più adatta per il Deep Learning rispetto all’utilizzo di Virtual Machines, o Python virtual environment. Andrea ci ha inoltre mostrato come fare il deployment di un paio di applicazioni di Deep Learning su qualsiasi macchina con una moderna GPU NVIDIA ed una connessione Internet.

Andrea Panizza è Senior Data Scientist in Baker & Hughes. Andrea sviluppa soluzioni di Intelligenza Artificiale per il business Turbomachinery and Product Solutions, al fine di aumentare la produttività interna, migliorando i processi di manufacturing ed ingegneria (smart people & processes) e la competitività dei nostri prodotti (smart products).  

Le slide e il codice di Andrea si trovano a questo link (github) 

 


Lascia il tuo feedback sull’evento DataScienceSeed #9 @LinuxDay


Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione

IAML, Italian Association for Machine Learning

DataScienceSeed #9 @ Linux Day Genova verrà ospitato da:

Auditorium Liguria Digitale – Erzelli

Il LinuxDay Genova proseguirà sabato 26 Ottobre in Genova Centro.

DataScienceSeed#8 – Evoluzione Interfacce Vocali e Strategia Nazionale AI

Di seguito l’agenda dell’ottavo DataScienceSeed meetup di Martedi 1 Ottobre

Se hai partecipato, lasciaci un feedback!


 

Evoluzione di Interfacce Vocali

Il trend delle interfacce uomo macchina punta ad un sempre maggiore utilizzo di sistemi basati su voce, recentemente popolarizzati anche grazie alla diffusione di “smart speakers” di successo commerciale. La voce permette di ridurre l’attrito sperimentato dagli utenti in termini di interazioni uomo-macchina, non richiedendo attenzione esclusiva da parte dell’utilizzatore e permettendo sempre più spesso l’utilizzo di un linguaggio naturale.

Dotvocal  basa su questo modo naturale di comunicare le proprie soluzioni vocali e multimodali, nelle quali l’azienda può vantare tra le più importanti realizzazioni in campo nazionale ed internazionale. La peculiare trasversalità delle tecnologie vocali ha permesso a Dotvocal di sviluppare soluzioni per molti clienti in svariati settori: piattaforme di infotainment in ambito automotive, funzionalità di traduzioni linguistiche, gestione di portali telefonici automatici per società di trasporti e logistica, oltre ad aver sviluppato un proprio prodotto completamente innovativo nell’ambito degli ausili per disabili, che permette di fruire dei contenuti del PC e di Internet usando in modo semplice i comandi vocali.

Enrico Reboscio è fondatore e CEO di DotVocal e ci ha raccontato la sua esperienza nell’evoluzione di questa tecnologia, del relativo mercato e delle opportunità e dellesfide che si prospettano.

Le slide di Enrico sono a questo link (pdf 1.2M)

Per ricevere le credenziali di accesso al dataset presentato da Enrico alla fine del talk, compila il form qui sotto


Strategia Nazionale AI

Marco Bressani ci ha parlato della sua esperienza come membro del gruppo di esperti di alto livello selezionati dal Ministero dello Sviluppo Economico per elaborare la strategia nazionale sull’Intelligenza Artificiale e contribuire al Piano Coordinato promosso dalla Commissione Europea. I trenta superesperti sono stati selezionati tra esponenti del mondo imprenditoriale, delle associazioni di categoria, del mondo della ricerca, dell’università e della società civile con gli obiettivi di conoscere, approfondire ed affrontare il tema dell’Intelligenza Artificiale, valorizzare la ricerca, l’educazione e la formazione, nonché attrarre e favorire gli investimenti pubblici e privati. L’Italia punta ad avere un ruolo di avanguardia in Europa in questo settore strategico, considerato un’opportunità senza precedenti per incrementare la produttività del lavoro e per consentire progressi straordinari verso lo sviluppo sostenibile, senza perdere di vista i rischi derivanti da evantuali usi “incauti” dell’AI. Il lavoro del gruppo si è concluso lo scorso maggio con la pubblicazione di un paper di oltre 100 pagine dal titolo “Proposte per una strategia italiana per l’Intelligenza artificiale”, è ora all’attenzione dei tecnici del Ministero.

Marco Bressani, imprenditore e consulente di direzione, è fondatore e amministratore di Digital Tree, ecosistema dedicato alla creazione di Competenze ed Impresa in ambito Intelligenza Artificiale.

Le slide di Marco sono a questo link (pdf 1.5M) 


Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

DotVocal

Wonder Talent Investor

Gruppo IB

DataScienceSeed#7 – Sicurezza Cyber-fisica: vehicle Platooning / Industralizzare il flusso di ML con MLFlow

Lascia un feedback sull’evento
(e dicci se vuoi partecipare al Deep Learning Group)

Ecco l’agenda del settimo incontro, che ha celebrato il primo anno di attività del nostro meetup! Di seguito tutto il materiale presentato ed i relativi video, ripresi e renderizzati da Wonderland Production.


Platooning: predire (ed evitare!) collisioni tra i veicoli con il machine learning

La guida automatica e coordinata di veicoli (Platooning) è un problema molto complesso, a causa della molteplicità dei corpi in movimento e della necessità di interconnssione tra i veicoli che avviene in genere su un canale non affidabile e tempo variante. L’obiettivo è evitare le collisioni.

Click sull’immagine per il pdf delle slide

Il caso si presta a sperimentare tecniche diverse nel campo del Machine Learning, confrontando pro e contro dei vari approcci,  e costituisce una introduzione molto concreta al concetto di Cyber-Physical Safety.

Nell’incontro il problema è stato affrontato con Rulex, uno strumento rule based che abbiamo già incontrato nei meetup, e che ha i suoi punti di forza nella semplicità di uso e nell’interpretabilità dei risultati. Il dataset di riferimento è a disposizione della community, come Challenge per l’estate.

Link al Dataset – 3MBytes zip file

Maurizio Mongelli è ricercatore presso il CNR a Genova, il cui istituto, IEIIT, ha dato luogo a Rulex, azienda leader del panorama mondiale nel machine learning interpretabile.


Industrializzazione dei processi di Machine Learning in contesti Big Data enterprise: introduzione a MLFlow

I processi e le attività relativi all’addestramento dei modelli di Machie Learning possono rivelarsi molto complessi ed onerosi, specialmente nel contesto Big Data delle grandi aziende. MLFlow è uno strumento opensource che fornisce una soluzione per tenere traccia delle metriche, dei modelli e di tutti i parametri operativi utilizzando uno strumento unificato che consente di semplificare e rendere affidabile la gestione dell’intero processo. Scopriremo con Luca Ruzzola come funziona e come possiamo  utilizzarlo in combinazione con i principali framework.

Click sull’immagine per il repository github della presentazione e del codice

Luca Ruzzola è Machine Learning Engineer e Data Scientist  presso Agile Skill, azienda del gruppo Agile Lab che si occupa di consulenza e formazione su Big Data e AI.


Dataset Challenge  –  Natural Language Processing

Ludovico Simone, di Digital Tree ci ha presentato un dataset su NLP che è stato presentato nell’Hackathon del recente edizione del Web Marketing Festival di Rimini.

Clicl sull’immagine per pdf delle slide ed il link al dataset

Chi affronterà il challenge uscendone vittorioso, potrà presentare la propria analisi e la propria tecnica in un prossimo Meetup


Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione  IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

Wonder Talent Investor

Gruppo IB

DataScienceSeed#6 – Stock Market Machine Learning & Caffè con Pandas

23 Maggio 2019, Digital Tree, Genova, ore 18

DataScienceSeed meetup 23 maggio 2019

Se hai partecipato a questo evento, lasciaci un feedback!

Ecco l’agenda del sesto incontro, a cavallo tra la frontiera della ricerca e la didattica sui nostri dataset.

Merello e Finanza

Mercati Finanziari: affrontare con il Machine Learning un un problema davvero complesso

Simone Merello, specialista in AI for Finance presso Nanyang Technological University of Singapore

Simone Merello a DatasScienceSeed
Simone Merello a DatasScienceSeed

Predire l’andamento del mercato finanziario è un problema complesso, al punto che non ne è ancora chiara la fattibilità stessa. Sono state tentate tutte le tecniche di Machine Learning ed ogni sorta di reti naurali, ma i problemi sono tanti ed a tanti livelli. Simone ci ha spiegato come ha affrontato questo problema, presentandoci le tecniche usate nelle ultime ricerche, in un percorso tra le difficoltà e le opportunità valido per molte classi di problemi.

Ecco le slides di Simone, sotto forma di Google Doc

Attenzione! Audio Challenge!

L’audio del talk è molto disturbato a causa di un problema tecnico al sistema della sala nel giorno della ripresa. Ce ne scusiamo… nonostante gli sforzi in post produzione dei ragazzi del service la qualità audio è molto inferiore al livello che vorremmo tenere. Ma possiamo trasformare questo problema in opportunità!! Siamo certi che con il Machine Learning / Deep Learning si può ulteriormente ripulire questo audio. Chi vuole tantare? I tentativi più o meno riusciti saranno presentati in un meetup!

 


 

Morchio Marcello Andrea Boero DataScienceSeed 23 maggio 2018

Caffè con Pandas: cosa abbiamo imparato dal Coffe Machines Dataset

Marcello Morchio, Andrea Boero – DataScienceSeeed team

Marcello Morchio DataScienceSeed
Marcello Morchio alle prese con il LightGBM

A Febbraio i ragazzi di Flairbit ci hanno offerto un problema di manutenzione predittiva su una flotta di macchine del caffè professionali.  Ci abbiamo lavorato e siamo pronti a mostrarne i risultati alla community. Marcello ha parlato di Pandas, la libreria Python che non può mancare nella cassetta degli attrezzi del data scientist, per passare da un dataset selvaggio ad un docile datasetche daremo in pasto ad un modello di machine learning di tipo “classico” ma per niente banale, il LightGBM, Andrea  ha poi mostrato come costruire ed addestrare una rete neurale feed forward per lo stesso dataset, ottimizzandone gli iperparametri fino ad identificare la configurazione ottimale.

Riusciremo a prevenire i guasti ed a meritarci un buon caffè?

 

Flairbit Challange - pdf slides
Flairbit Challange – pdf slides

 

Github Repository del codice (Pandas, LightGBM e SHAP)
La descrizione è nel README del repo.

Google Drive link dello Zip file (55M) dell’approccio Neural Networks

Relazione (PDF 1MB)  Neural Networks

Andrea Boero eSimone Merello
Andrea Boero eSimone Merello discutono di architetture neurali mentre gli altri si mangiano la focaccia

 

 

 


Deep Learning Group

Abbiamo presentato nel meetup il Learning Group su Deep Learning che partirà con la prima sessione l’11 Giugno, alle 18.30 presso Digital Tree.

Seguiremo il corso Practical Deep Learning for coders, di Fast.ai, e ci incontreremo ogni due settimane per discutere delle lezioni seguite online, del codice presentato, delle difficoltà incontrate e magariper provare a cimentarci con qualche progetto reale.

Il progetto del learning group segue il percorso tracciato dai gruppi di studio TVML di IAML

Per accedere al gruppo, usa il form di feedback dell’evento.


Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione  IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

Wonder Talent Investor

Gruppo IB

DataScienceSeed#5 – Arte Cultura e Data Science

Se hai partecipato a questo meetup, per favore lasciaci un feedback qui!

Ecco l’agenda del quinto incontro,  tutto legato ad attività di ricerca tra Digitale, Arte e Beni Culturali

In codice ratio

In Codice Ratio: trascrizione automatica di manoscritti medievali

Simone Scardapane: Ricercatore @ Università La Sapienza e Presidente IAML

Il progetto di ricerca  In Codice Ratio, promosso da un team di Roma Tre, si pone l’obiettivo di sviluppare tecnologie per l’estrazione automatica dell’informazione da documenti storici, a partire da un caso di studio d’eccezione: l’Archivio Segreto Vaticano, uno dei più grandi archivi storici al mondo in termini di dimensioni e valore dei documenti custoditi. L’analisi di documenti così antichi presenta una serie di sfide specifiche: i testi sono manoscritti, in lingua latina ed accessibili unicamente in forma di immagine. Nel talk si descrivono i risultati ottenuti finora, i problemi da affrontare nel futuro, e soprattutto come le più recenti tecniche di deep learning (reti convolutive, U-Net, sistemi sequence2sequence) aiutano e guidano nella possibile risoluzione di queste sfide.

Presentazione di Simone Scardapane in formato pdf
Presentazione di Simone Scardapane in formato pdf

Metodi e Modelli 3D per l’analisi, la classificazione e l’interpretazione di reperti archeologici

Silvia Biasotti, Bianca Falcidieno, CNR IMATI

Per rispondere alla crescente necessità di metodi per la quantificazione della similarità tra frammenti e l’identificazione di elementi stilisticamente compatibili, IMATI ha sviluppato tecniche di analisi, classificazione e riconoscimento di forma, che vanno dall’identificazione di caratteristiche geometriche peculiari di un gruppo di oggetti, al riconoscimento di particolari configurazioni o strutture, fino all’identificazione e classificazione di parti con particolari decori e funzionalità. A partire da tali premesse è stata sviluppata una ricca base metodologica per la classificazione, la ricerca e il confronto di oggetti attraverso similarità di forma, declinando il concetto di similarità rispetto alle diverse sfaccettature che tale termine suggerisce: similarità geometrica, strutturale, funzionale o semantica.

La classificazione, la riunificazione e il riconoscimento di frammenti e decorazioni sono argomenti trattati nel progetto Horizon 2020 GRAVITATE.

Presentazione di Bianca Falcidieno e Silvia Biasotti in formato pdf
Presentazione di Bianca Falcidieno e Silvia Biasotti in formato pdf

I meetup DataScienceSeed sono in collaborazione con IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

DataScienceSeed#4 – Metro Linea “R” / Kaggle: l’arena è il mondo

Meetup4 Cover

Per i partecipanti all’incontro, ecco il link per lasciare il feedback.

Metropolitana – Linea “R”

Il trio di Flairbit

Matteo Rulli, Co-Founder di FlairBit ci ha presentato la trasposizione in linguaggio R di una delle sue applicazioni di data analytics sviluppate per l’analisi delle serie temporali, usando l’algoritmo DTW Dynamyc Time Warping. E’ stato illustrato un notebook R per l’analisi del flusso passeggeri in una rete metropolitana cittadina.

Il modello è in grado di

  • Classificare diverse tipologie di flussi passeggeri nel corso della giornata
  • Predire il volume passeggeri
  • Classificare le stazioni in base al flusso passeggeri nel tempo
FlairBit Presentation
Fai click per scaricare lo zip file con la presentazione di HTML

Durante la presentazione sono state illustrate le fasi di data preparation e i risultati ottenuti, mostrando anche come condividere il notebook mediante la self-service data analytics platform ShinyApp.

FlairBit è una software house che fornisce prodotti software proprietari e servizi di consulenza per aiutare le aziende nel processo di trasformazione digitale e innovazione nei processi produttivi.

Kaggle: L’arena è il mondo!

Rapuzzi for Kaggle

Che cos’è una Kaggle Competition? Andrea Rapuzzi, CEO di A-SIGN, ci ha raccontato la sua esperienza alle prese con un’entusiasmante sfida di Data Science. Lezioni imparate, difficoltà incontrate, competenze applicate, limiti e opportunità di questo nuovo modello di scienza (e di business).

Ed una perla finale con una lezione di epistemologia applicata al Machine Learning che ha strappato l’applauso!

Che c’entrano Rosenkrantz e Guildestern con il deep learning? Fai click per scaricare il pdf del talk di Andrea.

Questo è il secondo talk di Andrea nel nostro meetup: trovate il primo intervento nella pagina del meetup #1

 


Qui trovi i link ai nostri incontri precedenti, con il materiale presentato.

http://www.datascienceseed.com/

Se ti interessa dare un’occhiata ai dataset relativi ai challenge, contattaci. Se la tua analisi sarà particolarmente interessante uno degli interventi del prossimo incontro potrebbe essere il tuo!

Italian Association for Machine Learning

Digital Tree Innovation Habitat

Per entrare nella community Data Science Seed puoi iscriverti al Meetup!

https://www.meetup.com/it-IT/Data-Science-Seed-Meetup-Genova

 


Video by Wonderland Productions 

 

 

Dataset Challenge Hands-On #1 – Flairbit coffee machines, Rulex churn service

DataScienceSeed Hands-ON #1

Il Dataset Hands-On è dedicato alla presentazione di problemi concreti di aziende o di ricerca, da affrontare con tecniche di data science a scopo didattico. Non c’è niente come un problema vero per imparare!

L’obiettivo è presentare dataset e relative sfide da parte di aziende o istituzioni, a sviluppatori, data scientists, machine learning engineers, esperti o in corso di formazione. Lo scopo degli incontri e delle sfide è didattico, ma non si esclude che ne possa uscire qualcosa di buono, sia per l’azienda che propone il challenge sia per chi lo affronta. Non si può perdere: o si ha successo o si impara…e le due cose non si escludono!

Ecco quello di cui abbiamo parlato nel primo incontro dedicato ai Dataset:

Internet of Professional Coffee Machines

FlairBit, software house che fornisce prodotti software proprietari e servizi di consulenza per aiutare le aziende nel processo di trasformazione digitale e innovazione, ha presentato un dataset contenente dati di funzionamento, manutenzione e guasti relativi a macchine per l’erogazione di bevande. Luca Bixio e Matteo Rulli hanno raccontato il contesto in cui il dataset è stato raccolto, spiegato il contenuto del dataset nei dettagli e lanciato alcune sfide ai partecipanti che vorranno cimentarsi con l’analisi dei dati. Sarà possibile prevedere il funzionamento delle macchine nel prossimo futuro sulla base dei dati a disposizione? Sarà possibile determinare le cause di un fermo macchina o di un guasto? Sarà possibile prevedere un fermo macchina? La sfida è lanciata!

Click per scaricare il pdf che descrive il dataset

Rulex Dataset Challenge
Presentazione dei risultati di Giorgio Garziano

Rulex propne uno speciale tipo di piattaforma AI, che si distingue per creare modelli comprensibili e facilmente implementabili, per consentire agli esperti di business e di processo di creare e distribuire rapidamente applicazioni AI senza bisogno di competenze matematiche o di programmazione.

Andrea Caridi, Business Development Manager di Rulex, aveva presentato nel primo incontro DataScienceSeed un dataset relativo al churn di un servizio di musica online, ovvero all’analisi ed alla predizione dell’abbandono della piattaforma da parte degli utenti, per poter consentire di prendere azioni mirate per prevenirlo.

Click per aprire la pagina che descrive il dataset. Per avere una copia del dataset usate il modulo in fondo al post.

Durante il nostro incontro, Giorgio Garziano,  senior software developer ed autore in datascienceplus.com, ha descritto la sua analisi eseguita in linguaggio R, con un notebook molto sostanzioso:

Click per scaricare il file .zip con il notebook R mostrato da Giorgio.

 

Il dataset fornito da Rulex deriva dal dataset della Kaggle Competition WSDM – KKBox’s Churn Prediction Challenge.

Per  sperimentare l’analisi usando il tool Rulex Analytics, usate il modulo qui sotto,

 

DataScienceSeed#3 – AI Marketing & Edge Intelligence

Nel nostro terzo incontro, abbiamo spaziato in campi molto vasti, ed abbiamo lanciato un nuovo challenge!

Se hai partecipato per favore compila il form di feedback!

Datascienceseed #3 Feedback

The State of AI Marketing 2018

Federico Gobbi, Program Manager presso Mind The Bridge, vive a San Francisco dove ha fondato Artificial Intelligence Marketing Association, che tra le altre cose organizza meetup di livello top e pubblica un interessantissimo magazine su Medium. Federico ha presentato la sua ricerca “The State of AI Marketing 2018”, dedicata all’applicazione della AI nel marketing e di come ogni azienda può cominciare ad impiegarla.

La presentazione è densa di casi d’uso concreti con i riferimenti per approndirli, una miniera di informazioni e di spunti!

Tramite il form di feedback è possibile richiedere la presentazione in power point con tutte le note ed i link – un regalo super di Federico alla community Genovese. Qui sotto il link alla versione in PDF.

Presentazione di Federico Gobbi
Slideset della presentazione di Federico Gobbi


Edge Intelligence & Explainable AI

Il Deep Learning e’ indubbiamente l’approccio AI che ad oggi ha colto maggiormente l’eco della stampa e l’immaginario collettivo. Pochi pero’ sanno che l’algoritmo di back propagation dell’errore alla base del DL, necessita di grandi quantiità di dati e di grande potenza computazionale per convergere e puo’ essere facilmente ingannato. Ma sopratutto non e’ in grado di “spiegare” le regole che stanno dietro al proprio funzionamento, il che’ lo rende incompatibile con la trasparenza richiesta dai nuovi regolamenti sulla privacy, quali la GDPR.

In questo talk Fabrizio Cardinali CEO di Knowhedge, nuova startup di AI Consulting di Genova, spiega un approccio alternativo all’AI basato su chipset HW che usano algoritmi a consumi e profondita’ ridotta (shallow), in grado di funzionare su HW IOT di frontiera (edge) con intelligenza distribuita (swarm) e in grado di favorire una AI sempre piu’ accessibile e spiegabile per tutti (“explainable AI”).
Giancarlo Bo, Luca Marchese, Andrea Decamilli, Giorgio Cantarini e Marco Migliorati affiancheranno Fabrizio nel presentare MYW.AI il progetto di Smart Speaker intelligente incubato da Knowhedge presso Digital Tree e che prevede la realizzazione di un marketplace blockchain like basato su IOTA Tangle per la distribuzione certificata e sicura di algoritmi AI per il mercato professionale.

Slideset della presentazione di Fabrizio Cardinali
Slideset della presentazione di Fabrizio Cardinali


Dataset Challenge Hands-On

Fin dal primo incontro abbiamo puntato sul facilitare esperienze concrete su dati reali forniti da aziende sul territorio. Nel meetup #3 abbiamo anticipato la presentazione di un nuovo dataset, questa volta proposto da Flairbit. Il contenuto e le sfide saranno presentate nell’incontro “Dataset Challenge Hands-On” del 7 Febbario.

Nello stesso incontro Giorgio Garziano presenterà la sua soluzione al Dataset Challenge lanciato da Rulex nel meetup #1.

ATTENZIONE L’incontro Dataset Hands-On sarà un  approfondimento tecnico, con numero di posti molto limitato per agevolare un dialogo molto interattivo. Partecipa all’incontro se ti interessa mettere le mani su un problema concreto da affrontare con tecniche di Data Science e Machine Learning. Se anche non hai ancora le competenze necessarie ma vorresti imparare, vieni!  Potresti trovare qualcuno con cui collaborare per imparare insieme. Se hai il sospetto di soffrire di allergia al codice o agli algoritmi forse è meglio se aspetti il prossimo meetup. Se hai letto fino a questo punto questo noiosissimo disclaimer ed ancora la cosa ti incuriosice allora clicca sull’immagine qui sotto!

DataScienceSeed Hands-ON #1
DataScienceSeed Hands-ON #1

 

 


 

Qui trovi i link ai nostri incontri precedenti, con il materiale presentato.

http://www.datascienceseed.com/

Se ti interessa dare un’occhiata ai dataset relativi ai challenge, contattaci. Se la tua analisi sarà particolarmente interessante uno degli interventi del prossimo incontro potrebbe essere il tuo!

Italian Association for Machine Learning

Digital Tree Innovation Habitat

Knowhedge

Per entrare nella community Data Science Seed puoi iscriverti al Meetup!

https://www.meetup.com/it-IT/Data-Science-Seed-Meetup-Genova