DSS Meetup #32 – Innovative sustainable clean energy

Con Massimo Rivarolo: Innovative sustainable and clean energy, usare i dati pubblici per capire dove stiamo andando

L’evento sarà in modalità mista, ovvero con posti disponibili in presenza, ospiti di Liguria Digitale e la consueta diretta online. Per chi parteciperà in presenza, ci sarà la consueta focaccia al termine del meetup!

Negli ultimi quindici anni, le politiche internazionali ed europee hanno promosso una serie di interventi per favorire lo sfruttamento di fonti di energia rinnovabili e sostenibili, e lo sviluppo di sistemi di accumulo e di combustibili alternativi per promuovere la sostenibilità e la decarbonizzazione. La ricerca e l’innovazione hanno fatto enormi progressi per consentire a sempre più persone nel mondo di usufruire di elettricità e calore prodotti in modo sostenibile. Per poter però parlare di transizione ecologica sostenibile sarà necessario investire maggiormente in nuove tecnologie: quali saranno le più strategiche? Quali di queste possono considerarsi realmente sostenibili? Cosa succederà ai combustibili fossili?

Per affrontare il tema della “sostenibilità” in modo consapevole e preparare le generazioni future attraverso gli insegnamenti di oggi, è necessario un approccio “data driven”, attraverso l’analisi e l’elaborazione di dati pubblici (fonti: ARERA, EUROSTAT, TERNA).

Nel talk affronteremo i seguenti temi:

  • Le politiche ambientali ed energetiche Europee per il 2020
  • Analisi critica delle politiche: risultati ed effetti
  • Cosa aspettarci nel prossimo futuro: gli obiettivi del Piano Nazionale Energia e Clima Italiano (PNIEC) 2030 e la transizione energetica in Italia

 

 Massimo Rivarolo ha ottenuto il titolo di Dottorato Europeo nel 2013 con la tesi “Produzione di idrogeno da impianto idroelettrico di grandissima potenza (14,000 MW) e studio di sistemi di stoccaggio e utilizzo in Sud America e Europa”. È membro dal 2010 del Gruppo di ricerca multidisciplinare Thermochemical Power Group (www.tpg.unige.it ) all’interno dell’Università di Genova. Dal 2015 al 2018, ha collaborato all’interno di un programma di ricerca tra UNIGE e ARERA (Autorità di Regolazione per Energia Reti e Ambiente), nell’ambito dei mercati dell’energia, delle fonti rinnovabili e della generazione distribuita. Dal 2019 è Ricercatore presso UNIGE. Dal 2021 è responsabile scientifico del programma di training nell’ambito della Cattedra UNESCO-Unitwin “Innovative sustainable clean energy research & education”, coordinata da UNIGE (2021-2024). È inoltre responsabile scientifico UNIGE per il Progetto EU H-2020 OnePlanet (2022-2025). Attualmente è responsabile del corso di laurea Triennale “Sistemi per l’energia e l’ambiente and environment” e co-docente per il corso di laurea magistrale “Impianti per l’energia”.

DSS Meetup #31 – Effective Altruism e Data Science

Come amplificare il proprio impatto nella propria vita e carriera nella tecnologia? con Stefania Delprete

L’Effective Altruism (Altruismo Efficace) è una comunità e movimento sociale che pone le basi sull’evidenza scientifica per priorizzare cause e progetti d’impatto e massimizzare il bene che possiamo fare ora nel mondo.

Oltre al donare a progetti ad alta efficacia, si può infatti anche dirigere la propria carriera come data scientist in organizzazioni ad alto impatto, approfondire/ricercare in tematiche come i rischi dell’intelligenza artificiale, sensibilizzare all’interno della propria azienda, o addirittura iniziare da zero un proprio progetto d’impatto. Durante il talk saranno mostrate le diverse opportunità a disposizione per persone che lavorano o studiano nella tecnologia e appassionate nel lavoro sui dati.

 Stefania Delprete gestisce il capitolo italiano di Effective Altruism (Altruismo Efficace) e il gruppo professionale di persone esperte o aspiranti nel campo della data science, machine learning ed intelligenza artificiale coinvolte in tale comunità di altruisti efficaci.

Studia fisica in Italia per poi lavorare nella programmazione nel Regno Unito e in Germania. Negli ultimi anni di è occupata di progetti e insegnamenti di Python e data science. Stefania fa parte di comunità dell’open source fra cui Python/PyCon Italia e Mozilla Italia. È appassionata di jazz, studi sulla coscienza e sogni lucidi.

E’ stata tra i relatori del primo storico meetup DataScienceSeed, nel luglio 2018

Tra le iniziative ad alto impatto sociale a cui collebora Stefania c’è Charity Entrepreneurship, incubatore di iniziative non-profit. La call for applications è aperta fino al 10 Novembre. Date un’occhiata al sito, è molto interessante!

Slide di Stefania (7M PDF)

DSS Meetup #30 – Quantum Computing e Data Science.

Quantum Computing e Data Science

L’intervento si propone di focalizzare l’impatto potenziale del quantum computing sulle applicazioni di data science e di presentare alcune esperienze che possano aiutare a capire se e come iniziare a prendere in considerazione gli algoritmi quantici nello sviluppo di soluzioni innovative. Una prima parte presenterà una introduzione generale al tema ed alle linee di ricerca di QC connesse in particolare alla data science, illustrandone i punti cruciali dal punto di vista computazionale. Una seconda parte si focalizzerà su alcuni esempi di applicazioni e sugli strumenti software per iniziare a lavorare con computer quantistici, almeno a livello di simulazione, nell’attesa di avere uno sulla scrivania…

Ennio Ottaviani è un fisico teorico ed imprenditore. E’ direttore scientifico di OnAIR, dove coordina progetti di ricerca sulle applicazioni di IA in diversi settori dell’industria e dei servizi. E’ docente di Metodi Predittivi nel corso di laurea in Statistica Matematica a Genova.

Francesco Rosasco è un informatico e lavora in OnAIR dalla laurea, specializzandosi sulla computer vision ed i sistemi di riconoscimento automatico. In queste applicazioni cura in particolare anche gli aspetti di parallelizzazione e di efficienza computazionale.

Slides OnAIR (4M pdf)

DSS Online #16 – Explanatory Learning: può una macchina imparare a formulare teorie?

Torniamo a parlare di Machine Learning e di Explanations, ma questa volta con un paradigma del tutto nuovo: Explanatory Learning.

Come possiamo costruire macchine capaci di formulare teorie originali e arricchire la nostra conoscenza, proprio come fanno gli scienziati?

O per essere più precisi: come facciamo a scoprire automaticamente la spiegazione simbolica che ci permetta di effettuare previsioni accurate su un nuovo fenomeno diverso da tutti quelli incontrati prima? Questo problema alla base dell’intelligenza artificiale è stato affrontato dalla Program Synthesis e, più recentemente, dall’Explanatory Learning. La differenza fondamentale tra questi due paradigmi risiede nella natura dell’interprete che dovrebbe digerire la spiegazione generata. In Program Synthesis l’interprete è un rigido compilatore progettato da un uomo, su cui in ultima analisi ricade l’onere di dare un significato alla spiegazione (programma) in output. In Explanatory Learning invece l’interprete non è dato, e deve essere appreso da una raccolta limitata di spiegazioni esistenti abbinate a osservazioni dei corrispondenti fenomeni.

Seguendo l’esempio del Reinforcement Learning con i giochi Atari, in questa chiacchierata illustreremo le sfide dell’Explanatory Learning con Odeen, un gioco che simula l’impresa scientifica in un semplice universo stile Flatlandia. Introdurremo quindi le Critical Rationalist Networks, un approccio basato sul deep learning (Transformers) che si ispira alla teoria epistemologica di Popper per risolvere problemi di EL. Infine confronteremo le CRNs con approcci neurali end-to-end e di Program Synthesis su Odeen, discutendo prestazioni, garanzie, flessibilità ed effettiva spiegabilità dei diversi metodi.

Antonio Norelli  è un dottorando di Informatica alla Sapienza di Roma nel laboratorio di ricerca GLADIA, dove lavora con il prof. Emanuele Rodolà su AI e Deep Learning. Fisico di formazione, ha conseguito la laurea magistrale in Informatica e il diploma di eccellenza della SSAS, la Scuola Superiore di Studi Avanzati della Sapienza. Ha lavorato come Research Intern a Spiketrap (startup di San Francisco, USA) e come Applied Scientist Intern ad Amazon Science (Laboratorio Lablet a Tubinga, Germania).

Repo github con i riferimenti all’articolo ed ai dataset

DSS Online #14 – Pillo: storia di un prodotto AI dall’idea al mercato.

Nel prossimo meetup DataScienceSeed parleremo di un prodotto basato su AI che è partito da Genova, per raggiungere il mercato in USA con l’acquisizione da parte di una multinazionale. Stiamo parlando di Pillo, il robot assistente alla salute, ed i nostri relatori saranno Emanuele Baglini e Antonello Scalmato, che incontreremo online il   23 Marzo a partire dalle 18:00.

Pillo è stato il primo social robot destinato alla salute al mondo. E’ un assistente vocale, in grado di erogare dosi di medicinali in maniera proattiva. Il device riconosce la persona a cui deve dispensare le medicine, erogandole al destinatario alla giusta ora. Pillo aiuta anche i familiari e caregiver a monitorare lo stato di assunzione della terapia, consentendo loro di intervenire.

Pillo Health ha raccolto nel tempo 13 milioni di dollari da diversi investitori, tra cui Stanley Venture e Samsung Venture, ed è passato da solo una idea ad un prodotto realizzato in migliaia di esemplari e commercializzato in USA.

Pillo è stato pluripremiato in diverse occasioni, tra cui alcuni dei più prestigiosi sono stati l’”Intelligent Assistant Award 2019” ad HIMSS 2019 di Orlando e l’”Innovation Award 2019” al CES di Las Vegas.

Nel corso del talk ripercorreremo la crescita di Pillo Health, dall’idea fino all’acquisto da parte di Stanley Black+Decker e passeremo in rassegna gli aspetti chiave dello sviluppo di un prodotto così complesso partendo da zero e con risorse limitate, tra cui avere il team giusto ed una precisa strategia per velocizzare lo sviluppo e utilizzare ogni possibile componente messa a disposizione dal mercato, senza reinventare la ruota.

Emanuele Baglini – Emanuele ha oltre 20 anni di esperienza nell’ingegneria (hardware, software e produzione). Dopo la laurea in ingegneria informatica, ha lavorato nel gruppo di ricerca di robotica dell’Università di Genova. Ha approfondito la conoscenza dei sistemi embedded, delle reti di sensori e, più in generale, di vari campi della robotica. Emanuele ha gestito team di ricerca e sviluppo e ha maturato una profonda esperienza nella gestione, sviluppo e produzione di prodotti complessi. È stato responsabile della gestione operativa e finanziaria di piccole imprese, per le quali ha ricoperto la carica di amministratore delegato. È coautore di articoli accademici e inventore di brevetti internazionali. Emanuele è stato CTO in Pillo Health, dove ha diretto la ricerca e lo sviluppo del prodotto, portandolo da un’idea al prodotto realizzato in migliaia di unità. Attualmente è uno dei co-fondatori di Ermit, dove ricopre il ruolo di CEO.

Antonello Scalmato, Ph.D. – Antonello ha un dottorato di ricerca in Robotica e Ambient Intelligence. Ha lavorato per più di 10 anni in diversi campi dell’intelligenza artificiale, con una specializzazione sulla rappresentazione della conoscenza, ed è autore di oltre 20 articoli su questi temi di ricerca. È coautore di diversi brevetti, in particolare di uno relativo al Context Awareness in Smart Home e di uno dei brevetti di Pillo Health relativi al Robot e alle sue funzionalità. Negli anni è diventato un esperto di architettura di servizi basati sul cloud. In Pillo Health è stato il Director of Cloud and AI services. Attualmente è uno dei co-fondatori di Ermit, dove ricopre il ruolo di Director of Cloud & Intelligent Services.

DataScienceSeed Online#12 – Open Source AI sulla linea di produzione

DataScienceSeed torna online Mercoledì 26 Gennaio, a partire dalle ore 18:00. Incontreremo Paolo Mascellani, presidente della cooperativa eLabor, che sta sviluppando un sistema completo ed open source che porta il deep learning sulla linea di prodizione.

ADR-Flow applica tecniche di deep learning al riconoscimento automatico dei difetti di produzione industriale, coniugandole con una infrastruttura  software robusta ed adattabile. Non propone dei risultati nuovi, ma applica risultati consolidati ad una necessità ben precisa, consentendo di concentrarsi sulle necessità specifiche perché il sistema si occupa di tutto il resto. Il tutto, Open Source.

Le prime esperienze fatte con ADR-Flow riguardano il problema della corretta cablatura degli impianti  di un motoveicolo: al di la della dimostrazione della possibilità teorica di raggiungere questo obiettivo, la sfida è architettare una struttura robusta e flessibile di raccolta e gestione dei dati.

Questo ha richiesto di affrontare problematiche architetturali da coniugare con gli stumenti di Data Science (nel nostro caso il transfer learning con Keras e Tensor Flow), affrontando i problemi tipici di avere pochi dati e sbilanciati (data augmentation, controllo dell’overfitting, pesatura dei campioni) ed usando metriche adeguate a descrivere il problema.

Molti e notevoli gli stimoli per miglioramenti ed evoluzioni future: efficienza dell’addestramento e del riconoscimento, sia dal punto di vista della dimensione dei modelli che dei tempi di elaborazione, sistemi di ausilio all’etichettatura dei campioni, modi per affrontare difetti estremamente rari, ma importanti (ad esempio riguardanti la sicurezza), uso di generative adversarial network per sintetizzare campioni realistici, difetti nelle produzioni continue, ed è solo l’inizio.

Paolo Mascellani è presidente della cooperativa eLabor, che ha fondato nel 2001 assieme ad alcuni amici con lo scopo di non far perdere alla società le energie di quanti si trovano in un periodo di difficoltà dal punto di vista lavorativo ed allo stesso tempo di fornire ad aziende, enti, cooperative, eccetera, servizi tecnologicamente avanzati, basati su software libero ed a costo sostenibile.

Convinto della sinergia tra formazione e lavoro, si è laureato dapprima in Ingegneria Elettronica, poi in Scienze dell’Informazione e successivamente ha conseguito il dottorato di ricerca in Logica Matematica ed Informatica teorica. Negli ultimi anni ha seguito con successo numerosi corsi di formazione on-line su temi come Machine Learning, Internet of Things, Big Data, Sviluppo Agile e molto altro. In tutto questo tempo non ha mai smesso di lavorare, con numerose puntate in vari paesi in via di sviluppo, di mettere in pratica quanto ha studiato e di trasmettere ai propri amici, familiari e colleghi le conoscenze acquisite e la voglia di acquisirne altre.

È questo il caso anche del rilevamento automatico dei difetti di produzione industriale.

DataScienceSeed#7 – Sicurezza Cyber-fisica: vehicle Platooning / Industralizzare il flusso di ML con MLFlow

Lascia un feedback sull’evento
(e dicci se vuoi partecipare al Deep Learning Group)

Ecco l’agenda del settimo incontro, che ha celebrato il primo anno di attività del nostro meetup! Di seguito tutto il materiale presentato ed i relativi video, ripresi e renderizzati da Wonderland Production.


Platooning: predire (ed evitare!) collisioni tra i veicoli con il machine learning

La guida automatica e coordinata di veicoli (Platooning) è un problema molto complesso, a causa della molteplicità dei corpi in movimento e della necessità di interconnssione tra i veicoli che avviene in genere su un canale non affidabile e tempo variante. L’obiettivo è evitare le collisioni.

Click sull’immagine per il pdf delle slide

Il caso si presta a sperimentare tecniche diverse nel campo del Machine Learning, confrontando pro e contro dei vari approcci,  e costituisce una introduzione molto concreta al concetto di Cyber-Physical Safety.

Nell’incontro il problema è stato affrontato con Rulex, uno strumento rule based che abbiamo già incontrato nei meetup, e che ha i suoi punti di forza nella semplicità di uso e nell’interpretabilità dei risultati. Il dataset di riferimento è a disposizione della community, come Challenge per l’estate.

Link al Dataset – 3MBytes zip file

Maurizio Mongelli è ricercatore presso il CNR a Genova, il cui istituto, IEIIT, ha dato luogo a Rulex, azienda leader del panorama mondiale nel machine learning interpretabile.


Industrializzazione dei processi di Machine Learning in contesti Big Data enterprise: introduzione a MLFlow

I processi e le attività relativi all’addestramento dei modelli di Machie Learning possono rivelarsi molto complessi ed onerosi, specialmente nel contesto Big Data delle grandi aziende. MLFlow è uno strumento opensource che fornisce una soluzione per tenere traccia delle metriche, dei modelli e di tutti i parametri operativi utilizzando uno strumento unificato che consente di semplificare e rendere affidabile la gestione dell’intero processo. Scopriremo con Luca Ruzzola come funziona e come possiamo  utilizzarlo in combinazione con i principali framework.

Click sull’immagine per il repository github della presentazione e del codice

Luca Ruzzola è Machine Learning Engineer e Data Scientist  presso Agile Skill, azienda del gruppo Agile Lab che si occupa di consulenza e formazione su Big Data e AI.


Dataset Challenge  –  Natural Language Processing

Ludovico Simone, di Digital Tree ci ha presentato un dataset su NLP che è stato presentato nell’Hackathon del recente edizione del Web Marketing Festival di Rimini.

Clicl sull’immagine per pdf delle slide ed il link al dataset

Chi affronterà il challenge uscendone vittorioso, potrà presentare la propria analisi e la propria tecnica in un prossimo Meetup


Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione  IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

Wonder Talent Investor

Gruppo IB

DataScienceSeed#6 – Stock Market Machine Learning & Caffè con Pandas

23 Maggio 2019, Digital Tree, Genova, ore 18

DataScienceSeed meetup 23 maggio 2019

Se hai partecipato a questo evento, lasciaci un feedback!

Ecco l’agenda del sesto incontro, a cavallo tra la frontiera della ricerca e la didattica sui nostri dataset.

Merello e Finanza

Mercati Finanziari: affrontare con il Machine Learning un un problema davvero complesso

Simone Merello, specialista in AI for Finance presso Nanyang Technological University of Singapore

Simone Merello a DatasScienceSeed
Simone Merello a DatasScienceSeed

Predire l’andamento del mercato finanziario è un problema complesso, al punto che non ne è ancora chiara la fattibilità stessa. Sono state tentate tutte le tecniche di Machine Learning ed ogni sorta di reti naurali, ma i problemi sono tanti ed a tanti livelli. Simone ci ha spiegato come ha affrontato questo problema, presentandoci le tecniche usate nelle ultime ricerche, in un percorso tra le difficoltà e le opportunità valido per molte classi di problemi.

Ecco le slides di Simone, sotto forma di Google Doc

Attenzione! Audio Challenge!

L’audio del talk è molto disturbato a causa di un problema tecnico al sistema della sala nel giorno della ripresa. Ce ne scusiamo… nonostante gli sforzi in post produzione dei ragazzi del service la qualità audio è molto inferiore al livello che vorremmo tenere. Ma possiamo trasformare questo problema in opportunità!! Siamo certi che con il Machine Learning / Deep Learning si può ulteriormente ripulire questo audio. Chi vuole tantare? I tentativi più o meno riusciti saranno presentati in un meetup!

 


 

Morchio Marcello Andrea Boero DataScienceSeed 23 maggio 2018

Caffè con Pandas: cosa abbiamo imparato dal Coffe Machines Dataset

Marcello Morchio, Andrea Boero – DataScienceSeeed team

Marcello Morchio DataScienceSeed
Marcello Morchio alle prese con il LightGBM

A Febbraio i ragazzi di Flairbit ci hanno offerto un problema di manutenzione predittiva su una flotta di macchine del caffè professionali.  Ci abbiamo lavorato e siamo pronti a mostrarne i risultati alla community. Marcello ha parlato di Pandas, la libreria Python che non può mancare nella cassetta degli attrezzi del data scientist, per passare da un dataset selvaggio ad un docile datasetche daremo in pasto ad un modello di machine learning di tipo “classico” ma per niente banale, il LightGBM, Andrea  ha poi mostrato come costruire ed addestrare una rete neurale feed forward per lo stesso dataset, ottimizzandone gli iperparametri fino ad identificare la configurazione ottimale.

Riusciremo a prevenire i guasti ed a meritarci un buon caffè?

 

Flairbit Challange - pdf slides
Flairbit Challange – pdf slides

 

Github Repository del codice (Pandas, LightGBM e SHAP)
La descrizione è nel README del repo.

Google Drive link dello Zip file (55M) dell’approccio Neural Networks

Relazione (PDF 1MB)  Neural Networks

Andrea Boero eSimone Merello
Andrea Boero eSimone Merello discutono di architetture neurali mentre gli altri si mangiano la focaccia

 

 

 


Deep Learning Group

Abbiamo presentato nel meetup il Learning Group su Deep Learning che partirà con la prima sessione l’11 Giugno, alle 18.30 presso Digital Tree.

Seguiremo il corso Practical Deep Learning for coders, di Fast.ai, e ci incontreremo ogni due settimane per discutere delle lezioni seguite online, del codice presentato, delle difficoltà incontrate e magariper provare a cimentarci con qualche progetto reale.

Il progetto del learning group segue il percorso tracciato dai gruppi di studio TVML di IAML

Per accedere al gruppo, usa il form di feedback dell’evento.


Il meetup DataScienceSeed fa parte delle iniziatove dell’associazione  IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

Wonder Talent Investor

Gruppo IB

DataScienceSeed#5 – Arte Cultura e Data Science

Se hai partecipato a questo meetup, per favore lasciaci un feedback qui!

Ecco l’agenda del quinto incontro,  tutto legato ad attività di ricerca tra Digitale, Arte e Beni Culturali

In codice ratio

In Codice Ratio: trascrizione automatica di manoscritti medievali

Simone Scardapane: Ricercatore @ Università La Sapienza e Presidente IAML

Il progetto di ricerca  In Codice Ratio, promosso da un team di Roma Tre, si pone l’obiettivo di sviluppare tecnologie per l’estrazione automatica dell’informazione da documenti storici, a partire da un caso di studio d’eccezione: l’Archivio Segreto Vaticano, uno dei più grandi archivi storici al mondo in termini di dimensioni e valore dei documenti custoditi. L’analisi di documenti così antichi presenta una serie di sfide specifiche: i testi sono manoscritti, in lingua latina ed accessibili unicamente in forma di immagine. Nel talk si descrivono i risultati ottenuti finora, i problemi da affrontare nel futuro, e soprattutto come le più recenti tecniche di deep learning (reti convolutive, U-Net, sistemi sequence2sequence) aiutano e guidano nella possibile risoluzione di queste sfide.

Presentazione di Simone Scardapane in formato pdf
Presentazione di Simone Scardapane in formato pdf

Metodi e Modelli 3D per l’analisi, la classificazione e l’interpretazione di reperti archeologici

Silvia Biasotti, Bianca Falcidieno, CNR IMATI

Per rispondere alla crescente necessità di metodi per la quantificazione della similarità tra frammenti e l’identificazione di elementi stilisticamente compatibili, IMATI ha sviluppato tecniche di analisi, classificazione e riconoscimento di forma, che vanno dall’identificazione di caratteristiche geometriche peculiari di un gruppo di oggetti, al riconoscimento di particolari configurazioni o strutture, fino all’identificazione e classificazione di parti con particolari decori e funzionalità. A partire da tali premesse è stata sviluppata una ricca base metodologica per la classificazione, la ricerca e il confronto di oggetti attraverso similarità di forma, declinando il concetto di similarità rispetto alle diverse sfaccettature che tale termine suggerisce: similarità geometrica, strutturale, funzionale o semantica.

La classificazione, la riunificazione e il riconoscimento di frammenti e decorazioni sono argomenti trattati nel progetto Horizon 2020 GRAVITATE.

Presentazione di Bianca Falcidieno e Silvia Biasotti in formato pdf
Presentazione di Bianca Falcidieno e Silvia Biasotti in formato pdf

I meetup DataScienceSeed sono in collaborazione con IAML, Italian Association for Machine Learning

Questo incontro è possibile anche grazie al supporto di

DataScienceSeed#4 – Metro Linea “R” / Kaggle: l’arena è il mondo

Meetup4 Cover

Per i partecipanti all’incontro, ecco il link per lasciare il feedback.

Metropolitana – Linea “R”

Il trio di Flairbit

Matteo Rulli, Co-Founder di FlairBit ci ha presentato la trasposizione in linguaggio R di una delle sue applicazioni di data analytics sviluppate per l’analisi delle serie temporali, usando l’algoritmo DTW Dynamyc Time Warping. E’ stato illustrato un notebook R per l’analisi del flusso passeggeri in una rete metropolitana cittadina.

Il modello è in grado di

  • Classificare diverse tipologie di flussi passeggeri nel corso della giornata
  • Predire il volume passeggeri
  • Classificare le stazioni in base al flusso passeggeri nel tempo
FlairBit Presentation
Fai click per scaricare lo zip file con la presentazione di HTML

Durante la presentazione sono state illustrate le fasi di data preparation e i risultati ottenuti, mostrando anche come condividere il notebook mediante la self-service data analytics platform ShinyApp.

FlairBit è una software house che fornisce prodotti software proprietari e servizi di consulenza per aiutare le aziende nel processo di trasformazione digitale e innovazione nei processi produttivi.

Kaggle: L’arena è il mondo!

Rapuzzi for Kaggle

Che cos’è una Kaggle Competition? Andrea Rapuzzi, CEO di A-SIGN, ci ha raccontato la sua esperienza alle prese con un’entusiasmante sfida di Data Science. Lezioni imparate, difficoltà incontrate, competenze applicate, limiti e opportunità di questo nuovo modello di scienza (e di business).

Ed una perla finale con una lezione di epistemologia applicata al Machine Learning che ha strappato l’applauso!

Che c’entrano Rosenkrantz e Guildestern con il deep learning? Fai click per scaricare il pdf del talk di Andrea.

Questo è il secondo talk di Andrea nel nostro meetup: trovate il primo intervento nella pagina del meetup #1

 


Qui trovi i link ai nostri incontri precedenti, con il materiale presentato.

http://www.datascienceseed.com/

Se ti interessa dare un’occhiata ai dataset relativi ai challenge, contattaci. Se la tua analisi sarà particolarmente interessante uno degli interventi del prossimo incontro potrebbe essere il tuo!

Italian Association for Machine Learning

Digital Tree Innovation Habitat

Per entrare nella community Data Science Seed puoi iscriverti al Meetup!

https://www.meetup.com/it-IT/Data-Science-Seed-Meetup-Genova

 


Video by Wonderland Productions