Statistical Learning, i dati letti alla luce dei modelli che permettono di formulare previsioni e prendere decisioni quantificando l’incertezza

30/04/2021

Negli ultimi anni con la nuova primavera dell’Intelligenza Artificiale, le tecniche di Machine Learning per l’analisi previsionale e per la generazione di insights hanno trovato un largo consenso e applicabilità su tantissimi progetti e contesti differenti. 

Pochi però sanno che questo nuovo mondo di algoritmi trova spesso fondamento metodologico nello Statistical Learning. Ovvero nelle metodologie e negli algoritmi che sono stati sviluppati all’intersezione tra statistica applicata, analisi matematica, calcolo numerico e informatica e che hanno permesso ai Data Scientist di tantissime aziende ed enti di ricerca nel mondo di descrivere trend, capire il presente e interpretare il futuro.

La peculiarità di questi strumenti e tecniche è l’efficace unione tra la capacità previsionale, supportata dai dati e da modelli statistici, affiancata alla possibilità di misurare l’incertezza, in modo da fornire strumenti validi anche in termini di approssimazione del problema affrontato.

Ad esporre i vantaggi e l’applicazione di questa importante disciplina è intervenuto, durante la terza giornata dell’Academy di Moxoff, il Professor Piercesare Secchi, ordinario di statistica presso il Dipartimento di Matematica del Politecnico di Milano.

Durante l’attività sono stati illustrati i passaggi fondamentali per la costruzione di un modello di Statistical Learning, partendo dai dati grezzi fino ad arrivare alla costruzione e validazione di un modello statistico, ponendo l’accento sul tema del trade-off tra accuratezza delle previsioni e interpretabilità dei risultati ottenuti.

Si è discusso inoltre di come scegliere in maniera efficace il modello da utilizzare in base al problema e ai dati a disposizione, cercando di capire le differenze tra modelli strutturati e modelli locali, ricordando che i modelli lineari più semplici consentono di risolvere efficacemente un problema se utilizzati correttamente.

Correlation is enough ? La correlazione è sufficiente

Con l’avvento dei Big Data si è affermata l’idea che, avendo a disposizione tante informazioni su un determinato problema, fosse possibile utilizzare modelli di apprendimento automatico come delle “scatole nere”, senza mettere in luce le relazioni tra le variabili che concorrono alla formulazione di una previsione e con ciò rendendo difficile, se non spesso impossibile, l’interpretazione dei risultati. Ciò è talvolta causato dall’abbandono di un approccio scientifico più tradizionale che ci ha portato ad applicare tecniche e metodologie in modo cieco, seguendo il mantra: “correlation is enough”.

Lo Statistical Learning cerca di riportare la parola “scienza” al centro del binomio “data science” proponendo strategie, modelli e verifiche che permettono al Data Scientist di sviluppare una corretta visione critica al riparo da facili e fuorvianti ottimismi.  

L’importanza del Data Scientist

Perchè il Data Scientist è una figura sempre più importante e necessita di sempre maggiore raffinatezza e aggiornamento delle proprie competenze? Non si può più parlare di un mero esperto di modelli statistici o algoritmi predittivi, la figura si è evoluta ed accosta alle abilità statistico-matematiche quelle specifiche di settore per poter approntare soluzioni complete che rispondano congiuntamente alle esigenze tecniche di funzione. 

La conoscenza “di dominio” quindi, svolge un ruolo cruciale nella resa finale del progetto per questo la proposta formativa della Moxoff Academy dedica buona parte del proprio corso all’analisi di casi di successo presentati dagli specialisti di Moxoff che condividono la loro esperienza accumulata sul campo, interfacciandosi con aziende che operano in differenti contesti e settori industriali

Esempi di applicazione sono churn prediction e solidità creditizia in ambito Utilities. Un’attenta formulazione del problema ed una scelta consapevole della metodologia utilizzata sono fondamentali per portare reale valore alle imprese e garantire alle stesse misure di azionabilità in risposta a domande cruciali come: quali dei miei clienti mi abbandoneranno? tra quanto e perchè? I miei clienti mi ripagheranno in tempo?quanto mi pagheranno e tra quanto?

Che cos’è la Moxoff Academy?

Un luogo di alta formazione rivolto a chi proviene dal mondo accademico e desidera cimentarsi con sfide industriali e a chi, avendo già esperienza in azienda, vuole aggiornarsi su nuove tecniche, metodologie e competenze ormai fondamentali per fare innovazione in un mondo data-driven, come modellistica matematica, statistica, deep learning, distributed computing.