EasyApple #582 - Reti neurali e machine learning con Eugenio Zuccarelli

Ciao a tutti e ben ritrovati su EasyApple, puntata numero 582. Comincia veramente a venirmi

fuori in automatico questa cosa dell'annunciare la puntata, non so, mi sembra di essere un

po' un automa. L'automa in questione si chiama Luca Zorzi e il suo socio si chiama Federico

Travaini. E invece i donatori che hanno reso possibile anche questa settimana il fatto

che noi ci sedessimo su queste comode sedi davanti a questi grandi schermi per registrare

sono Enrico Ferrazzi, Riccardo Manganelli, Davide Tinti, Stefano Giacomo G. e Marcello

Marigliano. Grazie mille per il vostro generoso supporto e dai, magari anche voi che siete

all'ascolto, magari anche oggi in questa puntata un po' particolare.

Andrete nella sezione supporto del sito easypodcast.it per aprire i vostri gonfi o meno gonfi

portafogli e donare da pochi centesimi a miliardi e miliardi di euro al vostro podcast preferito.

Detto questo, Luca, direi che possiamo introdurre una novità, un ospite che in questa puntata

abbiamo invitato, o meglio ci siamo incrociati nel web e abbiamo detto ma sì, registriamo

insieme una puntata che raccontiamo di cose molto interessanti.

Di cui forse si parla troppo poco spesso su EasyApple.

In realtà sì, forse ne parliamo anche ma non nella maniera corretta, nella maniera

del sentito dire, nella maniera del credo che.

Vabbè, Eugenio, benvenuto su EasyApple.

Ciao a tutti, grazie di avermi qui.

Due parole per presentarti, magari chi sei, cosa fai nella vita.

Sono un data science manager in una grande corporation in New York City, compagnia siama

CVS Health, quello di cui mi occupo è principalmente creare algoritmi di machine learning molto

su piattaforme Apple per appunto predizione di malattie o altri eventi nel futuro.

Quindi tutta una roba molto interessante che mi piace.

Malattie e eventi nel futuro mi fa pensare ambiente assicurativo, dimmi solo sì o no,

ma se vuoi, se no lo stesso.

Molto ambiente assicurativo anche, ma non solamente.

Ok, quindi come mai, Eugenio?

Su EasyApple, diciamo agli ascoltatori, diciamo che lui ha già detto due parole che sono

quelle chiave di questa puntata, quindi machine learning e ambiente Apple.

Quindi chi segue da vicino lo sviluppo dei nuovi iPhone sa che da parecchio tempo ci

sono dentro questi neural engine che sembra facciano magie, quei nostri iPhone, però

facciamo un mezzo passo indietro.

Quindi chiediamo a Eugenio se hai voglia di raccontarci, anzi beh se hai voglia, sei venuto

qua apposta, quindi sicuramente avrai voglia, di raccontare che cos'è questo machine learning

e queste reti neurali che tu programmi.

Certo, è questa nuova tecnologia, molto recente, probabilmente negli ultimi dieci anni è diventata

parte più integrante di varie industrie della ricerca e quello in cui consiste è l'utilizzo

di grandi quantità di dati.

Quindi per apprendere le relazioni tra input, quindi informazioni in ingresso, e output,

quindi degli eventi.

Per esempio, come dicevamo prima, se guardi all'ambito medico o un altro ambito in quella

regione, se tu fornisci un sistema di machine learning, enormi quantità di dati sui pazienti,

quindi l'età, il sesso, le diagnosi, le procedure, il modello machine learning riesce a capire

dopo varie case.

Dopo varie persone, quali sono le relazioni tra queste caratteristiche di ingresso e vari

eventi nel futuro, per esempio, o anche nel presente.

Quindi qual è la probabilità che una persona magari sviluppi una malattia nel futuro o

che abbia, per esempio, una brutta esperienza, diciamo, all'ospedale, che abbia problemi

in un'operazione chirurgica.

E quindi c'è appunto questo apprendimento automatico delle relazioni tra input e output

senza la componente umana.

Quindi non c'è l'uomo che spiega alla macchina, se succede questo, allora fai quell'altro,

se succede quell'altro, fai quell'altro ancora, che è un po', diciamo, l'algoritmo, per così

dire, il concetto che noi abbiamo di algoritmo, perlomeno io ho di algoritmo, è il tipo di

programmazione che, diciamo, comprendo.

Il machine learning è tutt'altro paradigma.

Tu praticamente dai là alla macchina e poi lei evolve, si muove in modi che tu forse puoi

anche controllare in qualche maniera, ma non sei veramente in grado di forzare, se ho detto

qualcosa di sbagliato.

No, è proprio come dici tu.

Quello che di solito era il paradigma prima era noi, in base alla nostra esperienza, diamo

le regole a questo sistema, quindi i FALS.

C'è questa situazione, fai questa azione.

Altrimenti fanno un'altra.

E questi algoritmi, appunto, questa serie di istruzioni, queste ricette, sono molto semplici

da implementare, ma di solito hanno delle carenze.

Di solito è difficile coprire ogni possibilità e capire tutte le relazioni.

Quello che si fa con il machine learning è lasciare la macchina imparare queste relazioni,

questi IF-ALS, e in quel modo diventa molto più potente perché riesce a generalizzare

e a capire relazioni che a volte a noi sfuggono.

All'occhio umano.

All'occhio umano, invece che le macchine riescono a capire in un modo molto più quantitativo.

E la macchina lo capisce?

Cioè, a suon di tentativi, le prova tutte finché si accorge della correlazione o c'è

qualche altro meccanismo in gioco?

No, gli algoritmi sono abbastanza intelligenti, per cui non fanno quello che si chiama brute

force, non provano ogni combinazione.

Cercano di andare, per esempio, nella direzione giusta.

Ci sono algoritmi che di solito dicono, ok, andammi in questa direzione se, per esempio,

guardando questa caratteristica, il valore incrementa, questo errore, l'errore nella

previsione, l'errore nella mia analisi diminuisce, allora tendo ad andare in quella direzione

perché quello mi porta ad avere migliori risultati.

C'è qualcosa di simile alla ricerca dei massimi e dei minimi di una funzione.

Non so, Fede, se queste parole ti riportano a tempi passati, però è un po' quello che

Sì, anche degli zeri.

Quando abbiamo fatto, se non sbaglio, il terzo anno di ingegneria meccanica, si fa un corso

che si chiama Metodi numerici e scientifici, no, e matematici per l'ingegneria, dove spiegavano

come un computer fa a risolvere dei problemi matematici, perché un computer non può dire

che la derivata si fa in questa maniera qua, cioè lui deve andare a calcolarla numericamente,

quindi tutti gli algoritmi per trovare, cioè a un computer non puoi dirgli banalmente

una esecuzione in secondo grado, si risolve con questa formuletta qua, ma magari se vuoi

trovare degli zeri, il computer va per tentativi e capisce se si sta allontanando o avvicinando

alla risposta corretta.

Quindi, interessante questa cosa di Eugenio, ma io avevo una domanda prima, forse saltiamo

sempre un po' i punti della scaletta, ma questo è il mio dono, quello di riuscire a non seguire

mai la scaletta, perché prima tu hai detto questa è una tecnologia che negli ultimi dieci

anni sta, diciamo negli ultimi dieci anni si è evoluta tantissimo e penso a un applicativo

proprio in ambito medico e lo penso sulla mia pelle, perché tu dici si sviluppano algoritmi

che aiutano a prevenire o a capire se un paziente potenzialmente è soggetto a X, Y o Z, ecco.

Se prendo il mio caso specifico, penso che già io so che ho un valore, che ho un valore

che si chiama omocisteina negli esami del sangue, che spesso e volentieri trovo leggermente

sballato, è l'unica cosa che sballa nei miei esami del sangue, e mi hanno sempre detto

L'omocisteina ha una certa correlazione con chi ha gli infarti, ma non è detto che chi

ha l'omocisteina alta abbia per forza un infarto, quindi c'è una correlazione non

proprio diretta, nel senso che chi di solito soffre di infarto ha anche l'omocisteina alta,

ma non chi ha l'omocisteina alta.

L'omocisteina alta soffre di infarto.

Questa è una cosa che io trovo molto legata a quello che dici tu, cioè immagino che quello

che sia stata fatta sia stata fatta una statistica, ecco.

Quindi in uno scenario del genere, una rete neurale tramite machine learning, cioè cos'è

che è in grado di fare rispetto a questa statistica che è un po' quella più classica,

di ampliare la quantità di dati considerati, cioè quindi va un po' a sopperire quello che

è il limite magari di una statistica così semplice, quindi di dire va bene io adesso

guardo soltanto due cose, omocisteina e infarti, invece una rete neurale è in grado di dire

va bene iniziamo a guardare omocisteina, colesterolo, infarti, colore dei capelli, data di nascita,

se fuma, se non fuma, cioè è questo il concetto oppure non proprio?

No è esattamente quello, cioè se tu pensi alle capacità di un medico sono estremamente

elevate, ma sono ancora abbastanza basate su...

esperienze più qualitative, li avrei visto in vari casi, quando invece riesci ad utilizzare

un algoritmo riesci a mettere sullo stesso piano non solamente 100.000, 1.000.000, 10.000.000

di pazienti per capire davvero quali sono le relazioni, ma riesci anche a mettere in

gioco tutte queste varie componenti, quello che siano features, per cui l'età, il sesso,

le varie altre diagnosi, per cui quello che tu vedi da una statistica come quella con

che è correlata a una probabilità di avere un attacco di cuore, eccetera, un algoritmo

di machine learning può dirti ok sì, ma se l'età è inferiore ai 50 anni e la persona

ha queste altre caratteristiche, oppure se la persona ha 80 anni e più e queste altre

caratteristiche, per cui tu riesci ad andare in una granularità che è quasi impossibile

secondo me per un dottore perché ci perdi la testa ad andare dietro a

tutte queste possibili caratteristiche per migliaia, se non milioni di pazienti, riesci

a farlo in un modo quantitativo, quindi basato sui dati e non solamente su quello che sono

le esperienze qualitative, quello che noi ci sentiamo di vedere o di dire.

Ok, quindi penso una cosa che tuttora è assolutamente ignota alla scienza che è la SIDS, la SIDS

sta per Sudden Infant Death Syndrome, che è questa morte improvviso, che è una morte

improvvisa che accade ai bimbi e non è stata ancora giustificata con niente dalla scienza,

cioè io essendo diventato papà da poco ne ho sentito parlare parecchio dai medici dove

ti dicono, sì alcune raccomandazioni, ma che sono raccomandazioni che comunque non

ti aiutano a prevenire questo tipo di patologia, perché è quello che si dice che in alcuni

casi il bimbo semplicemente smette di respirare, punto.

E muore, ed è una di quelle cose che cavolo, cioè se si potesse capire veramente se un

bimbo quando nasce, di cui quanti dati hai di un bimbo quando è nato?

Niente, cioè hai dati di una settimana di vita, sei mesi di vita, esageriamo, cioè

veramente poco, però se una cosa del genere potesse portare a risolvere o comunque aiutare

a combattere una patologia tipo questa, io adesso ne ho presa una perché è una che mi ha

purtroppo fatto dormire poco la notte negli ultimi mesi, cavolo è una cosa fantastica

proprio grazie alla fine alla immane potenza di calcolo, perché penso che una delle chiavi

per poter creare una rete neurale che funzioni penso sia in maniera totalmente ignorante

sia la potenza di calcolo o comunque avere dell'hardware molto importante.

Molto diciamo adatto a eseguire questo tipo di operazioni, motivo per cui immagino Apple

sia tanto spingendo nei suoi chip, nei suoi soc, soc, soc, soc o soc, questo non lo so,

soc mi sembra una roba tipo, soc mi sembra una roba un po' romagnola, tipo soc, soc,

i soc, sistemone chip dove ci sono dentro delle parti dedicate proprio a questo applicativo,

giusto Eugenio?

Se ho detto sbagliate, sbagliami.

No è correttissimo e anzi è un ottimo esempio quello che proprio dicevi tu della sudden infant death syndrome,

cioè com'è che il machine learning in quel caso può aiutare e rivedere ok se abbiamo un data set,

se abbiamo un foglio di calcolo di Excel con 10.000, 100.000 pazienti, quindi bambine,

ogni riga è l'informazione su un bambino, su un paziente e ogni colonna è una caratteristica,

e possiamo dare impasto a un algoritmo di machine learning questo data set, questa informazione,

e se una colonna è se questo bambino poverino è sopravvissuto o no, appunto la sudden infant death syndrome,

l'algoritmo riesce a capire quali sono le relazioni tra tutti questi vari input e l'output in un modo automatico e molto veloce,

per cui riesce a dirti ok magari questa caratteristica è la causa principale,

di quella predizione, e paradossalmente il problema ora non è per esempio la capacità di calcolo,

perché appunto con i chip di Apple M1 puoi lavorare su 100.000 o 1.000.000 di righe senza problemi in poche ore, sono minuti,

è più un fatto di dire dobbiamo avere accesso ai dati, a grandi quantità di dati che siano completi,

per esempio in questo caso magari l'informazione anche sui genitori potrebbe essere d'aiuto,

e quello è il problema principale, non è quasi più un problema di calcolo,

è un problema di dati.

Ho capito, ma per tornare un po' magari coi piedi per terra,

perché adesso magari stiamo parlando di cose che mi metto anche nei miei panni,

dico sì ok, sono molto però distanti da me,

magari qualche esempio di utilizzo, magari anche proprio in ambiente Apple,

dove questa rete neurale la possiamo tastare,

abbiamo dei dispositivi, io penso un esempio che credo sia forse quello sotto gli occhi di tutti,

è il riconoscimento dei volti nell'applicazione foto,

se non sbaglio io mi immagino che è proprio quello l'esempio,

cioè il dataset sono tutte le foto e mano a mano che io dico alla rete neurale,

sì guarda questo sono io, questo è Luca, questo è Eugenio, questo sì sono sempre io,

lei continua ad imparare e a riconoscere in maniera sempre migliore quelli che sono i volti,

dei vari contatti della rubrica,

non so se questo può essere un esempio o se ce ne sono altri magari più centrati.

Sì quello è un esempio, se appunto vedi Apple Photos,

quello che ti fa adesso è già la capacità di fare clustering,

quello è un sistema di machine learning unsupervised,

in cui tu non gli hai detto che queste persone sono la stessa persona, hanno la stessa faccia,

ma l'algoritmo di per sé è riuscito a individuare che ci sono somiglianze,

quindi tutte queste foto contengono la stessa persona,

ma poi puoi anche appunto label la persona o l'oggetto,

e lì è quello che diventa di solito machine learning come dicevi tu,

più supervised, in cui hai la possibilità di dire tramite l'image processing,

tramite quindi machine learning applicato alle immagini,

la capacità di riconoscere i volti e anche di riconoscere oggetti,

per cui se tu anche inserisci magari il nome di un oggetto nelle foto di Apple Photos,

riesci a individuare tutte le foto che menzionano quella o che contengono quell'oggetto,

sempre tramite intelligenza artificiale e machine learning.

Ok, quindi esiste un tipo di machine learning che è, tu hai detto, unsupervised,

quindi non è supervisionato, vuol dire che non c'è dietro un maestro

che spiega che cos'è quell'output lì, ma già la rete,

neurale di per sé, raggruppa quelli che potrebbero essere degli output,

diciamo, coerenti tra di loro, e poi invece c'è un altro tipo di rete,

o è una cosa, diciamo così, cioè non c'è una distinzione secca tra le due tipologie?

C'è abbastanza una distinzione secca, sono due tipologie diverse di algoritmi,

come dicevamo, uno unsupervised, in cui non c'è un esperto che è andato a dire

ok, questo è Federico, questo è Eugenio.

Ma è semplicemente un algoritmo che automaticamente cerca di raggruppare elementi per somiglianza

e in base, come dire, alla differenza tra di loro.

Più due elementi sono distanti e più sarà improbabile che appartengono alla stessa categoria.

E quegli algoritmi semplicemente accomunano cose simili, le trovi in modo semplice,

e invece ci sono altri algoritmi che sono basati sulla supervisione di un esperto,

per cui c'è una persona, di solito, che è un esperto,

in quell'ambito medico o del riconoscimento di oggetti.

E a volte non devono essere neanche troppo esperti,

che hanno detto ok, questa è una persona, questo è un gatto, questo è un cane.

E l'algoritmo inizia a capire le relazioni grazie anche all'input di questo esperto.

Ok, mi sfugge un po' quale può essere un'applicazione, diciamo così, concreta

di una rete non...

Non supervisionata.

Cioè, se alla fine poi non arriva un esperto o una persona comunque a dare dei label,

delle etichette ai vari risultati,

faccio fatica a vedere una...

Però proprio per questo sto facendo una domanda a te, magari mi puoi aiutare a capire.

Cioè, ok, do 10.000 foto di animali

e lui alla fine dividerà da una parte quelli che per lui sono qualcosa

e per me sono cani,

poi lui dividerà quelli che...

Per lui sono qualcosa di simile, però io dico che sono gatti.

Cioè, a questo punto qua, comunque ha bisogno, secondo me, di un...

No, ha bisogno sempre alla fine di un intervento umano che gli dica

ok, questo è un cane, questo è un gatto, questo è un delfino, questo è un elefante.

Cioè, penso...

Adesso quello che è sotto...

Scusami, finisco il concetto poi.

Poi ti lascio rispondere.

Tipo, adesso che...

Noi abbiamo parlato la scorsa puntata di un'applicazione per iPhone

che si basa, penso, su Deep Fusion,

però possiamo utilizzare...

Possiamo utilizzare gratuitamente oggi anche da lì

per provare a generare delle immagini

dove noi diciamo che cosa vorremmo vedere

e la rete neurale ci restituisce un'immagine.

Immagino che questa rete sia supervisionata da qualcuno che dica

questa è la foto di un bicchiere,

questa è la foto di un compleanno,

questa è la foto di Hitler,

questa è la foto di Pikachu,

cioè tutte queste cose qua.

Quindi, quale può essere invece un'applicazione di una rete neurale

o un esempio di rete neurale dove non c'è di...

dietro qualcosa che ti...

che ti dice che cos'è una cosa piuttosto che un'altra?

Di solito c'è l'intervento umano dopo

per definire qual è quell'oggetto,

qual è il significato semantico, simbolico di quell'oggetto.

E quello è di solito anzi uno dei problemi.

Cioè che tu, come dicevi, puoi avere un algoritmo

che automaticamente differenzia tutte le immagini magari di cani

ma non dà un label, non dà un nome a quell'oggetto

in questi algoritmi qua, tu non hai bisogno di un esperto,

non hai bisogno di un esperto che dica

questo è un cane, questo non è un cane.

Quindi l'algoritmo è potente nel senso che non ha bisogno

di tutto quell'input umano all'inizio

ma ha bisogno di input umano alla fine.

Per cui può essere utilizzato in un modo più semplice

quando hai magari meno dati

ma poi alla fine hai bisogno di una persona

che interpreti quel concetto.

E a volte è un pochino più difficile.

Per esempio in un caso ho lavorato...

ho lavorato con un'azienda che lavorava nell'ambito delle notizie

e per cercare di categorizzare le notizie

abbiamo utilizzato un algoritmo di questo genere unsupervised

perché è molto difficile onestamente categorizzare le notizie.

Questo algoritmo alla fine ti dava dei gruppi di notizie

che erano accomunati tra di loro

e poi stava a noi o almeno agli esperti più nell'ambito delle notizie del domain

di dire questo gruppo di notizie riguarda tutti magari

Altre volte magari ricordavano la tecnologia.

E in quel momento lì è quando di solito ci sono molti errori

perché l'algoritmo magari ha interpretato

quel gruppamento in un modo diverso

da quello che una persona potrebbe interpretare alla fine.

Ho capito, ho capito, ho capito.

Senti, facciamo un passo indietro

o di lato adesso non so esattamente dove ci stiamo muovendo

però abbiamo parlato di ambiente aereo

e di ambiente Apple.

Cosa significa fare machine learning in ambiente Apple?

Cioè ti basta il tuo MacBook Air, MacBook Pro

o serve un cluster di Mac?

Strumenti che si usano?

Cioè mi immagino terminale o un foglio di testo per programmare

oppure ci sono degli strumenti Apple?

Racconta magari un po' com'è.

Sono curiosissimo di sapere com'è.

La tua giornata di programmazione, strumenti, software, hardware?

Di solito basta il computer, il Mac

e quello che è potente proprio che tutto l'ecosistema Apple

è talmente unico e costruito con tutte queste relazioni

tra i vari componenti per cui i processori lavorano molto bene

e i software lavorano bene con l'hardware.

Quello che di solito utilizzo appunto è il Mac.

Ho vari strumenti.

Ho vari strumenti per scrivere codice.

Uno di questi si chiama Visual Studio Code,

che è un ottimo programma, ma ce ne sono altri.

Per esempio PyCharm,

è un altro buon editor di testo per scrivere codice.

E di solito programmo in Python,

che è anche un programma che viene shipped direttamente dal Mac,

per cui qualunque Mac appena lo apri ha già installato Python

e quindi puoi programmare sin dall'inizio.

E di solito programmo appunto,

in questi editor di testo,

e puoi utilizzare i chips, soprattutto quelli nuovi di Apple,

per utilizzare questi vari algoritmi neurali,

queste reti di intelligenza artificiale,

in un modo molto performante,

per cui si riesce ad analizzare centinaia di miliardi di dati

in pochi minuti.

Però mi sfugge un passaggio.

Cioè tu lavori,

su ambiente Apple,

sviluppi immagino la rete neurale,

immagino che scrivi anche proprio pezzi di codice,

come dicevi prima,

poi la passi a,

come facevi l'esempio prima,

alla testata giornalistica,

che utilizza questa tua rete neurale

per categorizzare le notizie.

Cioè loro poi,

dove la fanno girare questa rete neurale?

A loro volta su un server Apple,

oppure questa poi rete neurale

può essere trasferita su altro hardware,

girare su un server Linux o altro?

Questa è una domanda da super ignorante.

No, un'altra domanda.

Di solito, soprattutto con le aziende al giorno d'oggi,

vengono oranate su cluster di computer,

quindi vari computer,

di solito abbastanza computer normali,

che lavorano insieme,

non solamente Apple.

Quindi possono oranare questi programmi

su vari sistemi

o direttamente nel computer.

Ma la potenza di questi algoritmi

è che non sono legati

solamente a una piattaforma

ma possono essere utilizzati

in varie altre.

E come si comincia?

Cioè, cerchi su Google

How to do machine learning for dummies

dei percorsi di formazione?

Ecco, questo è anche interessante.

Cosa hai studiato?

Cosa hai fatto?

Come sei arrivato lì?

Ci sono entrambi.

una delle cose positive adesso

nel 2022 è che

ci sono tantissime risorse online

per appunto imparare e iniziare

a fare machine learning e intelligenza artificiale.

Io personalmente

ho iniziato così

soprattutto quando ero a Londra a lavorare

e poi mi sono formato all'MIT

in un modo un pochino più rigoroso.

E penso che le risorse online

onestamente sono fantastiche.

Sono un ottimo modo per iniziare

e poi letteralmente

e è quello che anche a livello lavorativo

la maggior parte della gente fa.

Nessuno è un esperto di tutto

e ogni volta che c'è un nuovo problema

ovviamente ci pensi

ma di solito vai anche a vedere

cosa hanno fatto altre persone

per cercare di evitare

di reinventare la ruota

almeno in America.

Quanto tempo ci metteresti a licenziarti

se non ci fosse sta cover flow?

Giusto per curiosità.

Sarei licenziato molto velocemente

non solamente la mia azienda.

E quello secondo me

è la differenza principale

un corso online

semplicemente avere accesso

a tutte queste risorse

e un'educazione un pochino

Entrambi hanno pro e contro.

Un'educazione rigorosa

è un'ottima educazione

e dall'altro lato

a risorse gratis

la supervisione di esperti.

dico a tutte le persone

le risorse online

di non solamente

cioè prendi il codice

copy and collie

ma di cercare di capire

tutte quelle implicazioni

un pochino più

a livello umano

o a livello di interazione

che quelli sono

le componenti principali.

Cioè creare l'algoritmo

è quasi la parte più facile

avere poi utenti

che davvero lo utilizzano

e ne tragano benefici

quella parte più difficile.

un po' in tutto

è facile farlo

è difficile trovare

che hanno voglia

trarre beneficio

perché alla fine

uno ascolta un podcast

usa qualsiasi cosa

nella vita in generale

se gli dà piacere

se gli dà beneficio

nel tuo preciso

nel tuo particolare

caso applicativo

stiamo parlando

quindi una cosa

io penso sempre

questa è una roba

io voglio sperare

alcuni di questi dati

vengano venduti

che ne possa fare

per farmi vedere

sono diventato papà

arrivi anche voi

quando lavorate

immagino che siano dati

abbastanza di dominio

però sono in mano

però quando si

immagino che i dati

comunque vengono

oppure può essere

anche una richiesta

tu ti vai a trovare

quindi io devo andare

a cercare i dati

che sono diventate

che hanno tot anni

che è loro figlio

a cui piace Star Wars

e quindi io gli propongo

questa discorsa

di mole di dati

forse troppo generica

per fare un algoritmo

di machine learning

un minimo di dati

può già far qualcosa

o immagino ovviamente

che più dati gli do

più diventa accurato

rispetto alla tua prima domanda

situazioni in cui

a enormi quantità di dati

nell'azienda in cui lavoro adesso

abbiamo accesso

a milioni di persone

nel sistema sanitario americano

perché queste persone

lavorano con noi

sono nostri clienti

di andare online

a cercare altre risorse

e quella è una fortuna

sei in carenza di dati

un esempio semplice

è scoppiato il covid

quando ero in MIT

aiutare appunto

in questa situazione

trovando i dati online

cercare di trovare

di ogni stato americano

sulle ospitalizzazioni

i decessi eccetera

cerchi di utilizzare

tramite i tuoi utenti

e i dati esterni

il salario medio

le caratteristiche

e quelle informazioni

dei valori aggiuntivi

un po' di valore aggiuntivo

e per rispondere

alla tua seconda domanda

algoritmi più semplici

che anche in economia

vengono utilizzati

linear regression

una regressione normale

un algoritmo del genere

è molto semplice

e non ha bisogno

più di deep learning

di intelligenza artificiale

con reti neurali

quelli di solito

di generalizzare

un numero indicativo

ma sono abbastanza

numeri indicativi

perché ho in mente

da qualche anno

che mi piacerebbe

in ambito lavorativo

su una rete neurale

selezione di prodotto

che abbiamo a disposizione

sono troppo pochi

dipende ovviamente

i possibili output

quindi la domanda

era così sicuramente

hai citato il covid

quando ci siamo

incrociati sul web

Eugenio Zuccarelli

il primo articolo

che salta fuori

capire il perché

perché si parla

dentro la classifica

sotto i 30 anni

come spesso si fa

per portare avanti

con il governo italiano

dai 30 under 30

vanno all'estero

questo articolo

proprio del tuo

questi due anni

per quanto riguarda

la lotta contro il covid

in qualche minuto

legato al covid

andato a studiare

e machine learning

nel settembre 2019

è scoppiata la pandemia

tutto è molto cambiato

e noi ci siamo ritrovati

in una situazione

ovviamente non eravamo

troppo una mano

ma avevamo queste capacità

avevamo il nostro Mac

avevamo i nostri

mettere in gioco

un impatto positivo

almeno un pochino

quello che abbiamo fatto

come dicevi prima

cercare di trovare

sono stati i dati

su tutte le varie

ospitalizzazioni

per ogni codice postale

riportava in un modo diverso

c'era chi utilizzava

chi aveva un excel

quindi abbiamo creato

per automaticamente

tutte queste informazioni

in un modo automatico

un unico data set

che abbiamo avuto

queste informazioni

le domande principali

dare una risposta

quali sarebbero

le cose più utili

come è successo

anche in America

un'estrema pressione

abbastanza mascherine

e quindi abbiamo cercato

proprio con machine learning

quali sarebbero state

più ad alto rischio

in quale regione

appunto abbiamo fornito

tutti questi vari codici postali

e tutte le caratteristiche

di machine learning

e questo è riuscito

a fare predizioni

che avranno più

una probabilità

tante ospedalizzazioni

quello è stato molto utile

proprio perché

siamo riusciti a fornire

queste informazioni

ai governanti locali

proprio perché

più ad alto rischio

utilizzare un pochino

i nostri strumenti

un impatto positivo

quindi immagino

ha parlato di te

tutto questo progetto

un aiuto concreto

per contrastare

quello che è stato

non è ancora finito

immagino interessante

di quelle che erano

della vostra rete neurale

perché è un po'

qualunque persona

che vado online

trovo un dataset

e creo un algoritmo

di machine learning

questo è proprio

non era solamente

puro apprendimento

un impatto diretto

e potete vedere

non è quanto importante

queste informazioni

prendono le decisioni

gli Stati Uniti

dall'Inghilterra

negli Stati Uniti

è un requisito

o è una scelta

settore lavorativo

esiste in forma

non è interessante

spiegarci un attimino

di scelta di vita

tantissime opportunità

per data science

machine learning

una questione di

stadio di crescita

è ancora un pochino

più agli albori

o il Regno Unito

e le schierze in Italia

onestamente ho visto

tantissimi giovani

tantissime persone

le stesse skills

proprio perché

a questa informazione

è pubblico ormai

non ci sono più

queste barriere

è più una questione

di infrastruttura

trovo che per esempio

anche nell'ambito

di condivisione

digitalizzazione

l'Italia purtroppo

è ancora un pochino

indietro rispetto

con tutti i problemi

che poi ci sono

era in scaletta

la tua giornata

adesso immagino

qualche ragazzo

a raccontare questo

magari non ho ancora

deciso cosa fare

all'università

mi voglio lanciare

in questo percorso

ma poi alla fine

tutto il giorno

dei grossi brainstorming

perché bisogna capire

com'è la tua giornata

la mia giornata

dipende in base

al periodo dell'anno

a livello di business

dobbiamo trovare

delle nuove opportunità

per avere un impatto

positivo sulle persone

che fa in quel periodo

in quelle magari settimane

è cercare di fare analisi

quelli che si chiamano

questi vari strumenti

per cercare di capire

analizzando i dati

gli aree di opportunità

adesso la mia compagnia

lavoriamo molto

proprio perché

abbiamo fatto queste analisi

che ha un enorme

30 milioni di persone

quindi quasi il 10%

lì abbiamo deciso

poi di fare un prodotto

e quindi ci sono stati

quale prodotto fare

che il prodotto

è stato scelto

proprio una questione

qual è la vision

qual è il design

di questo prodotto

di machine learning

quindi che dati

quale algoritmo

impatto avrà poi

ma nello specifico

due o tre ore al giorno

per cui scrivi codice

per quel progetto

per quel prodotto

o per quell'analisi

quali sono le opportunità

magari team lead

per cercare di capire

più ad alto livello

per avere un impatto

quindi molto coding

più del modello

della struttura

che avesse sentito

questo tuo racconto

voglio fare l'Eugenio

qual è il tuo suggerimento

a fare l'Eugenio

il mio suggerimento

sporcarsi le mani

il più possibile

di guardare corsi

all'università

il più possibile

quello che si impara

facendo le cose

è estremamente

che uno può fare

di mettere le mani

il più possibile

è un suggerimento

all'informatica

spesso applicabile

sicuramente importante

una preparazione formale

io ho fatto questo

nel caso di molte aziende

faccia più scalpore

o quella università

ho un'università

ho un valutatore

più nella media

ma ho fatto mille cose

forse vale di più

assolutamente d'accordo

questo viene da una persona

che non si è mai laureato

con il massimo dei voti

più che d'accordo

anch'io sono di quella

anch'io non mi sono laureato

col massimo dei voti

ci battiamo alla spalla

a un oceano di distanza

abbiamo fatto bene

sul massimo dei voti

mi capita di fare

abbastanza spesso colloqui

ho provato a fare colloqui

anche dal Politecnico di Milano

bacio accademico

di una semplicità

tanto intelligenti

che vanno oltre

quella che è la mia aspettativa

io non sono in grado

di capire quello che loro

qual è la differenza

e un telefono Android

e lui mi ha risposto

robe del genere

sono assolutamente d'accordo

e esprime una performance

in quel momento

in quelle condizioni

che ti puoi portare addosso

visto che siamo arrivati

al termine della puntata

a farti queste domande

la prima è un po'

magari un po' stupida

avete mai pensato

di fare una rete neurale

che qual è il prossimo

l'abbiamo fatto

è più una questione

e questo è uno

con le reti neurali

come si comporta

la rete neurale

prendere decisioni

di alto livello

di alta importanza

tramite una rete neurale

sono black boxes

per cui non sai

esattamente come funzionano

tramite un modello

di machine learning

come una rete neurale

è molto potente

non sai per quale motivo

quindi se ci dice

non siamo interamente

consci del motivo

per cui ci ha detto

in alcune situazioni

questi tipi di algoritmi

ma in situazioni

un pochino più

soprattutto anche

è più preferibile

utilizzare modelli

ma più interpretabili

tipo regressioni

decision training

hai già risposto

anche alla seconda domanda

che volevo farti

una delle difficoltà enormi

con una rete neurale

è che quando mi tira fuori

cioè un algoritmo

che è definito

adesso non ce la faccio più

devo correggerti

è tutta una puntata

output sia per output

input A output B

non ce la facevo più

ho confesso di aver fatto

un piccolissimo aperitivo

prima di iniziare la puntata

e a me la birra

metto un input A

ed esce un output B

con un algoritmo

devo rivedere l'algoritmo

devo modificare una regola

ho dimenticato un if

ho fatto qualcosa

che posso migliorare

ma ha una rete neurale

dire se alla fine

penso per esempio

per generare le immagini

che cosa vorrei vedere

lui mi tira fuori

per quanto l'ho usato

se questo è un termine

quando si fa una rete neurale

sì è un ottimo punto

ed è uno dei problemi principali

del machine learning

uno dei modi migliori

per vedere appunto

progetti veri e propri

quindi c'è una

la complessità

e l'interpretabilità

questo problema

se io ho un modello

molto complesso

come una rete neurale

è molto potente

è molto predittivo

se sia sbagliato

e quindi di solito

modelli un pochino

pick and drop a code

quindi aprire il modello

e riuscire a capire

quelli che ti permettono

ok la predizione

prendere questa decisione

proprio in una struttura

quali sono state le decisioni

per cui ti dici

magari se l'età

c'è quest'altra condizione

allora fai questo

e in quel modo lì

soprattutto tramite

il ragionamento

che sono state prese

sono giusto o sbagliate

perché per esempio

se hai un dottore

prende questa serie

questo è quello

e quindi è corretto

oppure ti puoi dire

bloccando in questo modo

che sono sbagliati

non ti devi fidare

uno dei problemi principali

quello dell'interpretabilità

della complessità

della difficoltà

una chiacchierata

super interessante

spero lo sia stata

anche per tutti

i nostri ascoltatori

adesso se qualcuno

magari ha qualche domanda

seguirti più da vicino

quali sono i tuoi contatti

cosicché possiamo

lasciarli anche

nella notte della puntata

e chi ha voglia

poi di seguirti

o di contattarti

sicuramente contattare

mi farebbe super piacere

soprattutto su LinkedIn

Eugenio Zuccarelli

su qualunque social media

allora noi lasciamo questo

nella notte della puntata

hai intenzione di tornare in Italia

ti piacerebbe un domani

mi piacerebbe tornare in Italia

è più una questione di

le opportunità

la situazione in America

sia molto migliore

per vari motivi

appunto lavorare

cercare di avere

molto meritocratica

ci sono enormi quantità

di opportunità

quindi un cervello

ci può fare piacere

sono sempre stato indeciso

se è un discorso

questo dei cervelli

che se ne vanno

i cervelli che tornano

è una considerazione

veramente Eugenio

per essere stato con noi

per aver portato

una prospettiva diversa

al nostro podcast

speriamo che sia

ai nostri ascoltatori

ecco ogni tanto

un po' speciali

dalla solita routine

a cui li abbiamo

meno interessato

la settimana prossima

torneremo con il format

dagli ascoltatori

inviando una mail

o lasciando una recensione

su apple podcast

se avete piacere

a diventare dei donatori

l'ha spiegato molto bene

Luca inizia la puntata

abbiamo diversi metodi

potete farlo direttamente

alle note della puntata

e se poi avete piacere

sapete che c'è

una bellissima easy chat

tutta la settimana

del più e del meno

ma anche di argomenti

si fanno domande

e si trovano risposte

si mettono input

e si trovano output

potrebbe essere

una rete neurale

ecco mettiamola così

a parte le stupidate

trovate oltre a

e trovate anche

582esima puntata

è veramente tutto

eugenio per essere

e noi ci sentiamo

la settimana prossima

con una puntata