Mario Gentili: dicembre 2010

Il problema

Max era veramente contrariato. Fino a poco tempo fa era assillato dalla necessità di conoscere quanti e quali informazioni caratterizzavano la sua attività investigativa, adesso ne aveva fin troppe! Ma talmente numerose che il suo data base non lo aiutava più. Decise che aveva bisogno di rilassarsi e calzate le scarpe da jogging più comode, fece una passeggiata nel parco. Qui la prima intuizione: doveva concentrarsi su un processo e, immediatamente dopo su un modello innovativo, che a partire dalle sue conoscenze gli permettesse di superare il senso di smarrimento e di impotenza che provava davanti alla lettura dei suoi lunghissimi tabulati per arrivare a trovare, nei dati, pattern nuovi potenzialmente utili e comprensibili. Tornò a casa in pace con se stesso: non aveva risolto il problema, ma adesso lo conosceva. Gli tornò in mente la saggezza popolare che Sun Zi Bing Fa stigmatizzò nella sua “The art of war” e di cui ormai ne aveva fatto un suo paradigma, un suo stile di vita: Se conosci il nemico e conosci te stesso, non devi temere il risultato di cento battaglie. Se conosci te stesso ma non il nemico, per ogni vittoria ottenuta potrai subire anche una sconfitta. Se non conosci nè il nemico nè te stesso, soccomberai in ogni battaglia.
Bene, al lavoro allora! Di lì a poco si ritrovò a censire mentalmente quanto sul tema aveva finora analizzato insieme alla suo team di lavoro e gli fu facile individuare il punto di partenza: i meta-classificatori. Sì, proprio loro che qualche tempo addietro aveva arricchito con le potenzialità delle reti artificiali di natura supervisionata e che ormai aveva archiviato e diffuso sotto il nome di MetaNet. Il prefisso META gli impose immediatamente un rigore di analisi e di approccio al problema che ormai gli era congeniale: perché limitarsi a valutare singolarmente la diversità dei singoli modelli di classificazione? Perché favorirne uno singolo e scartare tutti gli altri? E se considerassimo uno scenario olistico, sistemico, in grado di fondere più classificatori con l’obiettivo di sfruttare la possibile complementarietà delle informazioni estratte da ogni singolo classificatore?
Max percepì immediatamente che questa era la strada da seguire. D’altronde Lewin non disse che il tutto era più significativo delle sue parti? Lo stesso Thomas G.Dietterich, nel corso delle sue ricerche presso l’Università dell’Oregon, suggerì ben tre motivazioni per cui la fusione dei singoli classificatori sicuramente ne genera uno più efficace: una statistica, una computazionale e una relativa alla rappresentazione. Infatti, da un punto di vista statistico la “fusione” di più classificatori diminuisce la probabilità di scegliere un singolo classificatore inadeguato quindi, anche se non è garantito che l’insieme di classificatori sia migliore rispetto a tutti i singoli classificatori, la fusione comporta una diminuzione del rischio di fare una scelta scorretta. Dal punto di vista computazionale, molti dei classificatori usano algoritmi di ottimizzazione euristici per la definizione dei parametri ottimi che possono arrestarsi in ottimi locali, l’aggregazione di questi può condurre a soluzioni più prossime all’ottimo globale pur partendo da ottimi locali. L’ultima motivazione è, riguarda, la rappresentazione, ovvero lo spazio delle soluzioni dei singoli classificatori che può non contenere la soluzione ottima del problema di classificazione, in questo caso l’insieme dei classificatori può espandere questo spazio delle soluzioni ottenendo risultati migliori (ad es: un set di classificatori lineari non può raggiungere singolarmente la soluzione di un problema non separabile linearmente, ma una loro combinazione, sì).
Le risorse
Max convocò subito presso il suo ufficio tutti i collaboratori del Semeion già coinvolti in una esperienza analoga di qualche anno fa. Era infatti a conoscenza che il Centro di Scienze della Comunicazione, alla cui direzione era il vulcanico prof. Buscema, aveva fatto grossi progressi sulla tematica e che anzi aveva attivato una specifica nuova linea di ricerca per fornire un significativo contributo alla costruzione di modelli di meta classificazione sia di tipo supervisionato che non-supervisionato.
Sorseggiato il caffè, era stata assolta la prima incombenza dei convenevoli e quando lo sparuto gruppo di persone raggiunse il giusto livello di attenzione, Max provò a descrivere le sue necessità agli scienziati. Come risposta, il prof. Buscema gli illustrò lo stato dell’arte della ricerca Semeion sulla tematica.
Le parole del professore confortarono Max: Buscema aveva capito subito il contesto balenato con l’irruenza di un flash durante la passeggiata mattutina nel parco. Ma non solo, mentre il professore continuava a parlare, Max riusciva a percorrere la sua mappa mentale dei meta classificatori con la stessa facilità con cui si andava in bicicletta. Certo era un po’ arrugginito, ma si sa, quando si comincia a pedalare dopo un bel po’ che non si è fatta pratica, l’equilibrio è incerto, in ogni caso … il risultato finale è garantito.
Il professore continuava a scrivere formule e grafici sulla lavagna, ma fu lo schema seguente che richiamò subito l’attenzione di Max:

Potenza della rappresentazione grafica! Max capì immediatamente che da un punto di vista matematico la caratteristica generale che accomuna tutti gli algoritmi di una Meta-Net Semeion è la specifica procedura attraverso la quale la plausibilità di ogni output di ognuno dei classificatori che concorrono al network fornisce degli input al Meta-Classificatore globale e ne condiziona quindi gli output.
La proposta
Max sentì che la soluzione poteva essere vicina più di quanto potesse immaginare: quello era il suo giorno fortunato. Il professor Buscema gli propose di lavorare su ipotesi molto stimolante: la realizzazione di un meta-classificatore dinamico capace di prendere il meglio di differenti Meta-Nets. In altre parole si trattava di realizzare un classificatore dove i differenti target di ogni Meta Net incluso nel sistema doveva essere in grado di interagire con gli altri ogni qual volta un nuovo record si prestava ad essere analizzato. Il processo aveva termine quando si riusciva a raggiungere una decisione condivisa tra i Meta Nets.
Il commiato fu repentino perché un po’ per guadagnare tempo, un po’ per verificare la bontà di quanto ipotizzato, tutti gli attori della riunione avevano premura di raggiungere la propria postazione di lavoro per buttarsi a capofitto sul nuovo scenario di ricerca.
Il professore, in particolare, già durante il tragitto di ritorno, aveva in mente la carta d’identità della nuova realizzazione:
• Algorithmic category: Static with weights / dynamic with the nodes;
• Dimensional category: Global;
• Teleological category: Auto-poietic;
• Functional category: Recursive.
… e il nome? Già il nome … il suffisso era scontato: META. E poi? Aspettiamo di vedere lo sviluppo delle equazioni che lo avrebbero implementato.
La nascita di Meta Vector come dinamic Meta Nets.
Quando due giorni dopo Max sentì il telefono squillare sperò tanto che dall’altra parte del filo ci fosse il prof. Buscema. In effetti la speranza non fu disattesa e di lì a poco si decise una riunione presso il Semeion alle ore 15:00. Buscema, seppur volutamente criptico, lasciava intuire, dal tono di voce la soddisfazione di colui che aveva appena centrato il bersaglio. Sì perché nella ricerca, si sa, tutto è un gioco, il complesso gioco dell’osservazione della natura. E forte è l’eccitazione di quando si riesce a dare ragione di situazioni che solo un’ora prima, in quanto non comprensibili, venivano evitate o ritenute non importanti.
Mancavano tre ore all’appuntamento e Max, quasi in maniera superstiziosa, sentì l’esigenza di ripetere la passeggiata illuminante che pochi giorni prima aveva scatenato il suo nuovo scenario di ricerca.
Quando Max raggiunse all’ora stabilita il Semeion, la lavagna del professore era piena di calcoli e Buscema lo accolse con delle parole famigliari che solo dopo Max seppe ricondurre ad Einstein. Buscema esordì dicendogli:”Ricordati Max, se A = successo, allora la formula è: A = X + Y + Z, dove X = lavoro, Y = gioco, Z = tenere la bocca chiusa.”
Max, tranquillizzato, capì subito che il Semeion stava per dargli la soluzione.
Il professore cominciò a parlare con voce pacata e sicura: << Max, cominciamo dal nome: ho chiamato la risposta alle tue esigenze Meta Vector, e adesso te ne illustrerò le peculiarità.
Meta Vector ha una specifica e originale topologia: ognuna delle classi di output è funzione di un vettore di pesi i cui singoli elementi, a loro volta, provengono da ogni output di ognuno dei classificatori di base di ognuna delle Metanets di input. Di conseguenza, Meta Vector eredita tutte le matrici dei pesi delle Metanets addestrate e li usa come vincoli per ottimizzare la seguente funzione di costo:

Indicato con il peso appreso tra l’i-esimo nodo di output della k-esima Metanet e il j-esimo nodo di output di ogni classificatore di base (della k-sima Metanet), le equazioni di Meta Vector che devono essere applicate ad ogni nuovo pattern sono le seguenti:

Domande? Il tutto sembra abbastanza complicato, ma noi conosciamo le regole e quindi dobbiamo porre l’attenzione soprattutto nella fase iniziale della scelta delle k MetaNets da porre in input a Meta Vector: più il pool di input è specializzato e coerente per la tematica da analizzare, maggiori saranno i risultati che si otterranno.>>
Max non potè che essere ancora una volta affascinato dalle capacità del prof. Adesso sapeva cosa fare dei suoi lunghi e noiosi tabulati!

giovedì 9 dicembre 2010

Meta Vector: quando la classificazione è META

Mario Gentili

Archivio blog

Informazioni personali