Il computer neurale differenziabile sviluppato dalla Google DeepMind si basa su un algoritmo che combina l’elaborazione dei dati con l’autoapprendimento. È perfettamente in grado di trovare soluzioni ai problemi attingendo solamente dalla propria memoria, dal proprio sistema di deduzione, senza che vi sia alcun bisogno della previa installazione di un qualche tipo di software.
IN BREVE
Computer neurale differenziabile: le ricerche della Google DeepMind
DeepMind è un’azienda inglese di intelligenza artificiale fondata nel 2010 come DeepMind Technologies e poi rinominata Google DeepMind poiché acquistata da Google nel 2014. Questa società ha sviluppato un algoritmo che combina l’elaborazione dei dati con l’autoapprendimento. In questo senso, la DeepMind ha creato un computer neurale differenziabile (DNC) testandolo poi sul campo presso la metropolitana londinese. Sembra che l’algoritmo riesca a mantenere un’informazione in memoria e a utilizzarla per risolvere problemi successivi simili poiché il dato acquisito può poi essere utilizzato per ottenere un’ulteriore soluzione.
Per quanto riguarda le prove che sono state eseguite presso la London Underground, gli scienziati hanno voluto allenare la loro rete neurale a trovare il modo più veloce di viaggiare tra due fermate della metropolitana. Alex Graves, attivo studioso alla DeepMind nonché leader della ricerca, ha detto: “Potete dargli in pasto la mappa della metropolitana, può archiviare quella mappa e usarla da quel momento in avanti in situazioni simili, se ne ha bisogno.” Ciò che deve stupirci non è tanto il fatto che un’intelligenza artificiale riesca a muoversi in modo efficiente attraverso una metropolitana ma il fatto che questa riesca a memorizzare il metodo che ha appreso per risolvere il problema che le è stato posto.“È in grado di operare su qualcosa di completamente nuovo, che non ha mai visto prima. È un tipo di memoria di cui erano prive le reti neurali” ha aggiunto Graves. Ad esempio, la si potrebbe utilizzare presso le metropolitane di altre città del mondo. Ma che differenza c’è con una rete neurale qualsiasi? Nei test effettuati in metropolitana, una rete neurale “senza memoria” non è riuscita nemmeno a finire il primo livello di formazione, raggiungendo una precisione media del 37% dopo quasi due milioni di esempi. La rete neurale con accesso alla memoria esterna nel sistema DNC ha invece completato con successo l’intero programma di formazione e ha raggiunto un’accuratezza media del 98,8% nella “lezione” finale.
Che differenza c’è con una qualsiasi rete neurale?
Potremmo quindi azzardare che il computer neurale differenziabile è in grado di pensare autonomamente quasi come farebbe una mente umana. È perfettamente in grado di trovare soluzioni ai problemi attingendo solamente dalla propria memoria, dal proprio sistema di deduzione, senza che vi sia alcun bisogno della previa installazione di un qualche tipo di software.
Ma cosa hanno fatto esattamente gli studiosi della DeepMind per la creazione del computer neurale differenziabile? In breve, ciò che hanno dovuto fare è stato combinare un network neurale con una normale memoria di un computer. Un network neurale consiste in un ampio insieme di sistemi di elaborazione dell’informazione che cerca di riprodurre fedelmente l’attività dei neuroni del cervello umano, una sorta di grande rete informatica in grado di svolgere la stessa funzione che svolgono normalmente i nostri neuroni. Le reti neurali sono ad oggi qualcosa di davvero molto importante nel campo dell’intelligenza artificiale, praticamente ne costituiscono la base. Quello che gli studiosi di DeepMind hanno fatto, in sostanza, è stato realizzare delle reti neurali in grado di effettuare autonomamente delle ricerche sul web per risolvere un qualsiasi tipo di problema. Per ora il loro computer neurale differenziabile è in grado di risolvere quesiti semplici: oltre a trovare il percorso più breve in metropolitana, riesce, ad esempio, a identificare il tipo di parentela esistente tra più soggetti all’interno di un albero genealogico.
Una rete neurale tradizionale può imparare qualsiasi cosa gli serva ma per farlo deve essere alimentata costantemente con nuovi dati. Graves spiega che non possiamo dare in mano a una rete neurale qualsiasi un pezzo di informazione aspettandoci che la conservi, poiché in breve tempo questa andrebbe persa, dimenticata. Il computer neurale differenziabile, invece, mantiene le informazioni in memoria a tempo indeterminato. Parlando di intelligenza artificiale forte e debole, quindi, considerando che questo algoritmo agisce come una mente umana, in quale categoria dovremmo far ricadere il computer neurale differenziabile?
L’opinione dei ricercatori
I ricercatori affermano che “presi nel loro complesso i nostri risultati dimostrano che le DNC hanno la capacità di risolvere problemi complessi, operazioni strutturate che sono inaccessibili alle reti neurali senza una memoria di lettura-scrittura esterna.” “Come un computer convenzionale, la rete può usare la sua memoria per rappresentare e manipolare strutture di dati complesse e, allo stesso tempo, può imparare a farlo dai dati”. È come se la rete neurale fosse stata allenata, sulla base di una precedente esperienza, a risolvere un problema familiare.
Herbert Jaeger, ricercatore informatico della Jacobs University di Brema ha affermato che “è come se la memoria permettesse all’intelligenza artificiale di ragionare”. La ricerca portata avanti dalla DeepMind potrebbe risultare la base di ricerche future utili nella gestione dei Big Data, quell’enorme massa di informazioni prodotta nell’analisi di ogni avvenimento. Secondo Jaeger, una memoria flessibile ed estensibile in stile DNC potrebbe permettere al deep learning di espandersi in applicazioni Big Data in cui c’è una componente di ragionamento razionale, come la generazione di commenti ai video o l’analisi semantica del testo.
Ricerche affini presso la Google DeepMind
Non è stata la prima volta che DeepMind ha regalato al mondo un simile tipo di intelligenza artificiale. Nel 2014 i ricercatori di DeepMind avevano sviluppato un altro sistema chiamato Neural Turing Machine. Esso combinava reti neurali con una memoria esterna come il sistema DNC ma risultatava limitato poiché il sistema poteva accedere all’informazione grazie al fatto che la memoria veniva fissata e poi eventualmente recuperata. Jay McClelland, direttore del Center for Mind, Brain and Computation della Stanford University, ci spiega, invece, che: “il sistema DNC può accedere a ricordi in una posizione arbitraria. I sistemi DNC e affini potrebbero rappresentare un passo cruciale verso lo sviluppo dell’intelligenza artificiale evoluta, ma potrebbero non bastare per raggiungere tutte le sfumature dell’intelligenza umana.”
Poi è stata la volta di AlphaGo. Quest’ultimo è un sistema di intelligenza artificiale in grado di cimentarsi nel gioco del Go, un gioco interamente basato sulla strategia e la logica. AlphaGo ha fatto parlare di sè quando, nel marzo del 2016, ha affrontato in un incontro di Go uno dei più bravi giocatori al mondo, Lee Sedol. Alla fine dell’incontro AlphaGo ne è uscito vincitore, battendo clamorosamente l’intelligenza umana. Questa si è rivelata senza alcun dubbio un’importante vincita per AlphaGo il cui premio, di circa un milione di dollari, è stato devoluto a svariate organizzazioni di beneficenza, tra le quali l’UNICEF.
Ancora una volta, le macchine sono state in grado di dimostrarci la loro capacità di raggiungere l’intelligenza umana. Dovremmo preoccuparci o essere solamente affascinati?
Fonte
- Hybrid computing using a neural network with dynamic external memory
Nature - Cognitive Computing: Methodologies for Neural Computing and Semantic Computing in Brain-Inspired Systems
ResearchGate