Algoritmo di AI per la diagnostica di Covid-19 e altre patologie

La diagnostica di Covid-19 e altre patologie è stata accelerata grazie ad un algoritmo di AI.

Grazie ad una tecnica chiamata Federated Learning (apprendimento federato) l’International Team dell’Università di Cambridge ha sviluppato un algoritmo di AI in grado di essere addestrato impiegando i dataset di altri ospedali e strutture estere.

In questo modo, la diagnostica di Covid-19 e altre patologie vengono agevolate mantenendo intatta la privacy dei pazienti.

FEDERATED LEARNING PER LE DIAGNOSI: IL MACHINE LEARNING SENZA DATI DI TRAINING CENTRALIZZATI

In opposizione alle tradizionali tecniche di apprendimento che richiedono la centralizzazione dei dati di training su unica macchina o datacenter (1), il Federated Learning descrive una tecnica di apprendimento automatico in cui, nella fase di training algoritmico, vengono impiegati dispositivi decentralizzati che però mantengono i dati senza la necessita che questi vengano scambiati (2).

In questo modo viene garantita la sicurezza e la protezione del dato.

Vedi anche Apprendimento Federato per predire il fabbisogno di Ossigeno.

 

IL RUOLO DEI DATI

Nelle prime fasi della pandemia, molti ricercatori AI si sono dedicati allo sviluppo di modelli di diagnostica del Covid-19 anche se molti di questi impiegavano dati di bassa qualità provenienti da dataset “Frankestein”.

Il dataset sul quale i ricercatori dell’International Team si sono basati conteneva più di 9000 TAC di circa 3300 pazienti provenienti da 23 ospedali diversi, inglesi e cinesi.

Il framework delineato ha permesso di sviluppare tecniche di AI affidabili e accurate nel campo della diagnosi medica: “laddove i modelli precedenti si basavano su dati open source arbitrari, abbiamo lavorato con un ampio team di radiologi del NHS e del Wuhan Tongji Hospital Group per selezionare i dati, in modo da partire da una posizione forte” sostiene il co-autore Hanchen Wang del dipartimento di Ingegneria dell’Università di Cambridge.

Il dottor Michael Roberts di AstraZeneca e del Dipartimento di Matematica e Fisica Teorica ha sottolineato come ogni paese ha il suo modo di fare le cose, quindi è necessario un database il più ampio possibile in modo tale da creare qualcosa che possa essere utile alla maggior parte delle cliniche.

Nell’articolo pubblicato dai ricercatori su Nature Machine Intelligence (3) è stato anche indicato come gli studiosi abbiano dovuto mitigare i bias causati dai diversi dataset e come hanno utilizzato la tecnica del Federated Learning.

In questo modo hanno potuto addestrare un modello di Intelligenza Artificiale in grado di preservare la privacy di ciascun data center.

Inoltre, gli studiosi hanno predisposto un confronto tra i modelli di AI, validati dai ricercatori con gli stessi dati senza sovrapporli a quelli di training, con le diagnosi elaborate dal team di radiologi sullo stesso dataset, quindi le stesse TAC usate dal modello di AI, comparando l’accuratezza del modello di Intelligenza Artificiale con l’analisi dei professionisti del settore.

 

CONCLUSIONI

Le ricerche condotte dall’International Team dell’Università di Cambridge hanno sviluppato un modello di Intelligenza Artificiale utile non solo alla diagnosi del Covid-19 ma anche di molte altre patologie grazie all’analisi delle TAC provenienti da molte cliniche diverse, il tutto garantendo il training del modello in modo completamente anonimo preservando la privacy dei pazienti.

“Lavorando con altri paesi, possiamo fare molto di più di quanto possiamo fare da soli” ha sottolineato Roberts.

Risorse:

https://www.cam.ac.uk/research/news/new-model-improves-accuracy-of-machine-learning-in-covid-19-diagnosis-while-preserving-privacy:

  1. https://ai.googleblog.com/2017/04/federated-learning-collaborative.html
  2. https://www.analyticsvidhya.com/blog/2021/05/federated-learning-a-beginners-guide/
  3. https://www.nature.com/articles/s42256-021-00421-z