In Inghilterra e Galles, quattro milioni di persone sono registrate nel programma di screening per le malattie oculari diabetiche del (NHS), e di queste oltre tre milioni vengono esaminate ogni uno o due anni. Il servizio genera ogni anno circa 18 milioni di immagini della parte posteriore dell’occhio, analizzate da un massimo di tre diverse persone, con un carico di lavoro colossale e sempre più difficile da sostenere, che richiede tempo, denaro e risorse preziose.
I ricercatori, coordinati dalla professoressa Alicja Rudnicka della City St George’s University of London, e da Adnan Tufail del Moorfields Eye Hospital NHS Foundation Trust, in collaborazione con la Kingston University e con lo Homerton Healthcare NHS Trust, hanno sviluppato la prima piattaforma a livello mondiale in grado di effettuare un confronto tra gli algoritmi commerciali di IA progettati per rilevare le malattie oculari diabetiche. Questi algoritmi identificano i segni di danni ai vasi sanguigni nella parte posteriore dell’occhio.
L’obiettivo dello studio era quello di determinare se gli algoritmi commerciali di IA siano idonei all’uso da parte del National Healthcare Service (NHS) per individuare le patologie in modo equo, equanime, trasparente e affidabile, utilizzando come primo esempio le patologie oculari diabetiche. Un totale di 25 aziende con algoritmi marcati CE sono state invitate a partecipare allo studio, e otto hanno accettato.
Gli otto algoritmi di IA sono stati applicati a 1,2 milioni di immagini del fondo oculare prelevate dal North East London Diabetic Eye Screening Programme, uno dei programmi di screening diabetico più grandi e diversificati in termini di etnia, età, livello di privazione e spettro delle malattie oculari diabetiche.
In totale, sono state valutate 202.886 visite di screening, che rappresentano 1,2 milioni di immagini provenienti dal 32% di etnie bianche, dal 17% di etnie nere e dal 39% di etnie sudasiatiche. I sistemi di IA hanno impiegato da 240 millisecondi a 45 secondi per analizzare tutte le immagini per paziente, rispetto ai 20 minuti necessari a un operatore umano esperto.
Le prestazioni degli otto algoritmi sono state confrontate con le immagini analizzate da un massimo di tre persone sulla base del protocollo standard utilizzato dal National Healthcare Service (NHS). Gli algoritmi non avevano accesso a questi dati, e le aziende sono state escluse dalla piattaforma dove le immagini venivano analizzate dai loro algoritmi.
L’accuratezza degli algoritmi di IA nell’identificare le malattie oculari diabetiche potenzialmente bisognose di intervento clinico è stata tra l’83,7 e il 98,7%. Per le malattie oculari diabetiche da moderate a gravi l’accuratezza è stata tra il 96,7 e il 99,8%, e per le malattie oculari diabetiche più avanzate (proliferative) che minacciano la vista è stata tra il 95,8 e il 99,5%. Questi dati sono paragonabili a uno studio precedente, in cui l’accuratezza degli operatori nell’analizzare le immagini per questi livelli di malattia oculare diabetica variava tra il 75 e il 98%, dimostrando che gli algoritmi di IA hanno ottenuto prestazioni uguali o addirittura superiori a quelle di un essere umano in una frazione del tempo.
Oggi, la selezione degli algoritmi di IA del NHS si concentra sull’efficacia in termini di costi e sulla corrispondenza con le valutazioni umane. Tuttavia, ci sono sfide più ampie, come la necessità di un’infrastruttura digitale solida, e di test rigorosi degli algoritmi commerciali. In passato, il software è stato raramente valutato per l’equità algoritmica tra popolazioni ed etnie diverse, e questo ha portato a disparità come nel caso della minore accuratezza dei pulsossimetri utilizzati per misurare i livelli di saturazione dell’ossigeno nelle persone con pelle più scura, e questo ha spinto il governo a rivedere l’equità dei dispositivi medici, compresa l’IA.
La professoressa Alicja Rudnicka, della School of Health and Medical Sciences della City St Georges University of London, che ha coordinato lo studio, ha dichiarato: “La nostra piattaforma offre la prima valutazione equa, imparziale e trasparente dei sistemi di IA per la valutazione delle patologie oculari diabetiche gravi, e mostra come i sistemi di IA siano più accurati degli operatori e siano sicuri per l’uso nel National Healthcare Service con enormi set di dati e con diverse etnie e fasce d’età”.
Adnan Tufail del Moorfields Eye Hospital ha aggiunto: “Nel Regno Unito ci sono più di 4 milioni di pazienti diabetici che hanno bisogno di fare controlli oculistici regolari. La nostra ricerca apre la strada a un’adozione più sicura e consapevole dei sistemi di IA per le applicazioni sanitarie grazie ai test che ci hanno permesso di dimostrare la loro affidabilità per individuare le malattie oculari diabetiche che minacciano la vista prima di una potenziale diffusione su larga scala”.
La piattaforma ha anche rilevato la percentuale di casi sani erroneamente segnalati come affetti da malattia oculare diabetica da ciascun algoritmo, e ha dimostrato che gli algoritmi hanno funzionato bene in modo coerente tra i diversi gruppi etnici. È la prima volta che questo aspetto viene valutato.
La professoressa Rudnicka ha concluso: “Questo lavoro apre la strada all’espansione dell’utilizzo della nostra piattaforma da livello locale a livello nazionale. Il nostro obiettivo è quello di fornire un’infrastruttura centrale di AI che ospita gli algoritmi approvati, e consente ai centri di screening di caricare le immagini della retina per l’analisi. I risultati generati dall’AI vengono inseriti direttamente nella cartella clinica elettronica del paziente, e questo elimina la necessità di duplicare l’infrastruttura, riduce i costi di installazione e garantisce un servizio coerente ed equo a livello nazionale”.
La piattaforma offre vantaggi a tutti: fornisce alle aziende un feedback indipendente per migliorare la tecnologia, ai trust del National Healthcare Service (NHS) di scegliere gli strumenti di IA più adatti alle proprie esigenze, rendendo più efficienti le attività ripetitive e consentendo agli operatori di concentrarsi sulle malattie ad alto rischio e di utilizzare nuovi tipi di scansioni retiniche, e ai pazienti di ricevere una diagnosi più rapida e cure ottimali.
Questo approccio unico e trasparente potrebbe diventare il modello di riferimento per la valutazione degli strumenti di IA in altre malattie croniche come il cancro e le malattie cardiache, per rafforzare la fiducia del pubblico e accelerare l’adozione sicura ed equa dell’IA nel settore sanitario.
Lo studio è stato finanziato dalla NHS Transformation Directorate, dalla Health Foundation e dal Wellcome Trust, e pubblicato su The Lancet Digital Health.
