Uppsala Monitoring Center Report n. 82 – Machine learning e reazioni avverse da farmaco

L’Uppsala Monitoring Center, autorità incontrastata a livello Europeo nell’ambito della Farmacovigilanza, pubblica nel suo Report n.82 un interessante articolo che ci spiega cosa hanno in comune il processamento del linguaggio, lo “spazio”, e l’analisi dei segnali di farmacovigilanza.

 

 

 

 

 

Come si può capire se due segnalazioni di eventi avversi da farmaco sono in realtà un duplicato, in quanto riferite entrambe ad un singolo paziente ed una singola reazione?
Di fatto, due individui che segnalano una stessa reazione avversa da farmaco spesso utilizzano termini diversi per trasmettere lo stesso messaggio, basti pensare ad esempio a sinonimi quali “innalzamento della pressione arteriosa” da una parte e “ipertensione” dall’altra. Per quanto possano essere entrambe definizioni appropriate, esse generano problemi nel momento in cui è necessario utilizzare dei software per identificare eventuali duplicati all’interno dei database di farmacovigilanza, che altrimenti potrebbero alterare le statistiche rilevanti, in certi casi in maniera anche molto significativa.

Per affrontare questo problema, i data scientists dell’Uppsala Monitoring Center (UMC) hanno scovato un parallelismo con la disciplina del Natural Language Processing, la quale, tra le altre cose, ha lo scopo di ottenere una rappresentazione delle parole anzitutto attraverso il loro significato, per rispondere a domande tipo: “Su che base possiamo dire che due frasi sono simili pur utilizzando parole diverse?”

Attraverso una rappresentazione numerica dei vocaboli ammessi nelle segnalazioni da evento avverso (cosiddetti codici medDRA) e l’analisi della loro “distrubuzione semantica” (che sfrutta tecniche di machine learning) è stato possibile per ciascun termine generare una lista di vocaboli “simili per significato”, dando la possibilità di restringere enormemente il campo delle possibili segnalazioni-duplicato, riducendo in ultima analisi la quantità di segnalazioni che devono essere ricontrollate “a mano” da un “umano” esperto. Dovendo l’UMC gestire un database di proporzioni “continentali”, con una numerosità intorno ai 17 milioni di casi, si capisce come questo dettaglio possa migliorare significativamente la qualità del servizio, a beneficio di tutti i sistemi sanitari Europei e non solo.

Quali sono, ad esempio, i 5 vocaboli più vicini a “ipertensione“? 1.Incremento pressione arteriosa sistolica; 2. Incremento pressione arteriosa; 3. Fluttuazione della pressione arteriosa; 4. Incremento pressiona arteriosa diastolica; 5. Pressione arteriosa anomala.

Reazione anafilattica“? 1. Shock anafilattico 2. Reazione anafilattoide 3. Edema laringeo 4. Broncospasmo 5. Ipersensibilità Tipo 1

Fluoxetina“? 1. Bupropione 2. Sertralina 3. Venlafaxina 4. Paroxetina 5. Buspirone

Infliximab“? 1. Certolizumab pegol 2. Golimumab 3. Vedolizumab 4. Tocilizumab 5. Abatacept

Questo “spazio semantico” rappresenta un campo tutto da esplorare nell’ambito della farmacovigilanza, ed porterà senz’altro ad una trasformazione di questa disciplina, favorendo un avanzamento del sapere, e quindi, in ultima analisi, della sicurezza dei farmaci e del benessere delle persone.

Per una descrizione più dettagliata di rimanda all’articolo originale, intitolato “Found in space – New method reveals related drug and reaction terms” presente nel Report n.82 dell’Uppsala Monitoring Center, consultabile gratuitamente qui.

LinkedIn
Share
Instagram
WhatsApp