Thèse d'exercice
Développement et preuve de concept d'un outil informatique de codage des évènements indésirables survenus dans le contexte des essais cliniques, utilisant la technologie du text mining et une ontologie sémiologique.
FrançaisConsulter le texte intégral (format PDF)
Le cahier d’observation est le moyen permettant de collecter les données patient lors d’une étude clinique. Parmi toutes les données saisies par le médecin investigateur se trouvent des champs texte libre présents notamment dans la description des évènements indésirables. Ces champs texte contiennent des concepts médicaux importants qu’il est nécessaire d’analyser pour établir le profil de tolérance du candidat médicament. Pour permettre cette étape d’analyse, il est nécessaire de codifier ces concepts médicaux grâce à un dictionnaire international de référence : Le MedDRA. Cette activité, très partiellement automatisable à ce jour, demande au codeur humain un effort constant pour maintenir homogénéité et cohérence du codage dans la durée, mais également avec les autres codeurs.
L’objectif de ces travaux a été de programmer un prototype d’outil permettant l’extraction automatique des codes en provenance des descriptions d’évènements indésirables patient. Ce prototype utilise une technologie de text mining open source (Apache lucène) et s’appuie également sur les données issues d’une ontologie sémiologique afin de faciliter l’identification des termes à coder.
Les performances text mining de l’outil ont été comparées dans un premier temps à une base de données de référence, codée par l’humain, et également avec un outil du marché. Dans ce cadre, nous montrons que nous obtenons des résultats acceptables.
Dans un second temps nous avons étudié l’effet de l’ontologie sémiologique additionné à celui du text mining via des jeux d’essai ainsi que sur une base de données codée. Les résultats montrent que dans la version actuelle, seule une faible quantité d’évènements indésirables obtient un codage correct mais que des évolutions pourront permettre l’amélioration de ces résultats.
Ce travail tend vers la conception d’un outil de codage des données médicales offrant rapidité et homogénéité afin d’assister l’humain dans son travail.
Mots-clés libres : études cliniques, évènements indésirables, MedDRA, text mining, ontologie sémiologique, apache lucène.
Menu :
Annexe :
Université de Poitiers - 15, rue de l'Hôtel Dieu - 86034 POITIERS Cedex - France - Tél : (33) (0)5 49 45 30 00 - Fax : (33) (0)5 49 45 30 50
petille@support.univ-poitiers.fr -
Crédits et mentions légales