le 16/07/2019

Il est aujourd’hui possible grâce aux avancées de la data science d’améliorer les services de santé :

  • Aide au diagnostic
  • Optimisation des traitements médicamenteux
  • Prédiction des rechutes patients
  • Prédiction du taux de remplissage
  • Évaluation du risque du diagnostique erroné

Ces méthodes innovantes sont bénéfiques : une meilleure qualité des soins, un gain de temps et une réduction des coûts pour les professionnels de santé et ainsi un meilleur déploiement des ressources dans le système de santé.

 

Les acteurs de la santé n’ont pas droit à l’erreur. Ils travaillent dans des environnements stressants et ont affaire à un grand volume de données à traiter (compte rendus, relevés d’analyses, radiographies, tâches administratives). Ces activités sont chronophages et ont un coût élevé pour les structures médicales, voire peuvent amener à des erreurs de diagnostic.

La data science peut apporter des solutions efficaces afin de réduire les temps de passage en revue des différents documents d’un dossier patient :

  • lecture automatisée de résultats d’analyses biologiques
  • suggestion de diagnostic, de prescription ou d’examens complémentaires à programmer
  • analyse d’images et détection de pathologies par réseau de neurones convolutifs

Ces dernières années, l’imagerie par résonance magnétique (IRM) s’est démocratisée, du fait du niveau de détails discernables sur ces images. Plus particulièrement, l’imagerie en tenseur de diffusion permet de cartographier in vivo les microstructures et l’organisation des tissus du cerveau. Cette modalité offre la possibilité de détecter et de quantifier des anomalies de la substance blanche (non visibles en imagerie conventionnelle), et ainsi de détecter des pathologies cérébrales variées. Elle est fréquemment intégrée aux protocoles IRM d’exploration du cerveau, et plus récemment de la moelle épinière.

 

Le tenseur de diffusion est un objet mathématique permettant de mesurer l’orientation des faisceaux de substance blanche dans l’espace (ou anisotropie), reflet de leur organisation micro – structurelle. Cet objet mathématique se prête particulièrement à la représentation de la substance blanche du cerveau, organisée en faisceaux.

La substance blanche est le principal siège des phénomènes explicatifs des maladies neurodégénératives.

 

Prenons un exemple de cas d’usage réaliste, auquel la Data Science est susceptible d’aider au diagnostic : comment détecter un patient comme étant atteint d’une maladie neurodégénérative parmi 3 maladies potentielles ?

Cette question est un problème de classification, où pour une image donnée (l’image du patient X) on souhaite prédire le type de la maladie (variable Y).

 

Parmi les algorithmes de classification, on retrouve : la machine à vecteur de support (SVM), les réseaux de neurones, la classification naïve Bayesienne, la régression logistique. Ces algorithmes vont chercher à séparer les groupes de patients par des hyperplans en fonction de leurs caractéristiques (ici les valeurs des pixels de l’image des tenseurs de diffusion), afin de les regrouper par pathologie.

 

Dans le contexte de l’imagerie médicale, les données ont une grande quantité de variables par rapport au nombre d’observations, ce qui génère de l’instabilité computationnelle. Pour éviter cela, on utilise des méthodes de régularisation.

 

Lors de l’apprentissage d’un modèle, la régularisation permet d’imposer une contrainte pour favoriser les modèles simples au détriment des modèles complexes. Autrement dit, cela permet de réduire l’erreur de type variance et d’améliorer la généralisation de la solution. Il existe de nombreuses formes de régularisation, qui dépendent de l’objectif recherché et des hypothèses fixées sur le problème. Par exemple, une régularisation de type lasso favorisera la « sparsité » de la représentation en poussant l’algorithme à ne prendre en compte qu’une petite partie des données, ignorant les autres.

La régularisation de type lasso permet aussi de considérer des contraintes de groupes : ceci est utile quand on a certains a priori. Dans le cas du cerveau, on peut utiliser des contraintes de structure qui prennent en compte l’anatomie.

Ces types de régulations aident notamment à diminuer les temps de calculs, et à obtenir des résultats plus facilement interprétables car seules les variables les plus explicatives sont prises en compte.

 

Cet exemple montre toute la puissance de l’IA, et le potentiel d’accélération des processus qu’il promet.

L’IA au service de la santé, c’est aujourd’hui !

 

par Gisela Lechuga