Analyses descriptives, explicatives et prédictives

Une des typologies des analyses statistiques repose sur leur objectif :

  • Les analyses descriptives, pour décrire les variables, soit individuellement (statistiques descriptives), soit en les croisant avec une autre variables (en réalisant des analyses univariables)
  • Les analyses explicatives, pour déterminer l’influence d’une ou plusieurs variables sur une autre (par exemple à l’aide d’un Odds Ratio)
  • Les analyses prédictives, pour classer les patients en deux groupes à partir de leurs caractéristiques

pvalue.io utilise cette typologie pour décrire le type d’analyse à mettre en oeuvre.

Les analyses descriptives

Les analyses descriptives font appel aux analyses descriptives d’une seule variable ou aux analyses univariables. Ces analyses sont utiles pour repérer rapidement des données potentiellement aberrantes (notamment des données extrêmes ou des outliers). On affiche les résultats sous forme de tableaux et de graphiques. Les analyses descriptives sont fondamentales pour réaliser la Table 1 de tous les articles scientifiques médicaux (analyse univariable de toutes les caractéristiques des patients en fonction de l’exposition/traitement).

Les analyses explicatives

Les analyses explicatives font appel à des modèles statistiques complexes comme les régressions. Ces analyses permettent de déterminer la force de l’association entre une variable à expliquer (Y) et une ou plusieurs variables explicatives (X). Elles permettent aussi de tester la signifiance statistique de cette association (sous forme d’une p-value). La force d’association peut être :

  • Un Odds Ratio pour les régressions logistiques
  • UnHazard Ratio pour les modèles de Cox
  • Un Estimate ou un coefficient pour les régressions linéaires

Lorsqu’il n’y a qu’une seule variable explicative, alors l’analyse est univariable, et elle est multivariable dans le cas contraire.
Dans ce type d’analyse, il est important que le résultat de la modélisation soit simple à interpréter, c’est pourquoi pvalue.io préfère proposer de découper une variable explicative dont l’hypothèse de linéarité n’est pas respectée plutôt que de transformer cette variable en spline naturelle. C’est aussi pourquoi les coefficients des variables d’ajustement ne sont pas affichées.

Les analyses prédictives

L’objectif d’une analyse prédictive dans pvalue.io est d’élaborer un modèle de prédiction, comme un score. Ces modèles visent à classer un patient donné suivant ses caractéristiques démographiques, cliniques ou paracliniques.
Avec une analyse prédictive, nous obtenons la probabilité que le patient soit classé dans un groupe plutôt que l’autre. Ce type d’analyse permet de répondre par exemple à la question : quelle est la probabilité que tel patient, 68 ans, fumeur, asymptomatique, dernière vaccination réalisée il y a 3 mois ait un covid long ?

Les modèles de prédiction reposent des modèles multivariables (régression logistique multiple). Contrairement aux analyses explicatives pour lesquelles les résultats doivent être simples à interpréter, pour les analyses prédictives, ce qui importe surtout c’est la capacité à bien classer les patients (bonne discrimination : aire sous la courbe élevée, et bonne calibration : la probabilité qu’ils soient classés dans le bon groupe est correct). C’est pourquoi pvalue.io propose de transformer en spline naturelle les variables dont l’hypothèse de log-linéarité n’est pas respectée : même si l’interprétation est délicate, la prédiction est plus performante.

Une fois ce modèle élaboré, il est nécessaire de le valider en estimant les performances du modèle sur d’autres patients que ceux qui ont servi à l’élaborer.

DÉMARRER L’ANALYSE

Aucun commentaire

Poster un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.