Comment réaliser une analyse multivariée ?

Plusieurs étapes sont nécessaires pour réaliser une analyse multivariée (ou plus exactement multivariable) :

  1. Formaliser l’hypothèse de recherche
    • Choisir la variable à expliquer Y
    • Choisir les variables explicatives X
  2. Déterminer les variables d’ajustement
  3. Vérifier que les conditions d’application sont réunies
  4. Vérifier la robustesse du modèle

Formaliser l’hypothèse de recherche

Toute recherche nécessite de poser des hypothèses. Ce peut être par exemple : « notre nouveau protocole de service permet-il de réduire le nombre de réhospitalisations ? » Parfois cette hypothèse est facile à expliciter, parfois, elle est plus complexe.

pvalue.io permet de vous aider à la formaliser, en posant l’hypothèse suivante : « X a une influence sur Y ». A votre charge de déterminer le X et le Y pertinent. Dans l’exemple sur les réhospitalisations, X serait : le protocole de service (codé par exemple en 2 classes : « ancien » et « nouveau »), et Y la présence d’une réhospitalisation à 30 jours (codé par exemple en oui/non ou 0/1). L’hypothèse serait donc : « Le protocole de service a une influence sur la réhospitalisation à 30 jours ».

Cependant, il existe de nombreux biais possibles, et il est donc souvent nécessaire d’ajuster sur les facteurs de confusion. Ces facteurs de confusion sont les variables liées à Y. Ainsi, pvalue.io vous demande de sélectionner les autres variables connues ou supposées liées à Y.

Déterminer les variables d’ajustement

Nous appellerons ici les variables d’ajustement, les variables qui sont liées à Y statistiquement (c’est-à-dire avec une p-value inférieure à un seuil), mais qui ne sont pas connues ou supposées liées à Y. Typiquement, nous n’avons pas besoin d’obtenir l’estimation de l’influence de ces variables. Le logiciel de statistiques pvalue.io sélectionne ces variables automatiquement, et vous propose de désélectionner celles qui ne sont pas pertinentes.

Vérifier que les conditions d’application sont réunies

Cette étape de vérification est indispensable et fait appel à des mécanismes de détection automatique (par exemple la vérification de la normalité), ou non (par exemple la vérification de la linéarité de X en fonction de Y, ou des risques proportionnels).

Vérifier la robustesse du modèle

Après une analyse multivariée, il est nécessaire de vérifier la robustesse du modèle en supprimant les variables les plus influentes du modèle statistique. Cette procédure n’est pas encore implémentée.

DÉMARRER L’ANALYSE

Aucun commentaire

Poster un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.