Régressions logistiques

  • Lorsque la variable à expliquer est binaire et non censurée, le modèle statistique adapté est la régression logistique;
  • Lorsqu’il n’existe qu’une seule variable explicative et que celle-ci est qualitative, la régression logistique donne un résultat similaire à un test du Chi2;
Dans un effort de simplification, nous appellerons Y la variable que l’on souhaite expliquer par des facteurs X. (Faites appel à vos lointains souvenirs : Y = aX +b)
Si par exemple on souhaite expliquer la probabilité de naître du sexe masculin en fonction du régime alimentaire, Y est le sexe masculin, et X le régime alimentaire)

A quoi sert une régression logistique

Comme pour la régression linéaire et les modèles statistiques en général, la régression logistique permet réaliser des analyses multivariables, c’est-à-dire de prendre en compte les facteurs de confusion, contrairement aux tests répandus en médecine (de Student, du Khi2, de Mc Nemmar, etc); ces derniers permettant de réaliser une comparaison de seulement 2 variables entre elles.
Or, il est très fréquent de devoir prendre en compte les facteurs de confusion. Et dans ce cas, un test univariable n’est pas adapté.

Comment réaliser des régressions logistiques avec pvalue.io

La réalisation de régressions logistiques ne devrait vous poser aucun problème avec pvalue.io :

  1. Choisissez de réaliser une analyse explicative
  2. Sélectionnez la variable que vous souhaitez expliquer (Y) et les variables connues pour avoir une influence sur la variable à expliquer (X)
  3. Vérifiez qu’il n’y a pas d’erreurs d’après l’analyse des statistiques descriptives de chaque variable (en observant les graphiques et les tableaux générés)
  4. Transformez les variables qui ne sont pas liées linéairement à la variable à expliquer

Interprétation des résultats

Par défaut, les logiciels de statistique fournissent pour chaque variable X incluse dans le modèle, un coefficient, l’intervalle de confiance de ce coefficient et un petit p.
Le coefficient et son intervalle de confiance sont compris entre -∞ et + ∞.
Il est d’usage toutefois de présenter non pas le coefficient, mais plutôt son exponentielle; cette valeur se trouve alors bornée entre 0 et +∞.

On peut montrer mathématiquement que l’exponentielle du coefficient lorsque la variable X est catégorielle est l’odds-ratio.

Variables qualitatives

Si Y peut prendre deux valeurs : 0 (la référence) et 1 et que X peut prendre deux valeurs : A et B :

Si l’odds ratio de B vs A est supérieur à 1, la proportion de Y=1 est plus élevé lorsque X=B que lorsque X=A.

Variables quantitatives

L’interprétation des résultats concernant les variables X quantitatives ne peut être appréhendée sans connaître les mathématiques sous-jacents à la régression logistique : il s’agit de l’odds ratio de la moyenne de X+1 vs la moyenne de X.
Pour faire simple, si l’odds ratio est inférieur à 1, la variable X réduit la probabilité que la variable Y=1.

Dans l’exemple suivant, nous voulions savoir si le sexe de l’enfant (0 = féminin) dépendait de la technique utilisée et de l’âge des parents.

Odds Ratio [IC]pp global
Age madame1.00 [0.974, 1.03]0.9
Age monsieur0.995 [0.977, 1.01]0.6
TechniqueICSI vs FIV0.836 [0.66, 1.06]0.10.2
IMSI vs FIV0.836 [0.64, 1.09]0.2

Nous concluons ainsi :

  • Ni l’âge de la mère, ni l’âge du père n’ont une influence sur la probabilité que l’enfant soit de sexe masculin (p > 0.05);
  • La technique ICSI ne modifie pas statistiquement la probabilité que l’enfant soit de sexe masculin (p > 0.05) par rapport à la FIV
  • La technique IMSI ne modifie pas statistiquement la probabilité que l’enfant soit de sexe masculin (p > 0.05) par rapport à la FIV
  • Globalement, la technique utilisée n’a pas d’influence sur la probabilité que l’enfant soit de sexe masculin (p global > 0.05)
2 Commentaires
  • gbané
    Posté à 09:55h, 12 juillet Répondre

    Parfait, c’est simple et très claire.

  • Tokpa Sompohi
    Posté à 03:50h, 23 janvier Répondre

    je commence à mieux comprendre.

Poster un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.