Régressions logistiques | pvalue.io
15811
post-template-default,single,single-post,postid-15811,single-format-standard,cookies-not-set,ajax_fade,page_not_loaded,,qode-title-hidden,transparent_content,qode-theme-ver-17.2,qode-theme-bridge,disabled_footer_top,qode_header_in_grid,wpb-js-composer js-comp-ver-5.4.5,vc_responsive

Régressions logistiques

  • Lorsque la variable à expliquer est binaire et non censurée, le modèle statistique adapté est la régression logistique;
  • Lorsqu’il n’existe qu’une seule variable explicative et que celle-ci est qualitative, la régression logistique donne le même résultat qu’un test du Chi2;
Dans un effort de simplification, nous appellerons Y la variable que l’on souhaite expliquer par des facteurs X. (Faites appel à vos lointains souvenirs : Y = aX +b)
Si par exemple on souhaite expliquer la probabilité de naître du sexe masculin en fonction du régime alimentaire, Y est le sexe masculin, et X le régime alimentaire)

A quoi ça sert

Comme pour la régression linéaire et les modèles statistiques en général, la régression logistique permet réaliser des analyses multivariées, c’est à dire de prendre en compte les facteurs de confusion, contrairement aux tests répandus en médecine (de Student, du Khi2, de Mc Nemmar, etc); ces derniers permettant de réaliser une comparaison de seulement 2 variables entre elles.
Or, il est très fréquent de devoir prendre en compte les facteurs de confusion. Et dans ce cas, un test univarié n’est pas adapté.

Comment réaliser des régressions logistiques avec pvalue.io

La réalisation de régressions logistiques ne devrait vous poser aucun problème avec pvalue.io :

  1. Sélectionnez la variable que vous souhaitez expliquer (Y) et les variables connues pour avoir une influence sur la variable à expliquer (X)
  2. Vérifiez qu’il n’y a pas d’erreurs d’après l’analyse descriptive (en regardant les graphiques et les tableaux générés)
  3. Désélectionnez les facteurs présentant un lien statistique avec Y qui ont été automatiquement choisis par pvalue.io mais qui n’ont pas de sens clinique
  4. Transformez les variables qui ne sont pas liées linéairement à la variable à expliquer
  5. Coupez les variables qui ne sont pas liées linéairement à la variable à expliquer

Interprétation des résultats

Par défaut, les logiciels de statistique fournissent pour chaque variable X incluse dans le modèle, un coefficient, l’intervalle de confiance de ce coefficient et un petit p.
Le coefficient et son intervalle de confiance sont compris entre -Inf et + Inf.
Il est d’usage toutefois de présenter non pas le coefficient, mais plutôt son exponentielle; cette valeur se trouve alors bornée entre 0 et +Inf.

On peut montrer mathématiquement que l’exponentielle du coefficient lorsque la variable X est catégorielle est l’odds ratio.

Variables qualitatives

Si Y peut prendre deux valeurs : 0 (la référence) et 1 et que X peut prendre deux valeurs : A et B :

Si l’odds ratio de B vs A est supérieur à 1, la proportion de Y=1 est plus élevé lorsque X=B que lorsque X=A.

Variables quantitatives

L’interprétation des résultats concernant les variables X quantitatives ne peut être appréhendée sans connaître les mathématiques sous-jacents à la régression logistique : il s’agit de l’odds ratio de la moyenne de X+1 vs la moyenne de X.
Pour faire simple, si l’odds ratio est inférieur à 1, la variable X réduit la probabilité que la variable Y=1.

Dans l’exemple suivant, nous voulions savoir si le sexe de l’enfant (0 = féminin) dépendait de la technique utilisée et de l’âge des parents.

Odds Ratio [IC] p p global
Age madame 1.00 [0.974, 1.03] 0.9
Age monsieur 0.995 [0.977, 1.01] 0.6
Technique ICSI vs FIV 0.836 [0.66, 1.06] 0.1 0.2
IMSI vs FIV 0.836 [0.64, 1.09] 0.2

Nous concluons ainsi :

  • Ni l’âge de la mère, ni l’âge du père n’ont une influence sur la probabilité que l’enfant soit de sexe masculin (p > 0.05);
  • La technique ICSI ne modifie pas statistiquement la probabilité que l’enfant soit de sexe masculin (p > 0.05) par rapport à la FIV
  • La technique IMSI ne modifie pas statistiquement la probabilité que l’enfant soit de sexe masculin (p > 0.05) par rapport à la FIV
  • Globalement, la technique utilisée n’a pas d’influence sur la probabilité que l’enfant soit de sexe masculin (p global > 0.05)
Aucun commentaire

Poster un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.