Analyses univariables et multivariables

  • On peut généralement distinguer trois types d’analyses statistiques : les statistiques descriptives d’une seule variable, les analyses univariables (souvent nommées analyses univariées) et les analyses multivariables (à tort parfois nommées analyses multivariées)
  • Les statistiques descriptives d’une seule variable permettent de décrire les données, et sont utiles pour y détecter des problèmes
  • Les analyses univariables et multivariables permettent des comparaisons statistiques (obtention d’une p-value), et seules les analyses multivariables permettent de prendre en compte les facteurs de confusion

NB : Les termes univariés et multivariés ne sont plus recommandés[1] mais en pratique encore largement utilisés.

Statistiques descriptives d’une seule variable

Avant de démarrer une analyse statistique, il est nécessaire de bien connaître ses données. Quelle est la proportion de femmes ? Quel âge a le patient le plus âgé ?
Les statistiques descriptives d’une seule variable répondent à ces questions, et ont comme intérêt :

  • D’identifier des outliers, c’est-à-dire des patients ayant des valeurs extrêmes.
  • De vérifier la distribution des données : sont-elles distribuées suivant une loi normale ?

Imaginez que dans la colonne âge, un patient soit âgé de 182 ans; il est probable (à moins que vous fassiez une étude sur les jedi), qu’il y a eu une erreur quelque part.
Il va donc falloir retrouver l’âge réel de ce patient ou lui attribuer une valeur manquante. Si cette erreur n’est pas détectée et corrigée, alors les analyses statistiques prenant en compte l’âge seront complètement fausses.

Analyser les statistiques descriptives d’une seule variable est donc un préalable à toute analyse statistique, qu’elle soit univariable ou multivariable.

Les graphiques font partie intégrante des statistiques descriptives car elles permettent de visualiser rapidement la structure de vos données.

Une fois que vous avez sélectionné les variables que vous voulez décrire, pvalue.io crée automatiquement un tableau et un graphique.
Si la variable est quantitative, le tableau comporte moyenne, écart-type, médiane, 25ème et 75ème percentile, minimum et maximum; le graphique représente alors la distribution de la variable sous la forme d’un histogramme.
Si la variable est qualitative, le tableau donne l’effectif de chaque classe; le graphique représente la répartition dans chaque classe sous la forme d’un graphique en barre.

Attention, il ne faut pas confondre le terme « Statistiques descriptives d’une seule variable » et l’analyse descriptive. Le terme « analyse descriptive » est lié à l’objectif de l’analyse (décrire des données), mais pas à la manière dont on les analyse (en les croisant avec d’autres données (analyse univariable) ou non).

Analyses univariables

Les analyses univariables permettent de préciser la relation entre deux variables : la pression artérielle (variable 1) est-elle différente selon le sexe (variable 2) ? La proportion de fumeurs est-elle différente selon la couleur des yeux ? etc.
Le but des analyses univariables est de répondre à la question : la différence observée entre mes patients est-elle une vraie différence ou est-elle due au hasard ? Dans pvalue.io, les analyses univariables reposent sur des tests statistiques, permettant d’obtenir une p-value (qui est la probabilité que la différence observée soit due au hasard). Le choix de ces tests dépend des variables à comparer.

pvalue.io réalisera automatiquement ces tests dans un tableau et générera :

  • Une boîtes à moustache si vous croisez une variable numérique avec une variable qualitative
  • Un diagramme en barre si vous croisez deux variables qualitatives
  • Une courbe de survie si vous réalisez des analyses de survie
  • Un nuage de point si vous croisez deux variables numériques, ainsi que le lien linéaire calculé

Attention, les analyses univariables ne permettent pas de prendre en compte les facteurs de confusion. Prenons un échantillon dans lequel les femmes sont plus jeunes que les hommes. On veut savoir si le traitement a un effet différent sur la survie selon le sexe. Si on trouve un p < 0,05, est-ce le fait du sexe ou le fait de l’âge ?
Seul un essai randomisé permet de nous garantir une comparabilité des caractéristiques des patients entre les groupes. Dans ce schéma d’étude et seulement celui-là, les analyses univariables seules sont suffisantes. En dehors d’un essai randomisé, il est nécessaire d’utiliser des variables d’ajustement. C’est le but des analyses multivariables.

A savoir : La fameuse table 1 dans les articles médicaux est le plus souvent issue d’une analyse univariable, et décrit toutes les caractéristiques du patient à l’inclusion en fonction de la variable qu’on veut mettre en avant.

Analyses multivariables

Les analyses multivariables permettent d’ajouter des variables d’ajustement. Elles sont donc recommandées lorsqu’on cherche à établir un lien statistique entre plusieurs variables. Les analyses multivariables font appel à des méthodes statistiques plus sophistiquées que les analyses univariables, et sont rarement disponibles dans les logiciels à destination des non statisticiens.

Dans l’exemple précédent, l’ajustement sur l’âge permet de conclure : si les hommes et les femmes de mon échantillon avaient le même âge, alors l’effet du traitement serait (ou non) statistiquement significatif.

On réalise des analyses multivariées à l’aide de modèles statistiques. Les plus souvent mis en œuvre en médecine sont les régressions linéaires et logistiques, ainsi que les modèles de Cox.

Les modèles statistiques permettent d’obtenir des petits p. Ils ont un intérêt supplémentaire non négligeable : ils permettent de mesurer à quel point un facteur agit sur la variable d’intérêt. Ces mesures d’association sont :

  • Les Odds Ratio pour les régressions logistiques
  • Les Hazard Ratio pour les modèles de Cox
  • Les Estimates ou les coefficients pour les régressions linéaires

La p-value renseigne sur la significativité statistique, les mesures d’association quantifient le lien entre deux variables.

La réalisation de modèles statistiques présuppose qu’un certain nombre de conditions de validité soient respectées.

DÉMARRER L’ANALYSE

[1] 1. Tsai AC. Achieving Consensus on Terminology Describing Multivariable Analyses. Am J Public Health. 2013;103(6):e1. doi:10.2105/AJPH.2013.301234

13 Commentaires
  • Adrien
    Posté à 18:28h, 03 février Répondre

    j’ai pas bien compris, lorsqu’on travaille sur deux variable, est-ce de l’analyse univariée? Ne dis-t-on pas bivariée?

    • Kevin
      Posté à 14:02h, 19 mars Répondre

      Bonjour, c’est une très bonne question.
      On peut en effet parler d’analyses bivariées lorsqu’on croise deux variables, mais le test statistique réalisé est alors appelé un test univarié (par contraste avec un test multivarié, la dénomination « tests bivariés » n’existe pas). Afin de simplifier, nous avons fait le choix de parler d’analyses univariées lorsqu’on réalise un test univarié.

  • Saïd Nourdine Samidine
    Posté à 08:27h, 25 mai Répondre

    Très bonne initiative .Un grand merci au concepteur .

  • Emmanuelle Albugues
    Posté à 17:03h, 01 août Répondre

    Bonjour, comment faire pour comparer en univarié 2 sous groupes d’un tableau de recueil grâce à p-value ?
    Merci d’avance

    Emmanuelle

  • emmanuel kapend
    Posté à 09:47h, 08 mars Répondre

    bonjour chers tous. j’ai fait mes analyses des mes donnees pour mon memoire de DEA, apres avoir realisé les analyse univariées, je me rend compte que je ne possede que le petit p et non les odds ratio que faire dans ce cas svp.
    merci d’avance

    • Kevin
      Posté à 12:12h, 09 mars Répondre

      Bonjour, tout à fait, il suffit de choisir : analyse multivariée ou explicative au lieu d’analyse univariée

  • Guehi
    Posté à 22:11h, 09 mars Répondre

    Merci : j’apprends à analyser les articles de recherche selon la méthode IMDR et vous m’avez permis d’eclaircir ses deux notions.

  • Innocent
    Posté à 09:45h, 08 juin Répondre

    très bonne initiative..

  • Raphaël Yaradouno
    Posté à 15:15h, 09 décembre Répondre

    Merci et merci d’avance !
    Bonsoir Dr. mon étude est une CAP.
    1-j’ai croisé le niveau de connaissance avec le niveau de pratique des parents en matière de santé bucco-dentaire de leur enfant, puis-je appeler cela analyse univariée ?
    2- j’ai croisé le niveau d’instruction des parents avec leur niveau de connaissance, d’attitude et de pratique (j’ai obtenu 3 p value). Est-ce une analyse univariée ou multivariée ?

    • Kevin
      Posté à 09:13h, 07 février Répondre

      1- oui, tout à fait
      2- ça dépend si vous avez calculé indépendamment les pvalue

  • Ignace
    Posté à 08:56h, 07 février Répondre

    Est-ce qu’une variable qui, au départ n’était pas statistiquement associée à ma variable dépendante peut se retrouver dans le modèle de régression logistique avec une p inférieure 0,05. .
    C’est dire qu’en analyse bivarié il n’y a pas d’association mais en multivariée elle est associée .

    • Kevin
      Posté à 09:12h, 07 février Répondre

      Bonjour, oui, c’est tout à fait possible. L’ajustement modifie les relations entre la variable à expliquer et les variables explicatives.

Poster un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.