Comment effectuer une analyse multivariée lorsqu’on a un effectif trop faible

Il est parfois surprenant de ne pouvoir réaliser une analyse multivariée en raison d’un effectif trop faible alors que le fichier comporte plusieurs centaines d’observations (patients, sujets).

Cas des régressions linéaires

Pour les régressions linéaires, c’est-à dire-les analyses multivariées pour lesquelles la variable à expliquer est numérique, il est nécessaire avoir au moins 10 observations par variable explicative.
Petite subtilité, lorsque la variable explicative est catégorielle à N classes, elle compte comme N-1 variables. Pour exemple, prenons la variable catégorielle « satisfaction » comportant les 5 classes suivantes :

  • Pas du tout satisfait
  • Plutôt pas satisfait
  • Moyennement satisfait
  • Plutôt satisfait
  • Très satisfait

Lorsqu’on utilise cette variable dans un modèle statistique, elle est automatiquement recodée en 4 variables binaires, valant chacune 0 ou 1.

Satisfaction Très satisfait Plutôt satisfait Moyennement satisfait Plutôt pas satisfait
Très satisfait 1 0 0 0
Plutôt pas satisfait 0 1 0 0
Moyennement satisfait 0 0 1 0
Plutôt pas satisfait 0 0 0 1
Pas du tout satisfait 0 0 0 0
Astuce : si vous n’avez pas l’effectif suffisant, commencez par regrouper les classes des variables catégorielles.

Cas des régressions logistiques et des analyses de survie

Pour les régressions logistiques et pour les analyses de survie, c’est-à-dire lorsque la variable à expliquer est binaire, c’est un tout petit peu plus complexe. Il faut en effet qu’il y ait au moins 10 observations par variable, mais attention, ce n’est pas calculé sur l’effectif total, mais sur l’effectif pour lequel la variable à expliquer vaut 0 et pour lequel la variable à expliquer vaut 1.

Ainsi, si l’effectif est de 179 patients, répartis ainsi : 29 patients avec Y = 0 et 150 avec Y = 1, le nombre maximal de variables explicatives est de 2.

Aucun commentaire

Poster un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.