Les statistiques pour les étudiants en médecine

Les statistiques sont souvent réputées complexes et éloignées de la pratique clinique quotidienne. Légitimement, en tant que médecin ou étudiant, on peut se demander s’il est utile d’apprendre les biostatistiques et à réaliser les analyses statistiques seul.

Apprendre les statistiques ?

Il est tout à fait possible d’apprendre les bases des statistiques sans avoir de solides connaissances en mathématiques. L’important étant de bien comprendre les notions fondamentales que sont la définition des hypothèses nulles et alternatives, la p-value, les intervalles de confiance, et de savoir interpréter correctement les résultats des analyses. En bref, on peut aborder le versant théorique des statistique de manière simple et intuitive.

Faire les analyses statistiques soi-même ?

Le versant pratique des statistiques est représenté par la réalisation d’analyses statistiques. Les statisticiens sont des personnes très sollicitées, et ne peuvent répondre à toutes les demandes d’analyses statistiques en un temps correct. Et de nombreux allers-retours sont nécessaires pour aboutir à un résultat. Il est donc fréquent que l’analyse prenne plusieurs mois. Pour accélérer le processus, il peut être tentant de faire ses analyses statistiques seuls.

On peut par exemple apprendre par cœur les tests adaptés pour telle ou telle situation (exemple : test T de Student pour comparer des moyennes entre 2 groupes, test du Chi2 pour comparer des proportions, etc), ou plus simplement se référer à des tables disponibles sur internet. Cependant, il faut bien comprendre qu’effectuer des analyses statistiques nécessite une grande rigueur. Il est fréquent d’obtenir un résultat faux si les bonnes pratiques ne sont pas respectées. On peut penser notamment aux conditions de validité des tests statistiques ou des régressions, qu’on peut facilement oublier de vérifier lorsqu’on n’effectue pas d’analyse statistique au quotidien.

Dans beaucoup de disciplines, la théorie apprise à un moment donné nécessite d’être pratiquée régulièrement, sous peine d’être oublié. C’est encore plus vrai pour les analyses statistiques, qui sont d’une très grande technicité, et qui nécessitent l’apprentissage d’utilisation de logiciels complexes avec un langage de programmation propre.

Quel logiciel apprendre ? R, SAS ou Stata ?

Si vous vous destinez à une carrière dans la recherche médicale, il semble important d’avoir des bases théoriques solides en statistiques, mais, ne vous leurrez pas : à moins d’abandonner la pratique clinique pour vous consacrer à la recherche à plein temps, ne comptez pas réaliser de temps en temps vos analyses statistiques avec un logiciel de statistique professionnel, comme R, SAS ou Stata. C’est une approche qui n’est pas efficiente : l’investissement en temps est énorme et perdu quelques mois plus tard. Et cela, sans parler des erreurs, soit de procédure, soit de code, qui ne seront pas décelées.
Je déconseillerais donc fortement à un jeune médecin qui ne souhaite pas faire des statistiques son métier, d’apprendre à programmer sur ce type de logiciels.

Je peux vous donner l’exemple d’une de mes internes pédiatre qui a suivi un master 2 de biostatistiques l’an dernier. Elle a appris à utiliser R, à effectuer du data management et des régressions linéaires simples, et a ensuite soumis son article. Les reviewers lui demandent de réaliser des analyses complémentaires. Aujourd’hui, elle ne comprend plus son code, et a besoin d’aide d’un statisticien pour avancer.

Les logiciels statistiques avec une interface graphique

Certains logiciels sont plus simples d’utilisation que R, SAS ou Stata. Le plus célèbre étant SPSS, qui dispose de menus déroulants permettant de choisir les tests appropriés. Il est en effet séduisant d’utiliser ce type de logiciels, car ils fournissent des résultats, sans avoir à coder. La contrepartie, qui est un inconvénient majeur, est que même si on se trompe de test, on obtiendra un résultat. Et il n’y a en général pas de manière de vérifier les conditions de validité. Autrement dit, ils ne remplacent pas la rigueur d’une analyse statistique. Il est donc obligatoire d’avoir des très bonnes notions de statistiques, pas trop anciennes.

Pvalue.io, le logiciel d’analyse statistique adapté à la recherche scientifique médicale

Un logiciel fait exception dans le milieu des logiciels de statistiques : pvalue.io, qui se destine aux analyses statistiques pour les médecins et autres professionnels de santé qui souhaitent publier. Il ne nécessite pas de connaître les statistiques, mais d’avoir une ou des hypothèses de recherche. Ce logiciel permet de réaliser en quelques clics des analyses univariées, multivariées : régressions linéaires, logistiques et de survie. Il est très apprécié des médecins par sa simplicité et son efficacité. pvalue.io fournit les résultats dans un fichier word, et permet l’export des graphiques dans les formats demandés par les journaux médicaux (TIFF, EPS, etc). Un fichier de test vous permet de l’essayer.

Aucun commentaire

Poster un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.