Statistique — variables et échelles de mesure

Statistique — variables et échelles de mesure

Avant d'analyser des données, il faut comprendre ce que l'on a mesuré. En statistique, toute caractéristique que l'on mesure est appelée variable, et chaque variable possède un type et une échelle de mesure qui déterminent les opérations et calculs autorisés. Dans cette page, nous apprendrons à distinguer les quatre échelles de mesure, les variables discrètes des variables continues, ainsi que les variables dépendantes, indépendantes et le lien de causalité.

Contexte et définitions de base

Une variable est une caractéristique pouvant prendre différentes valeurs selon les individus — par exemple la taille, le sexe, la note ou la couleur des yeux. Ce qui ne varie pas (constant pour tous) est appelé constante.

Les quatre échelles de mesure, de la plus simple à la plus élaborée :

  • Nominale (Nominal) — catégories sans ordre : sexe, pays de naissance, couleur. On peut seulement distinguer égal/différent et compter les effectifs.
  • Ordinale (Ordinal) — catégories ordonnées, mais les écarts entre niveaux ne sont pas égaux : classement de satisfaction (faible–moyen–élevé), rang dans une compétition.
  • Intervalle (Interval) — ordre et écarts égaux, mais zéro arbitraire : température en Celsius, année du calendrier. Les rapports n'ont pas de sens (\(20^\circ\) n'est pas « deux fois plus chaud » que \(10^\circ\)).
  • Rapport (Ratio) — comme l'intervalle mais avec un zéro absolu et réel : taille, poids, durée, revenu. Le rapport est ici significatif (\(8\) kg est deux fois plus lourd que \(4\) kg).

Discret vs continu : une variable discrète prend des valeurs séparées que l'on dénombre (nombre d'enfants, nombre de voitures), tandis qu'une variable continue prend n'importe quelle valeur dans un intervalle, et se mesure (taille, durée).

Rôle de la variable dans la recherche : la variable indépendante est le facteur que le chercheur modifie ou étudie (la variable « explicative »), et la variable dépendante est le résultat mesuré. Un lien causal signifie qu'un changement dans une variable provoque un changement dans l'autre — à distinguer d'une simple corrélation, qui peut résulter d'une variable intermédiaire (confondante).

Étapes de résolution

  1. Étape 1 — Demandez-vous ce que la variable mesure exactement : une catégorie (qualitative) ou une quantité (quantitative) ?
  2. Étape 2 — Si qualitative : vérifiez s'il existe un ordre entre les catégories. Pas d'ordre → nominale ; ordre existant → ordinale.
  3. Étape 3 — Si quantitative : vérifiez s'il existe un zéro absolu signifiant « rien ». Non → intervalle ; oui → rapport.
  4. Étape 4 — Pour classer discrète/continue : demandez-vous si on dénombre des valeurs séparées (discrète) ou si on mesure en continu (continue).
  5. Étape 5 — Pour identifier le rôle : le « facteur » que l'on manipule est la variable indépendante, le « résultat » mesuré est la variable dépendante.
  6. Étape 6 — Avant de conclure à une causalité, assurez-vous qu'aucune variable confondante ne peut expliquer le lien observé.

Exemples résolus

Exemple 1 : Identifier l'échelle de mesure

Énoncé : Un chercheur a relevé pour chaque participant : (a) le numéro de téléphone, (b) le grade de ceinture en judo (blanche, jaune, noire), (c) la température corporelle en degrés Celsius, (d) le poids en kg. Classifiez chacun selon son échelle de mesure.

Solution :

  1. (a) Le numéro de téléphone est un identifiant sans ordre ni quantité — échelle nominale.
  2. (b) Les grades de ceinture sont ordonnés clairement, mais sans écart quantitatif égal entre eux — échelle ordinale.
  3. (c) La température en Celsius : écarts égaux mais zéro arbitraire (\(0^\circ\) ne signifie pas « absence de chaleur ») — échelle intervalle.
  4. (d) Le poids : zéro absolu (\(0\) kg = absence de masse) et rapport significatif — échelle rapport.

Réponse : Nominale, ordinale, intervalle, rapport — dans l'ordre.

Exemple 2 : Discrète ou continue

Énoncé : Classifiez chaque variable comme discrète ou continue : (a) le nombre de messages envoyés par jour, (b) le temps de course sur 100 mètres en secondes, (c) le nombre de passagers dans un bus.

Solution :

  1. (a) Le nombre de messages est une valeur entière dénombrable, il n'existe pas « 3,5 messages » — variable discrète.
  2. (b) Le temps de course peut être mesuré avec n'importe quelle précision (\(11{,}43\) s, \(11{,}431\) s) — variable continue.
  3. (c) Le nombre de passagers se dénombre, toujours un nombre entier — variable discrète.

Réponse : Discrète, continue, discrète — dans l'ordre.

Exemple 3 : Variable dépendante et indépendante

Énoncé : Une étude examine si le nombre d'heures de sommeil la nuit influence la note obtenue à un examen le lendemain. Quelle est la variable indépendante et quelle est la variable dépendante ?

Solution :

  1. Demandons-nous quel est le facteur supposé influencer et quel est le résultat mesuré.
  2. Les heures de sommeil sont le facteur influençant — c'est donc la variable indépendante.
  3. La note à l'examen est le résultat mesuré en fonction du sommeil — c'est donc la variable dépendante.
  4. Aide-mémoire : la variable dépendante « dépend » de la variable indépendante, tout comme la note dépend des heures de sommeil.

Réponse : Variable indépendante : heures de sommeil. Variable dépendante : note à l'examen.

Exemple 4 : Lien causal ou variable confondante

Énoncé : On observe que les enfants ayant de plus grandes chaussures lisent mieux. La pointure cause-t-elle de meilleures performances en lecture ? Quelle est l'explication plausible ?

Solution :

  1. Il existe apparemment une corrélation positive entre la pointure et les compétences en lecture, mais cela n'implique pas de causalité.
  2. Cherchons une variable confondante qui explique les deux variables simultanément.
  3. L'âge est la variable confondante : les enfants plus âgés ont des chaussures plus grandes et lisent aussi mieux.
  4. Conclusion : il s'agit d'une corrélation apparente (spurieuse), et non d'un lien causal entre la pointure et la lecture.

Réponse : Pas de lien causal ; l'âge est la variable confondante qui explique la corrélation.

Exemple 5 : Opérations autorisées selon l'échelle

Énoncé : Un élève a calculé la « moyenne » des couleurs des yeux en les numérotant (bleu=1, vert=2, brun=3) et a obtenu 2,1. Ce calcul est-il valide ?

Solution :

  1. La couleur des yeux est une variable sur une échelle nominale — les chiffres ne sont que des étiquettes arbitraires.
  2. Sur une échelle nominale, la seule opération valide est le comptage d'effectifs (et la détermination du mode), non les calculs arithmétiques.
  3. Le calcul d'une moyenne nécessite au minimum une échelle intervalle, où les écarts entre valeurs sont égaux et significatifs.
  4. La valeur \(2{,}1\) est donc dépourvue de sens — il n'existe pas de « couleur moyenne ».

Réponse : Le calcul est invalide ; on ne peut pas calculer une moyenne sur une échelle nominale.

Erreurs fréquentes

✗ Erreur fréquente : On déduit un lien causal de la simple existence d'une corrélation (« X est lié à Y, donc X cause Y »).

✓ La bonne méthode : Une corrélation n'est pas une causalité. Pour conclure à un lien causal, il faut exclure les variables confondantes, de préférence par une expérience contrôlée où seule la variable indépendante est manipulée.

✗ Erreur fréquente : On confond l'échelle intervalle et l'échelle rapport et on calcule des rapports sur des températures Celsius (« \(30^\circ\) est trois fois plus chaud que \(10^\circ\) »).

✓ La bonne méthode : Les rapports ne sont autorisés que sur une échelle rapport, qui possède un zéro absolu. Sur une échelle intervalle (Celsius, année), le zéro est arbitraire, donc seules les différences ont un sens, pas les rapports.

✗ Erreur fréquente : On classe le nombre d'enfants comme continu parce que c'est un nombre, ou la taille comme discrète parce qu'elle est notée comme un entier.

✓ La bonne méthode : La question est de savoir si on dénombre (discret) ou si on mesure en continu (continu), pas si le résultat est un nombre. Le nombre d'enfants se dénombre → discret ; la taille se mesure en continu → continue, même si on l'a arrondie.

Conseils d'entraînement

  • Conseil — L'ordre des échelles du plus faible au plus fort : nominale \(\to\) ordinale \(\to\) intervalle \(\to\) rapport. Chaque échelle supérieure inclut les capacités des échelles inférieures.
  • Conseil — On peut toujours convertir d'une échelle supérieure vers une inférieure (par exemple classer des tailles en « petit/moyen/grand »), mais pas l'inverse — on perd de l'information en descendant.
  • Conseil — Pour distinguer discret/continu, demandez-vous : « une valeur intermédiaire est-elle possible ? » \(2{,}5\) enfants est impossible (discret) ; \(2{,}5\) kg est possible (continu).
  • Conseil — Dans une expérience, le chercheur contrôle la variable indépendante et mesure la variable dépendante ; une variable modératrice (Moderator) change l'intensité du lien entre elles.

Résumé et formules clés

Échelles de mesure :

ÉchelleCaractéristiqueExemple
NominaleCatégories sans ordreSexe, couleur
OrdinaleOrdre sans écart égalClassement, rang
IntervalleÉcart égal, zéro arbitraireCelsius
RapportZéro absolu, rapport significatifPoids, durée
  • Discrète = on dénombre ; continue = on mesure.
  • Indépendante = le facteur ; dépendante = le résultat.
  • Corrélation \(\ne\) causalité — attention à la variable confondante.