D1.1 Expliquer pourquoi des pourcentages sont utilisés pour représenter la distribution d’une variable provenant d’une population ou d’un échantillon dans de grands ensembles de données, et fournir des exemples.

ACTIVITÉ 1 : ANALYSE SELON LES POURCENTAGES


Présenter aux élèves la situation suivante.

Une collecte de données a été faite par l’Académie du sommeil auprès de 10 000 jeunes de 9 à 13 ans, puis de 10 000 jeunes de 14 à 17 ans relativement à la durée moyenne de leur sommeil. Les deux tableaux de fréquences relatives ci-dessous présentent ces données. Quelles conclusions pouvez-vous tirer en comparant les deux tableaux? Les données exprimées en pourcentages facilitent-elles la compréhension?

Durée moyenne du sommeil – Population de 9 à 13 ans

Nombre d'heures de sommeil Fréquence relative
Entre 6 et 7 heures 1 %
Entre 7 et 8 heures 4 %
Entre 8 et 9 heures 15 %
Entre 9 et 10 heures 33 %
Plus de 10 heures 47 %

Durée moyenne du sommeil – Population de 14 à 17 ans

Nombre d'heures de sommeil Fréquence relative
Entre 6 et 7 heures 9 %
Entre 7 et 8 heures 25 %
Entre 8 et 9 heures 33 %
Entre 9 et 10 heures 18 %
Plus de 10 heures 15 %

Explications et justifications

En observant les deux tableaux, dont les valeurs sont exprimées en pourcentages, nous observons que les jeunes de 9 à 13 ans et que les jeunes de 14 à 17 ans n’ont pas les mêmes habitudes de sommeil. Il y a 47 % de la population de 9 à 13 ans qui passe plus de 10 heures à dormir, tandis qu’il n’y a que 15 % de la population de 14 à 17 ans qui dort plus de 10 heures. Il y a 1 % des jeunes de 9 à 13 ans qui dorment de 6 à 7 heures, tandis que près de 10 % des jeunes de 14 à 17 ans dorment de 6 à 7 heures. On remarque aussi qu’il y a environ 5 fois plus d’individus de 14 à 17 ans qui dorment de 7 à 8 heures que d’individus de 9 à 13 ans, soit 4 %. Dans le premier tableau, les pourcentages indiquent que plus le nombre d’heures de sommeil augmente, plus le nombre d’individus est élevé, ce qui révèle que les jeunes de 9 à 13 ans semblent avoir besoin de beaucoup de sommeil. Dans le second tableau, le nombre d’individus augmente graduellement dans chacune des trois premières catégories, mais le nombre de personnes ayant répondu au sondage diminue considérablement dans les deux dernières catégories. On peut donc supposer que les jeunes de 9 à 13 ans ont besoin de plus de sommeil que les jeunes de 14 à 17 ans. Finalement, les fréquences exprimées en pourcentages ont permis d’analyser et de comparer les données rapidement.

Demander aux élèves d’expliquer les raisons pour lesquelles la fréquence exprimée en pourcentage est utilisée pour représenter la distribution d’une variable provenant d’une population dans de grands ensembles de données.

Inviter les élèves à expliquer leur réponse à l’aide d’exemples.

Solutions possibles 

Les fréquences exprimées en pourcentages sont tout indiquées pour représenter des variables dans un grand ensemble de données. Dans une étude effectuée auprès de 45 000 individus, par exemple, portant sur les moyens utilisés pour réduire leur stress, il y a 29 344 personnes qui affirment pratiquer une activité physique et il y a 5 678 personnes qui font de la méditation. Ces données sont beaucoup plus faciles à interpréter en comparant des pourcentages, en disant que 65 % des personnes pratiquent une activité physique et que 13 % font de la méditation pour réduire leur stress.

Source : En avant, les maths!, 7e année, ML, Données, p. 11-12.

ACTIVITÉ 2 : comparer des données exprimées en fréquences et des données exprimées en fréquences relatives


Une municipalité ontarienne désire investir dans un projet communautaire au cours de la prochaine année. Afin de répondre aux besoins de sa population, la municipalité a mené un sondage auprès de 25 000 individus. Elle leur a posé la question suivante : Selon vous, quel projet communautaire devrait être mis sur pied dès l’an prochain afin de répondre aux besoins grandissants de la population? Les deux tableaux ci-dessous résument les résultats du sondage.

Projets communautaires proposés Fréquence
Bâtir un centre communautaire pour les jeunes de 12 à 18 ans 5 674
Créer un jardin potager collectif 7 594
Mettre sur pied une banque alimentaire 2 846
Organiser un marché pour des entreprises locales 6 508
Acheter et installer des toilettes accessibles dans tous les parcs 2 378
Total 25 000

Choix d'un projet communautaire à mettre sur pied

Projets communautaires proposés Fréquence Fréquence relative (fractions) Fréquence relative (nombres décimaux) Fréquence relative (%)
Bâtir un centre communautaire pour les jeunes de 12 à 18 ans 5 674 \(\frac{5\ 674}{25\ 000}\) 0,23 23 %
Créer un jardin potager collectif 7 594 \(\frac{7\ 594}{25\ 000}\) 0,30 30 %
Mettre sur pied une banque alimentaire 2 846 \(\frac{2\ 846}{25\ 000}\) 0,11 11 %
Organiser un marché pour des entreprises locales 6 508 \(\frac{6\ 508}{25\ 000}\) 0,28 26 %
Acheter et installer des toilettes accessibles dans tous les parcs 2 378 \(\frac{2\ 378}{25\ 000}\) 0,10 10 %
Total 25 000 \(\frac{25\ 000}{25\ 000}\) 1,00 100 %

Demander aux élèves d’analyser les données des deux différents tableaux. Leur poser des questions telles que les suivantes :

  • Qu’est-ce que révèle le premier tableau? le second tableau?
  • Que remarquez-vous en comparant les données des deux tableaux?
  • Selon vous, lequel des deux tableaux vous aide à mieux analyser les données? Pourquoi?
  • Comment ces données peuvent-elles vous aider à faire des prédictions?

Exemple de réponse 

Le premier tableau présente des fréquences comparativement au second tableau qui présente des fréquences relatives.

Cela étant dit, dans le premier tableau, la municipalité de l’Ontario a comptabilisé le nombre de personnes ayant choisi chacune des catégories. La distribution des fréquences représente alors le nombre d’individus qui correspond à chaque variable et donne une idée globale de la façon dont sont distribuées les données; par exemple, 7 594 personnes ont voté pour la création d’un jardin potager. C’est la variable la plus élevée du tableau. Il est toutefois difficile de comparer des valeurs absolues, puisqu’elles ne comparent pas efficacement des catégories d’une grande population.

Le second tableau présente la fréquence relative de chacune des catégories, exprimée sous la forme d’une fraction, d’un nombre décimal et d’un pourcentage. Ces données aident à mieux interpréter la distribution des données, car les valeurs relatives sont exprimées relativement au même tout (100); par exemple, 7 594 personnes disent vouloir créer un jardin potager collectif, alors que 6 508 personnes disent vouloir organiser un marché pour des entreprises locales. Ces données sont plus faciles à interpréter en comparant des pourcentages, en disant que 30 % (presque \(\frac{1}{3}\)) des gens disent vouloir mettre sur pied un jardin potager collectif et que 26 % (approximativement \(\frac{1}{4}\) de la population) disent vouloir organiser un marché pour des entreprises locales.

En comparant la fréquence, il y a 468 personnes de plus qui préfèrent que la municipalité mette sur pied une banque alimentaire plutôt que d’acheter des toilettes accessibles et de les installer dans tous les parcs. Le premier des deux choix est donc plus populaire. Toutefois, seul un pour cent sépare le choix de mettre sur pied une banque alimentaire (11 %) de celui de l’achat de toilettes accessibles et de leur installation dans tous les parcs (10 %). Les deux choix ont alors sensiblement la même popularité.

Pour conclure, les données exprimées en fréquences relatives aident à faire des prédictions plus justes; par exemple, en regardant les données, il est possible de prédire que la municipalité ontarienne créera un jardin potager collectif au cours de la prochaine année, puisque 30 % des gens qui ont répondu au sondage ont voté en faveur de ce projet.