Nous regroupons ces sondages en cinq catégories dont 1) le Programme du recensement(1901-), 2) les enquêtes sur les communautés de langue officielle en situation minoritaire, 3) les enquêtes sur l'éducation, 4) les enquêtes sur la littératie, et 5) autres enquêtes. Cette dernière catégorie comprend des thèmes qui combinent la langue et d’autres sujets comme l’immigration, les peuples autochtones et l’économie. De façon générale, nous présentons les caractéristiques générales des bases de données, leur conception, ainsi que leur utilité.
Introduction aux principales bases de données linguistiques
Dans cette section, nous résumons douze sondages principaux liés à la langue réalisés par Statistique Canada.
Programme du recensement (1901-)
Le Programme du recensement est la plus importante source de données linguistiques couvrant les 115 dernières années. Bien entendu, le recensement de 1901 ne comptait pas toutes les questions incluses aujourd’hui dans le programme. En fait, les sept questions liées à la langue qu’on y trouve aujourd’hui ont été graduellement intégrées à mesure que les besoins et les intérêts des Canadiens ont évolué. Ces avancées historiques sont détaillées à la Section Questions démolinguistiques des recensements. Nous notons les quatre points liés au Programme du recensement : sa fréquence, les méthodes de collecte de données, le taux d’échantillonnage et, plus important encore pour les chercheurs, la disponibilité de données publiques, cummulatives et confidentielles.
Nous aimerions également noter que le terme Programme du recensement se réfère au Recensement de la population à partir de 1901 et à l'Enquête nationale auprès des ménages pour l'année 2011. Nous excluons donc les recensements de la population avant 1901 parce qu'ils ne contiennent pas de questions sur la langue. En revanche, nous incluons l'Enquête nationale auprès des ménages (2011), car elle a été utilisée à la place du formulaire détaillé 2B pour cette année de recensement. En outre, en ce qui concerne ce dernier, les utilisateurs devraient garder à l'esprit que, contrairement au formulaire 2B d'autres années, la ENAM (2011) est basée sur des réponses volontaires avec un échantillonnage fixé à 33% et un taux de réponse totale de 68 % (Howatson-Leo & Trépanier, 2012).
En ce qui concerne le recensement de la population, les utilisateurs devraient noter qu'il ne s'agit pas d'un seul sondage, mais d'un groupe de questionnaires légèrement différents. Plus précisément, voici une liste de tous les formulaires et leur but général (Questionnaires du recensement de la population, 2016) :
- Formulaire abrégé 2A: composé d'une douzaine de questions et envoyé à tous les résidents de tous les logements privés.
- Formulaire abrégé 3A: Envoyé aux personnes qui souhaitent être énumérées séparément.
- Formulaire abrégé 2C: Envoyé aux Canadiens résidant à l'étranger (par exemple, Service extérieur, Forces canadiennes, etc.)
- Formulaire détaillé 2B (ou en 2016 2A-L, 2A-R): Composé d'une cinquantaine de questions et envoyé à un échantillon de ménages canadiens.
Dans l'avenir, chaque fois que nous mentionnons le Programme du recensement ou le Recensement, nous nous référons spécifiquement au formulaire 2A, 2B et ENAM (2011), sauf indication contraire.
Particularités du recensement — fréquence, méthodes et échantillonnage
En général, entre 1971 et 2006, et en 2016, le Recensement de la population était composé de deux questionnaires simultanés et obligatoires : le questionnaire abrégé 2A et le questionnaire détaillé 2B (en 2016, les formulaires 2A-L et 2A-R). Normalement, le questionnaire abrégé contient des questions à propos du nom, de la date de naissance, de l'âge, du sexe, du statut matrimonial, de la langue maternelle du répondant et de sa relation avec le répondant principal. Ce questionnaire est envoyé à tous les ménages canadiens. Le questionnaire détaillé est quant à lui composé de cinquante autres questions en moyenne et est envoyé à un échantillon de ménages canadiens. La méthodologie et le contenu du recensement a été continuellement amélioré et modifié au cours des années en fonction des besoins de la population canadienne, que ce soit en ce qui concerne sa fréquence, les méthodes de collecte et les taux d’échantillonnage.
Durant plus d’un siècle, le recensement était mené tous les 10 ans. En réponse au besoin croissant de données fiables et à jour et pour respecter les exigences nationales, la fréquence de collecte est maintenant d’une fois tous les cinq ans. La Loi sur la statistique (1970) a codifié ce changement et a mandaté sa mise en place dès le recensement de 1971 (Howatson-Leo & Trépanier, 2012 : 6).
Un autre point à noter est la façon dont on procédait à la collecte. Avant 1971, des recenseurs itinérants étaient envoyés dans tous les principaux centres urbains et dans plusieurs régions rurales pour s’occuper de la collecte d’information. Par contre, depuis 1971, étant donné entre autres des taux d'alphabétisation élevés de la population canadienne, cette pratique a été changée pour laisser place au recensement par autodénombrement, utilisé partout sauf dans quelques régions rurales, dans les réserves autochtones et auprès de non-répondants au troisième cycle. Ce système repose sur le principe que les questionnaires sont acheminés aux recensés et retournés par la poste. On prévoyait que l’autodénombrement « permettrait de réduire la variance des chiffres du recensement attribuable à la présence du représentant et, en même temps, donnerait au répondant le temps voulu pour remplir le questionnaire à son aise; par conséquent, on pouvait s’attendre que les réponses seraient plus exactes. » (Benjamin, Hovington et Banker, 2001 : 12). Trente-cinq ans plus tard, en 2006, les répondants ont aussi l’option de compléter le questionnaire en ligne (Howatson-Leo et Trépanier, 2012 : 7).
Finalement, il est important de noter que bien que « l’échantillonnage [ait] été utilisé pour la première fois au cours du recensement de 1941 » (Benjamin, Hovington et Banker, 2001 : 12), le taux d’échantillonnage du questionnaire détaillé 2B a toujours été sujet à certaines fluctuations. Plus précisément, dans les recensements de la population de 1971 et 1976, on a utilisé un échantillonnage de 1 sur 3 (Royce, 2011 : 49). De 1981 à 2006, le recensement a été mené sur un échantillonnage de 1 sur 5 (Royce, 2011 : 49). Finalement, l’ENM de 2011 un échantillonnage de 1 sur 3 est utilisé. Plus récemment, le recensement de 2016 a été mené sur un échantillonnage de 1 sur 4. En d’autres mots, les taux d’échantillonnage pour le questionnaire détaillé 2B ont été fixés à 20 %, 25 % ou même 30 % selon l’année. Le tableau ci-dessus présente les pourcentages des divers recensements.
Disponibilité de données – tableaux agrégés nationaux, provinciaux, territoriaux et métropolitains.
En prenant en compte tous les éléments décrits plus haut, nous en venons ici à expliquer où ces données peuvent être trouvées. Les données relatives à 1991 jusqu’en 2011 peuvent être trouvées sur la page des Ensemble de données du recensement (1991-) de Statistique Canada. Cette page héberge des tableaux de données nationales, provinciales et métropolitaines en format html.
Pour avoir accès à des ensembles de données antérieurs à 1991, plusieurs options sont disponibles. L’une de ces options est d’explorer la publication intitulée Statistiques historiques du Canada qui contient 1088 tableaux statistiques sur les conditions sociales, économiques et institutionnelles du Canada depuis la Confédération en 1867 jusqu’au milieu des années 1970. Parmi les sujets d’intérêt, nous retrouvons population et migration(pdf, 408 KB) (qui comprend la langue maternelle) et des statistiques sur l’éducation(pdf, 368 KB). Une autre option est de consulter les ensembles de données compilés par l’IPUMS North Atlantic Population Project (en anglais seulement). Les données sont hébergées par le Minnesota Population Center (en anglais seulement) et sont disponibles pour les années 1871, 1881, 1891 et 1901, quoiqu’en ce qui concerne les données linguistiques, seul l’ensemble de données de 1901 est utile. Finalement, les utilisateurs pourraient aussi consulter les ensembles de données disponibles sur le site de Bibliothèque et Archives Canada qui couvrent les années 1666 à 1921 (à différents degrés de complétude). En général toutefois, il est important de noter que les données de recensement pour la période de 1931 à 1986 sont seulement disponibles en version papier chez Statistique Canada ou dans les bibliothèques partenaires partout au pays.
Disponibilité de données – fichiers de microdonnées
L’accès à 20 % des microdonnées confidentielles de la période s’échelonnant de 1911 à 2011 n’est ouvert qu’aux chercheurs inscrits au Programme des Centres de données de recherche (CDR). Pour disposer d’un accès, le programme CDR demande qu’un projet de recherche soit proposé. À l’heure actuelle, les candidatures sont révisées dans un délai de 8 à 10 semaines.
Les fichiers de microdonnées à grande diffusion (FMGD) qu’on trouve sur ODESI sont rendus publics par l’Initiative de démocratisation des données (IDD). On peut les trouver sur le portail des bibliothèques de toutes les universités canadiennes. Il faut être étudiant inscrit, chercheur ou professeur associé à une université canadienne pour y avoir accès. De plus, il est important de noter que les fichiers FMGD sont des formes condensées de microdonnées qui se basent soit sur des échantillons plus petits – 2 % dans le cas de l’ENM et des données de recensement –, soit sur différentes méthodes de codage des données qui protègent les identifiants d’utilisateurs. Ces techniques permettent d’assurer la confidentialité; cependant, cela peut dans une certaine mesure limiter l’utilisation des données.
Minorités de langue officielle
Lorsqu’il est question des communautés de langue officielle en situation minoritaire, une autre ressource utile est l’Enquête sur la vitalité des minorités de langue officielle (EVMLO, 2006). Ce sondage est sans égal autant pour l’ampleur et que pour la profondeur avec lesquelles il aborde les pratiques et les trajectoires linguistiques, que ce soit à la maison, dans les domaines publics ou au travail.
En fait, l’Enquête sur la vitalité des minorités de langue officielle est la seule enquête qui se concentre spécifiquement sur les communautés de langue officielle en situation minoritaire, c’est-à-dire sur les francophones vivant à l’extérieur du Québec et les anglophones vivant au Québec. Ses débuts remontent à 2003 lorsque la Direction des langues officielles du Bureau du Conseil privé a demandé à Statistique Canada de réaliser une enquête sur la vitalité des communautés de langue officielle en situation minoritaire. L’enquête a ainsi été menée dans le cadre du Plan d’action pour les langues officielles de 2003 à 2008.
Cette enquête comptait deux objectifs principaux. D’abord, celle-ci devait permettre de récolter de l’information relative entre autres à l’éducation, à la santé et des enjeux de justice propres aux communautés de langue officielle en situation minoritaire. Ensuite, elle devait fournir de l’information en vue de la mise en œuvre de politiques. Le sondage comportait des questions qui permettaient de dégager des informations démographiques, linguistiques, culturelles et sociales sur les parents et les enfants de communautés de langue officielle en situation minoritaire. Plus précisément, l’enquête a permis de récolter des informations sur la fréquentation préscolaire et scolaire, sur l’accès aux soins de santé, sur la participation citoyenne, sur le bénévolat et le soutien social, sur la mobilité géographique, sur les caractéristiques économiques et salariales, sur l’identité ainsi que sur l’usage de la langue à la maison, au travail, en public et dans les loisirs. En d’autres mots, elle englobait une gamme assez exhaustive de variables socio-économiques et linguistiques.
Il est à noter que cette enquête porte sur deux publics. Elle a sondé à la fois des adultes âgés de 18 ans ou plus et des enfants de moins de 18 ans dont au moins l’un des parents appartient à une communauté de langue officielle en situation minoritaire. L’ensemble de données final comprend 20 067 adultes et 15 550 enfants. Ces données peuvent être utilisées afin d’approfondir notre compréhension de la situation actuelle des personnes qui appartiennent aux groupes de langue officielle en situation minoritaire et de leurs différents parcours.
Éducation
Les utilisateurs qui souhaitent consulter des données sur les programmes d’enseignement de langue seconde au Canada remarqueront que ce sujet a été étudié sous angles différents depuis les années 1990. En fait, l’Enquête sur l’enseignement primaire et secondaire (EEPS) présente la plus récente itération unifiée des précédentes enquêtes sur l’enseignement qui sont décrites plus bas.
Dès 2003, Statistique Canada a mené le Projet statistique sur l’enseignement primaire et secondaire (PSEPS). L'objectif de ce projet était de recueillir des données portant sur les dépenses des écoles primaires et secondaires et de remplacer plusieurs enquêtes qui étaient utilisées afin de recueillir des données sur les effectifs, les diplômés et les éducateurs. Ces enquêtes sont, entre autres : Effectifs des écoles primaires et secondaires, Langue de la minorité et langue seconde dans l’enseignement, Enquête sur les diplômés des écoles secondaires, Enquête sur les caractéristiques du personnel scolaire des écoles primaires et secondaires, et l’Enquête sur le système intégré d’information financière sur les commissions scolaires.
Le projet a été bien accueilli. En 2010, l’enquête est ainsi devenue un sondage pluriannuel intitulé Enquête sur l’enseignement primaire et secondaire (EEPS). Dans le cadre de cette enquête, des données administratives de tous les programmes publics, privés et d’enseignement à domicile sont recueillies. Ce faisant, ce sondage sur l’éducation n’implique aucun échantillonnage. Les principaux objectifs de l'outil de collecte de l'EEPS sont de produire des statistiques pertinentes, comparables et actuelles ainsi que de réduire le fardeau des répondants, c’est-à-dire le fardeau des établissements d'enseignement et des directeurs d'école. Ce recensement pourrait être d’intérêt pour les utilisateurs en raison de son contenu sur les programmes de langue de base, intensifs, d’immersion et sur les programmes de langue de la minorité au Canada.
Littératie
En ce qui concerne la littératie, deux enquêtes clés sont disponibles aux utilisateurs. La première est le Programme pour l'évaluation internationale des compétences des adultes (PEICA; 2010-). La deuxième est le Programme international pour le suivi des acquis des élèves (PISA; 2000/2009).
La première enquête englobe l’éducation et la formation des adultes (âgés de 16 à 65 ans) et s’intéresse particulièrement à la littératie. Elle est basée sur deux précédentes enquêtes sur la littératie décrites plus bas.
En 1994, l’Organisation de coopération et de développement économiques (OCDE) a approché sept pays — dont le Canada — pour créer des profils de littératie comparables dont l’utilité transcenderait les frontières nationales, linguistiques et culturelles. Cette enquête devait d’abord être nommée Enquête internationale sur l’alphabétisation des adultes (EIAA). Son objectif principal était de déterminer dans quelle mesure les adultes utilisent l'information imprimée pour fonctionner au sein de la société. Les résultats de ce premier sondage montrent qu’il pourrait exister un lien étroit entre la littératie et le potentiel économique d’un pays. Par la suite, neuf pays se sont ajoutés à la liste pour un total de 16, et deux sondages additionnels ont été menés en 1996 et 1998.
Une deuxième tentative pour mesurer le niveau de littératie a été menée en 2003 avec l’Enquête internationale sur l’alphabétisation et les compétences des adultes (EIACA). Suivant le modèle des enquêtes sur la littératie des années 1990, l’EIACA (2003-2006) a été menée sur l’initiative de sept pays qui cherchaient à recueillir de l’information basée sur des échantillons nationaux représentatifs d’adultes de 16 à 65 ans. Les participants ont été interviewés chez eux à l’aide de tests psychométriques qui mesurent la compréhension de textes suivis et de textes schématiques ainsi que les compétences en numératie et en résolution de problèmes. Comme pour les enquêtes précédentes, l’objectif de celle-ci était de déterminer dans quelle mesure les adultes utilisent l'information imprimée pour fonctionner au sein de la société. Un objectif additionnel de cette enquête était de faire le pont avec les enquêtes précédentes pour arriver à établir un portrait de l’évolution de la littératie dans le temps.
À la lumière de ces deux précédentes enquêtes sur la littératie, Statistique Canada a mené en 2010 le Programme pour l’évaluation internationale des compétences des adultes (PEICA) et a lancé le sondage en 2011. Comme les enquêtes précédentes, le PEICA est une initiative menée par l’OCDE qui a pour but de recueillir de l’information sur les compétences des individus en matière d’alphabétisation, de numératie et de résolution de problèmes. Néanmoins, dans ce cas-ci l’enquête s’est étendue pour inclure les compétences en milieu de travail, la formation scolaire, les réussites professionnelles et les compétences en technologie de l’information et des communications de 27 pays et de leurs habitants. Au total, environ 49 000 Canadiens ont été sondés en 2012.
La deuxième option qui s’offre aux utilisateurs qui souhaitent consulter des données sur la littératie est le Programme international pour le suivi des acquis des élèves (PISA; 2000/2009). Cette enquête est le résultat d’un effort concerté de 65 pays coordonnés par l’OCDE afin de recueillir des données sur tous les jeunes âgés de 15 ans qui terminent leur instruction obligatoire. Cette enquête multi cycle consiste en une série de tests de lecture, de mathématique, de science et de résolution de problèmes. Au Canada, durant le dernier cycle, environ 20 000 jeunes âgés de 15 ans répartis dans plus de 850 écoles y ont participé. Les écoles appartenaient à des commissions scolaires francophones et anglophones de toutes les provinces.
En raison de son fonctionnement en rotation, les utilisateurs qui souhaitent consulter des données relatives à la littératie – plutôt qu’aux mathématiques et aux sciences – sont invités à commencer leurs recherches au cycle des années 2000 et 2009. De plus, les utilisateurs devraient prendre note du cadre conceptuel spécifique à la littératie utilisé pour conceptualiser les compétences en lecture et en écriture (Knighton, Brochu et Gluzynski, 2010 : 14). Nous reproduisons ce cadre dans la Section Enseignement de la langue seconde et littératiede cet onglet.
Enquêtes ethnoculturelles
Mis à part les six bases de données décrites plus haut, environ 40 autres enquêtes de Statistique Canada incluent aussi des questions sur la langue. Les chercheurs en politique linguistique seront intéressés par le document Sources de données de Statistique Canada sur les minorités linguistiques (Lafrenière, 2013) qui dresse la liste de ces enquêtes tout en soulignant les forces et les limites de chacune d’entre elles. Le document fournit aussi le cadre conceptuel que Statistique Canada utilise pour étudier les connaissances linguistiques, l’utilisation de la langue et son apprentissage. Le document fournit aussi des définitions nominales et opérationnelles de la plupart des variables linguistiques.
De ces 40 enquêtes, nous en notons six en particulier qui, selon nous, complètent les enquêtes qui s’intéressent principalement à la langue. C’est surtout le cas en ce qui a trait à la diversité ethnoculturelle, à l’immigration, aux peuples autochtones et à la participation économique des différents groupes linguistiques. Les six enquêtes ci-dessous fournissent un bon point de départ qui saura intéresser un grand auditoire.
- Enquête sur la diversité ethnique (EDE)
- Base de données longitudinales sur l'immigration (BDIM)
- Enquête longitudinale auprès des immigrants du Canada (ELIC)
- Enquête auprès des peuples autochtones (EAPA)
- Enquête sur les enfants autochtones (EEA)
- Enquête sur la population active (EPA)
Comme le montre cette brève introduction, Statistique Canada recueille et entretient un grand nombre de bases de données pertinente pour la recherche en langue. Ces bases de données peuvent prendre la forme d’un programme de recensement sur le sujet ou de sondages transversaux, multi cycles ou longitudinaux qui abordent différents thèmes qui ont rapport à la langue. La prochaine section survole les cinq variables linguistiques et les sept questions qu’utilise Statistique Canada en matière langagière depuis 1901.