Travailler avec les données du recensement
Le choix de la période d'étude est crucial. Nous avions espéré utiliser les données d'immigration de chaque recensement de 1996 à 2016, mais nous avons fait face à un défi avec l'année de recensement 2011.
Le projet explore l'immigration à Ottawa principalement entre les années 2006 et 2016, avec l'inclusion des données du recensement de 1996. Le projet a été entrepris de cette manière en raison de la différence de qualité entre les formulaires longs habituels de recensement et l'Enquête nationale auprès des ménages (ENM) de 2011. La qualité des données contenues dans l'ENM a suscité des inquiétudes, car il s'agissait d'une enquête volontaire. L'ENM n'a probablement pas la même qualité que le formulaire long habituel de recensement, ce qui a donc influencé les recensements avec lesquels l'équipe a travaillé. Cela a conduit le groupe à examiner les recensements par décennie (avec des années se terminant par 6). Les données de chaque recensement sont également encadrées par certaines questions, qui diffèrent entre les différents recensements ex : Questions sur les personnes interrogées sur l'origine ethnique ou la langue maternelle d'une personne. Par exemple, pour mieux comprendre la langue maternelle des immigrants à Ottawa, le recensement de 1996 a été utilisé afin d'obtenir une meilleure image dans ce domaine.
L'équipe chargée des données était responsable de l'extraction, du nettoyage et de la préparation des données pour le projet. Xuanqi et Lori ont travaillé ensemble pour en savoir plus sur les données du recensement. Elles ont utilisé deux sources de données pour les aider :
(1) Le Computing in the Humanities and Social Sciences Data Centre (L'informatique dans le Centre de données des sciences humaines et sociales, connu sous le nom de CHASS)
(2) Programme du recensement de Statistique Canada
Ces deux bases de données ont permis à l'équipe chargée des données d'extraire les données d'immigration au niveau géographique nécessaire et avec les champs souhaités pour ce projet particulier.
Centre de données CHASS
Le centre de données CHASS est une collection de bases de données et de programmes de recherche et d'extraction personnalisés en ligne qui sont gérés par Computing in the Humanities and Social Sciences (CHASS) à l'Université de Toronto. Les étudiants et les professeurs de l'Université sont membres du centre de données et peuvent se connecter par le biais de leur compte universitaire. (Conseil : les membres de l'Université d'Ottawa peuvent se connecter ici).
CHASS dispose de nombreux produits de données liés au recensement canadien. Pour notre projet, qui s'est concentré sur l'immigration à Ottawa, ON, nous avons travaillé avec les données du secteur de recensement, ce qui nous a permis d'extraire les champs de données pertinents pour ce projet lié à l'immigration à un niveau local de la géographie. Plus précisément, nous nous sommes intéressés aux données sur la langue, l'immigration, la citoyenneté, la mobilité et la migration.
Le téléchargement des données a été relativement facile à réaliser, mais il y a eu quelques courbes d'apprentissage pour les nouveaux utilisateurs. Pour nos données, les secteurs de recensement (SR) étaient identifiés par leur code SR, nous avions donc un peu de préparation de données à faire.
Les données de Statistique Canada
Nous avons utilisé les données de Statistique Canada pour travailler avec les données linguistiques. Pour ce volet, nous avons travaillé avec les données d'une région métropolitaine de recensement (RMR), ce qui représente un niveau géographique plus élevé que les données des SR. L'équipe chargée des données souhaitait ce niveau parce qu'il permettait d'obtenir plus de détails granulaires sur diverses questions du recensement relatives à la langue, notamment la langue maternelle, les langues parlées à la maison et les langues parlées au travail.
Une chose que nous avons apprise en travaillant avec les données de recensement de Statistique Canada est que les produits de données changent d'un recensement à l'autre. C'était particulièrement vrai pour les données linguistiques. Nous avons pu extraire des tableaux de données sur la langue maternelle et la langue non officielle parlée à la maison pour les trois périodes de recensement sur lesquelles nous avons travaillé (1996, 2006, 2016), mais le recensement de 1996 ne comportait pas de question sur la langue parlée au travail. Cette question particulière n'est posée dans le cadre du recensement de la population que depuis 2001. Il n'existe donc pas de données sur la langue parlée sur le lieu de travail pour 1996.