000

100

%

Recensement de la population de 1926, population de résidence habituelle, arrondissement de Belleville. Cote D2M8 307 (Archives de Paris)

Descriptif :

POPP (Projet d’océrisation des recensements de la population parisienne) est un projet collaboratif imaginé par Sandra Brée (LARHRA, CNRS), porté avec François Merveille (GED-Campus Condorcet), grâce à la collaboration indispensable de Thierry Paquet (Université de Rouen, Litis), Thomas Constum et Nicolas Kempf, les deux ingénieurs de recherche embauchés spécialement pour le projet, et le financement du Collex-Persee, du Campus Condorcet et de la TGIR Progedo. Il a été lauréat de l’appel à projets CollEx-Persée 2019-2020.

Ce projet vise à élaborer une vaste base de données (12 millions d’individus) à partir des recensements nominatifs de Paris de 1926, 1931, 1936 et 1946. Ces recensements sont déjà numérisés et en ligne sur le site des archives de Paris mais il s’agit ici de créer une base de données permettant l’exploitation statistique de ces documents particulièrement riches et qui offrira l’opportunité d’un pas important dans la connaissance de la population urbaine européenne jusqu’alors très peu étudiée.

L’analyse quantitative et statistique des populations est rendue particulièrement difficile en histoire en raison, notamment, du manque de bases de données. Pour parvenir à de telles analyses, les chercheurs sont souvent obligés de travailler sur des zones géographiques et temporelles très restreintes en raison de l’immensité du recueil des données. De plus, l’Entre-deux-guerres constitue donc une sorte de trou d’air statistique entre le très prolifique XIXe siècle (jusqu’en 1914), et le développement de la statistique « contemporaine ». Ce projet est donc essentiel pour compléter notre connaissance de l’évolution économique, sociale et démographique de la France, et notamment de sa population urbaine. Les données disponibles permettent, en effet, aussi bien d’analyser des comportements démographiques de la population, que de saisir la répartition spatiale des individus selon leur lieu de naissance par exemple. Les chercheuses et chercheurs pourront également se concentrer sur des populations particulières (certaines professions par exemple) qu’ils retrouveront facilement dans toute la ville, ce qui serait très laborieux aujourd’hui. Il sera également possible, ce qui est particulièrement novateur, de suivre des familles dans leurs déménagements entre 1926 et 1946.

Outre son intérêt pour la connaissance scientifique, ce projet présente également une avancée importance du point de vue méthodologique. En effet, la création de la base de données nécessite l’utilisation de technique de reconnaissance optique de caractère. L’équipe du laboratoire LITIS, en charge de la partie informatique du projet, a mis au point des logiciels de lecture optique de plus en plus performants pour extraire des informations imprimées dans des publications imprimées. Dans cette continuité, le projet Popp constitue un véritable défi à relever puisque les recensements de population ne sont pas tapuscrits comme les données de la bourse mais remplis à la main. Les premiers essais sont cependant concluants, d’une part parce que les recherches de Sandra Brée sur la population parisienne lui ont permis de créer des banques de données (professions, noms, lieux) permettant de paramétrer les algorithmes de détection optique, et d’autre part parce que l’équipe du LITIS dispose également d’une expertise en reconnaissance d’écriture manuscrite, et dans l’implémentation de chaînes de traitement et de production de données structurée telles que des archives de presse.

Lien internet : https://popp.hypotheses.org/