République du SénégalUn peuple-Un but-Une foi
Ministère de l’Economie et des Finances
Agence Nationale de la Statistique et de la Démographie
Rapport de stage
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Rédigé par :
Adama M LO
Elève Ingénieur Statisticien
Encadreur :
Madame Madon AWISSI SALL
Experte en Traitement
des données d’enquête
09 Juillet-14 Septembre 2012
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Remerciements
Tout d’abord, je tiens à remercier mon maître de stage, Monsieur Oumar Fall, Chef de Division des
bases de données et des systèmes d’information pour son accueil.
Je remercie tout particulièrement Madame Madon Awissi SALL, Madame Mary Sow THIAM et Monsieur
Ibrahima DIOP qui m’ont encadrés et accompagnés tout au long de cette expérience professionnelle.
Je remercie également mes camarades stagiaires avec qui j’ai pu échanger des idées et travailler de ma-
nière efficace et sympathique ainsi que tout le personnel de la Direction de Management de l’Information
Statistique(DMIS).
1
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Sigles et Abréviations
ACP :Agence comptable
AR : Agent Recenseur
BTDE :Bureau de Traitement des Données d’Enquête
DAGRH :Direction de l’Administration Générale et des Ressources Humaines
DSECN :Direction des Statistiques Économiques et de la Comptabilité Nationale
DSDS :Direction des Statistiques Démographiques et Sociales
DMIS :Direction du Management de l’Information Statistique
DVBEIA : Diagnostic sur la Vulnérabilité des Enfants, de l’Intervention et des Besoins des Acteurs
EMSILD :Enquête Monographique sur les Services de Logement à Dakar
INS :Institut National de Statistique
PDA :Personal Digital Assitant
RGPHAE : Recensement Général de la Population et de l’Agriculture
2
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Avant propos
La formation des Ingénieurs des Travaux Statistiques s’étend sur 4 ans et comprend des cours théo-
riques, des stages pratiques et des enquêtes sur le terrain. A la fin de la deuxième année, l’élève ITS
effectue obligatoirement un stage d’immersion de 2 mois dans l’Institut National de Statistique de son
pays. Ce stage lui permet d’une part de se familiariser avec son futur milieu professionnel et d’autre part
de mettre en pratique les connaissances théoriques acquises au cours de ces deux années de formation.
A la fin du stage, le stagiaire doit rédiger un rapport qu’il défendra devant un jury. Ce présent rapport
s’inscrit dans ce cadre.
Conformément à ma demande, j’ai été affecté à la DMIS (une des 5 directions de l’agence Nationale de la
Statistique et de la Démographie). J’ai effectué le stage du 09 Juillet au 14 Septembre 2012 au Bureau de
traitement de données d’enquête (BTDE). Plus largement, cela a été l’occasion, d’observer le fonctionne-
ment d’un institut comme l’ANSD, son organisation structurelle et les relations entre les départements. Il
nous a également permis de comprendre l’importance et l’apport des INS dans un pays comme le nôtre,
vu le besoin accru des données fiables et l’importance des indicateurs socioéconomiques.
3
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Introduction
Au cours de ce stage au Bureau des Traitements des Données d’Enquête (BTDE), j’ai travaillé es-
sentiellement sur deux activités que sont la préparation du Recensement Général de la Population, de
l’Habitat, de l’Agriculture et de l’Elevage 2012 et l’archivage des données d’enquêtes.
Dans le cadre de l’organisation du Recensement Général de la Population de l’Habitat de l’Agriculture et
de l’Elevage (RGPHAE), j’ai eu l’occasion de participer à l’enquête pré test du RGPHAE et d’analyser la
qualité des données issues de cette enquête. Cette analyse a pour but de vérifier la cohérence des données
collectées avec les PDA (Personal Digital Assistant, ce sont des microordinateurs de poche). Le rapport
de cette analyse a permis de déceler certaines erreurs et d’améliorer l’application de collecte. Une fois
l’application améliorée, j’ai aussi participé au test de la nouvelle version déployée sur les PDA.
La seconde activité est la documentation d’enquêtes avec le logiciel d’archivage des données d’enquête
Micro data Management Toolkit. Dans le cadre de cette activité, nous avons eu à participer à un atelier de
perfectionnement sur les techniques d’archivage des données d’enquête. J’ai eu à documenter 2 enquêtes
que sont l’Enquête Monographique sur les Services du Logement à Dakar (EMSILD) et l’Enquête sur le
Vulnérabilité des Enfants de l’intervention et des besoins des acteurs (DVEIBA).
Ce présent rapport sera organisé en deux parties et chaque partie fera l’objet d’une activité.
4
Chapitre 1
Présentation de la structure d’accueil
L’agence Nationale de la Statistique et de la Démographie(ANSD) est une structure administrative
créée par la loi N2004-21 du 21 juillet 2004 portant organisation des activités statistiques. Elle est or-
ganisée par le décret N̊ 2005-436 du 23 Mai 2005, placée sous l’autorité du Ministre de l’Economie et
des Finances, elle est dotée de la personnalité juridique et d’une autonomie de gestion. Elle est chargée
d’assurer la coordination technique des activités du Système Statistique National et de réaliser elle-même
les activités de production et de diffusion des données statistiques pour les besoins du gouvernement, des
administrations publiques, du secteur privé, des partenaires du développement et du public.
En d’autres termes, elle est chargée de :
4 Veiller à l’élaboration et à la mise en ?uvre des programmes pluriannuels et annuels d’activités
statistiques ;
4 Assurer la mise en application des méthodes, concepts, définitions, normes, classifications et nomen-
clature approuvés par le comité technique des programmes statistiques ;
4 Réaliser des enquêtes d’inventaire à couverture nationale notamment les recensements générales de
la population et les recensements d’entreprises ;
4 Produire les comptes de la nation
4 Suivre la conjoncture et la prévision statistique,élaborer les indicateurs économiques, sociaux et
démographiques ;
4 Suivre la coopération technique internationale en matière statistique.
4 Promouvoir la formation du personnel spécialisé pour le fonctionnement du système national d’in-
formation statistique par l’organisation des cycles de formation appropriés notamment au sein d’une
école à vocation régionale ou sous régionale intégrée à l’agence
5
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
4 Favoriser le développement des sciences statistiques et la recherche économique appliquée relevant
de sa compétence ;
4 Centraliser et diffuser les synthèses des données statistiques produites par l’ensemble du système
statistique national ; Élaborer et de gérer les fichiers des entreprises et des localités ;
4 Assurer le secrétariat et l’organisation des réunions du Conseil National de la statistique et du
comité technique des programmes statistiques ainsi que de ses comités sectoriels ;
4 Préparer des dossiers à soumettre aux réunions du conseil national de la statistique et du comité
technique des programmes statistiques ;
L’agence est en outre chargée de suivi de la coopération technique internationale en matière de statis-
tique. A ce titre, elle représente le Sénégal dans les réunions sous régionales, régionales et internationales
relatives aux questions relevant de sa compétence et suit les activités des organisations internationales
en ce qui concerne les questions statistiques. L’agence peut entreprendre, à la demande du gouvernement
et des administrations publiques et privées, des études et recherches sur les questions statistiques, écono-
miques et sociales à titre onéreux ou gracieux dans les conditions définies par le conseil d’orientation. De
tels travaux donnent lieu à la signature de contrats de service ou de protocole d’accord entre l’agence, le
commanditaire de tels travaux, et éventuellement les bailleurs de fonds.
L’ANSD est une structure administrative dotée de la personnalité juridique et d’une autonomie de ges-
tion. Placée sous la tutelle du ministère de l’économie et des finances, elle est administrée par le conseil
de surveillance, un organe de délibération composé de neuf membres nommés par décret pour une durée
de 2 ans renouvelable sur proposition du ministre de tutelle. C’est le CS qui définit et oriente la politique
générale de l’ANSD. Celle-ci est donc dirigé par un Directeur Général nommé par décret qui est quant
à lui assisté par un Directeur Général Adjoint également nommé par décret. Outre la direction générale,
l’agence se compose de services centraux et de subdivisions au niveau régional. L’ensemble est organisé
en Cellules, Directions, Divisions, Bureaux et Services :
La Cellule de Programmation, d’Harmonisation de Coordination Statistique et de Co-
opération Internationale (CPCCI) :
Elle appuie le directeur général à la préparation des dossiers relatifs au Conseil National de Statistique
et au comité techniques des programmes statistique, notamment la préparation des sessions de ces organes
et commissions et groupes de travail qu’ils mettent en place, du suivi de l’exécution de leurs décisions, etc.
Elle assure également le suivi de la coordination du système statistique en animant notamment, les secré-
tariats du conseil national de la statistique et du conseil des programmes statistiques ; la coordination des
6
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
concepts et des nomenclatures ainsi que les comparaisons méthodologiques internationales. Placée sous la
supervision directe du Directeur Général Adjoint, la CPCCI compte 2 unités :
– L’unité de programmation et de coordination statistique.
– L’unité d’harmonisation et de coopération internationale
Les Directions : Au niveau central, l’ANSD comprend 6 unités centrales :
– Direction des Statistiques Économiques et de la Comptabilité Nationale(DSECN) :
Elle est chargée d’établir des statistiques économiques globales et les comptes nationaux. Elle est
composée de la Division des Statistiques Économiques, de la Division des Statistiques Conjonctu-
relles et de la Division de la Comptabilité Nationale et des Études Analytiques.
– Direction des Statistiques Démographiques et Sociales(DSDS) :
Elle est chargée de la conception, de l’exécution et de l’analyse des enquêtes et recensements démo-
graphiques et socioéconomiques auprès des ménages. Elle traite et centralise les fichiers reprenant
les copies des actes d’état civil reçues et saisies au niveau régional. Elle est composée de la Division
du Recensement et des Statistiques Démographiques, de la Division des Statistique Sociales, du
suivi des conditions et de Pauvreté et de la Direction des Opérations de Terrain.
– Direction du Management de l’Information Statistique(DMIS) :
Elle est chargée d’assurer la mise à disposition d’un système d’information efficient pour l’ensemble
des activités de l’ANSD ; d’organiser et de piloter le développement des compétences informatiques
du personnel de l’ANSD ; de constituer des bases de donner exhaustives et fiables pour les activi-
tés de l’ANSD ; d’assurer l’administration des réseaux informatiques et des bases de données ; de
superviser l’acquisition ou le développement d’applications informatiques ; d’assurer le traitements
et la sauvegarde des données d’enquête, de gérer la cartographie censitaire et le système d’informa-
tion statistique ; d’organiser la gestion du savoir ; de gérer le centre de documentation et d’assurer
la conservation des archives ; d’assurer le contrôle de qualité de l’impression des publications ; de
définir la politique de diffusion et d’organiser la diffusion des données produites ; gérer les relations
avec les usagers de la statistique et de promouvoir la culture statistique au sein de la société. Elle
est composée de la Division de la Documentation, de la diffusion et des Relations avec les Usagers
et de la Division des Systèmes d’informations et des Bases de Données nationales.
– Direction de l’Administration Générale et des Ressources Humaines (DAGRH) :
La DAGRH est chargée de la gestion du personnel et des compétences de l’agence, d’assurer la sécu-
rité de l’agence sur toutes les questions juridiques et réglementaires, d’assurer l’approvisionnement
de l’agence et la gestion de la logistique et du matériel. Elle gère les stocks de l’agence.
7
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
– Agence comptable (ACP) : L’ACP assure la gestion des moyens financiers. Elle tient la comp-
tabilité des deniers de l’agence selon le système de comptabilité en vigueur, veille à la disponibilité
d’une bonne information financière fiable, à temps et régulière. Elle supervise l’élaboration de la
comptabilité matière de l’agence.
– Direction chargé de L’ENSAE-Sénégal :
Il est chargé de préparer les dossiers de l’école. A cet égard, il est chargé d’animer les groupes de
travail mis en place à cet effet. Il est également chargé de mettre en ?uvre le programme intérimaire
défini pour la poursuite des activités de formation en cours. Il assure la supervision et l’évaluation
des personnels mis à la disposition du Département de Statistique de l’Ecole Nationale d’Economie
Appliquée, transférée à l’ANSD.
Au niveau régional, l’ANSD comprend 14 services régionaux de la Statistique et de la Démographie.
8
Chapitre 2
L’enquête pré pilote du RGPHAE 2012
Le recensement général de la population est une opération importante car elle permet d’avoir une
photographie de la population et de ses caractéristiques. Tous les 10 ans, le Sénégal en tant que Pays
en développement doit faire un recensement de sa population comme le préconise les Nations Unies. Il
y a eu ceux de 1976, de 1988 et de 2002 qui n’ont pas respectés ce délai prescrit à cause des problèmes
de financement. A ce jour, doit se réaliser dans l’année en cours (2012) le recensement général de la
population, de l’habitat, de l’agriculture et de l’élevage (RGPHAE).
2.1 Contexte et Objectifs
Le recensement est un long processus qui demande beaucoup de sérieux et de méthodologie. En effet,
il rassemble le document de projet c’est-à-dire le plaidoyer, le document technique, le plan de communi-
cation, la cartographie, le dénombrement et la recherche de financement. Pour ce faire, il y aura l’enquête
pilote d’ici au mois d’octobre qui permettra de confronter la réalité du terrain avec le processus du recen-
sement.
L’innovation concerne l’ajout des sections telles que l’agriculture et l’élevage, et le plus important, l’uti-
lisation des PDA comme moyen de collecte.
Pour mettre en ?uvre cela, une application de collecte a été développée et le besoin de la tester s’est fait
sentir. L’objectif de cette enquête est de :
\ Tester les applications informatiques à savoir l’application de collecte sur PDA, l’application du
superviseur, l’application départementale et la base de données.
\ Déceler les erreurs applicatives et les incohérences.
\ Corriger les erreurs.
9
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
\ Estimer la durée des interviews.
\ Avoir une meilleure maitrise de la charge de travail des agents recenseurs et des autres acteurs.
En effet, étant le point focal du recensement, il fallait s’assurer que l’application est fidèle au questionnaire
et qu’elle réduit le risque d’erreurs et d’incohérences. Le test de l’application a donc été programmé le
weekend du samedi 14 et du dimanche 15 juillet 2012.
2.2 L’enquête pré test
Avant de démarrer l’enquête proprement dite, une formation a été organisée pour permettre aux agents
recenseurs de se familiariser avec les deux outils de collecte à savoir le PDA et le questionnaire papier.
Elle a été prévue pour une durée de trois jours : du mardi 10 au jeudi 12 juillet 2012. Pour le premier
jour, tous les acteurs concernés se sont réunis pour faire une présentation générale du RGPHAE. A la
fin de chaque journée, des réunions de débriefing réunissaient les agents de la DSDS et de la DMIS. Au
cours de ces réunions, les différents contrôleurs et superviseurs discutaient des problèmes rencontrés avec
l’application durant la journée.
Pour la préparation de cette enquête 40 étudiants de l’ENSAE ont été recrutés à l’ANSD. Ces derniers
sont organisés en 8 équipes de 5, soit deux équipes pour chaque quartier. L’enquête a eu lieu les samedi 14
et dimanche 15 Juillet 2012 et concernait 40 DR des quartiers et village de Biscuiterie (Dakar), Parcelles
assainies Unité 6 (Dakar), Médina Fall (Thiès) et Lalane (Thiès). J’ai participé à cette enquête comme
assistant de Monsieur Pape Demba Diouf, superviseur dans le quartier de Biscuiterie. Les problèmes les
plus récurrents que rencontraient les agents recenseurs sur le terrain sont les suivants :
– Indisponibilité des enquêtés : Nombre d’interviews sont interrompus faute d’indisponibilité des en-
quêtés. Souvent les enquêtés affirment qu’ils n’ont pas de temps et reportent l’interview à une date
ultérieure.
– Refus : Certains enquêtés refusaient de répondre à certaines questions parce que les trouvant gê-
nantes (le nombre d’enfants, les noms des enfants, la formulation de certaines questions, etc.)
– Nombre de chargeurs insuffisants : J’ai assisté à des décharges fréquentes et simultanées des PDA,
les agents recenseurs chargeaient leurs PDA à tour de rôle et cela leur a fait perdre du temps.
– Différence entre ce qu’ont relevé les cartographes et ce qui est trouvé sur le terrain : Par exemple, lors
de la cartographie des bureaux ont été enregistrés comme des ménages ; Dans certains immeubles,
le nombre de ménages a été surestimé ...
10
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
En principe avant le recensement, une phase de concrétisation devrait être effectuée, cette activité permet
de mettre à jour les données relevées par les cartographes, donc à contrôler les changements pouvant
survenir entre temps (déménagement, aménagement, destruction d’habitation, etc.). Cette activité n’a
pas été effectuée car le test du dispositif informatique était la principale raison de l’enquête.
J’ai aussi assisté aux transferts des données des PDA vers les machines des superviseurs et à la remontée
des données vers le niveau central.
2.2.1 Les problèmes liés à l’application
Chaque agent recenseur était tenu de rendre un rapport suivant un canevas, dans lequel il précisera le
nombre de questionnaires collectés, les durées des interviews, les durées des interruptions, les problèmes
rencontrés et les recommandations. Ainsi mes camarades stagiaires et moi avons reçu et compilé 50
rapports des agents recenseurs. Au lendemain de cette enquête, un débriefing a été organisé permettant
aux agents recenseurs de faire part des difficultés rencontrées liées à l’application. Le rapport final révèle
que les problèmes les plus rencontrés par les agents recenseurs sont :
] Incompréhension de certains concepts (agricole) du questionnaire par les agents recenseurs.
] Remplissage de la composition des ménages et de la constitution des ménages dans le cas ou le
ménage est constitué de plusieurs d’individus.
] Difficultés à trouver certaines professions dans la liste des professions disponibles.
] Sensibilité faible des PDA.
] Impossibilité de changer le noyau des individus et de supprimer des individus.
] Impossibilité de clôturer un ménage ou il y a un individu âgé de moins de 1 an.
2.2.2 Les recommandations
Pour résoudre les différents problèmes rencontrés durant cette phase de collecte, les agents recenseurs
ont formulé les recommandations suivantes.
4 Augmenter la durée de formation des agents recenseurs.
4 Alléger le questionnaire, en regroupant certaines questions (sections agriculture, habitat...)
4 Permettre de modifier certaines informations et de supprimer des individus déjà enregistrés.
4 Bloquer les autres applications qui sont sur le PDA lors de la collecte.
4 Avoir des batteries qui peuvent durer en moyenne 5H ; préparer deux batteries pleines pour chaque
PDA afin de parer aux difficultés de charge.
11
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
2.3 L’analyse des données de l’enquête pré pilote
Après ce test, il fallait s’assurer de la cohérence et de la qualité des données recueillies. Il s’agit d’une
analyse technique sur les filtres, les sauts, les valeurs manquantes et aberrantes. Mais aussi estimer la
durée moyenne des interviews pour les ménages agricoles et non agricole. Ainsi cette étude a été faite
en différentes étapes. Un travail préliminaire consistait à exporter les données de CS pro vers SPSS et
de se répartir les différentes sections du questionnaire. En ce qui me concerne, je devais travailler sur les
sections suivantes : Individu (du début à B20), Décès, Migration et Habitat.
2.3.1 Les résultats de l’analyse des données
Nous avons procédé dans un premier temps à l’analyse des valeurs manquantes et aberrantes pour
chaque variable puis dans un second temps à la vérification de la cohérence des données. Nous calculerons
aussi les moyennes des interviews pour différents type de ménage.
Les incohérences
4 On observe qu’à Guédiawaye, IDDR : 014301110007, 9 ème et 10 ème concessions : la variable «
nombre de ménage dans la concession » est renseigné 0, alors qu’en réalité chacune d’elle a un
ménage.
Dans les concessions 9 et 10, il y a respectivement des ménages de 3 et 2 individus. S’il n’y a
pas de ménages dans la concession, l’application ne doit pas permettre l’enregistrement d’individus
puisqu’on ne peut recenser des individus n’appartenant à aucun ménage. Dés que la concession est
habitée, la modalité 0 doit être exclue pour la variable nombre de ménage dans la concession.
De la même manière, si la concession n’est pas habitée, le nombre de ménage dans la concession
doit être 0 automatiquement.
4 On a relevé aussi 5 ménages sans résidents (masculin et féminin) alors qu’en réalité, ce sont des
ménages individuels.
Ils ont tous été enregistrés comme Chefs de ménage, Chefs de noyau, Résidents présents, les autres
caractéristiques individuelles n’ont pas été renseignées.
Ceci pourrait être du à une erreur de manipulation de la part de l’agent recenseur, donc l’appli-
cation devrait permettre à l’enquêteur de supprimer des individus s’il s’est trompé. D’autre part,
l’application doit exiger de renseigner certaines caractéristiques individuelles avant d’enregistrer un
individu.
4 On relève 4 ménages n’ayant pas de Chef de Ménage : Le premier IDDR : 011301220002, 3ème
concession, 1er ménage, ce ménage est individuel et le seul individu est enregistré comme frère du
12
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
CM.
Dans le deuxième, IDDR : 014301110008, 10ème Concession, 1er ménage, ce ménage est composé
de 7 personnes, l’un enregistré comme mère du CM et les autres comme frère ou s ?ur du CM.
Dans le 3ème, IDDR : 072203020010, 3éme concession, 1er ménage, il y a 4 personnes, 2 sans lien
de parenté avec le CM, une épouse et un frère du CM. Dans le 4ème, IDDR : 07203111003, 4ème
concession, 1er ménage, ce ménage est composé de 17 personnes dont 2 épouses, 5 fils, la mère du
CM, un frère du CM et 8 sans liens de parenté avec le CM.
4 J’ai aussi constaté des sauts pour certaines variables : Dans la section « caractéristiques individuelles
», dans le DR 014301110001, 4ème concession, 1er ménage, j’ai constaté des sauts de variables pour
un individu, les variables lien de parenté avec le CM, lien de parenté avec le Chef de Noyau, lien
de résidence jusqu’à ethnie n’ont pas été renseigné, l’agent recenseur(AR) continue à renseigner les
variables à partir de la Religion.
4 Concernant la section habitat, Dans le DR 072203020005, 1er concession, 1er ménage, nous avons
constaté que les biens d’équipements du ménage sont renseignés alors que toutes les autres variables
de la section habitat ne le sont pas. Nous avons relevé 45 ménages pour lesquels toutes les variables de
la section habitat ont été renseignées sauf la variable mode d’acquisition du logement. En principe,
les variables caractéristiques du logement devraient être obligatoires, elles doivent être renseignées
avant de poursuivre avec les autres variables, aucun saut ne devrait être permis par l’application.
4 Nous avons relevé aussi 2 Chefs de noyau qui sont enregistrés comme visiteurs.
4 Concernant la section décès, 5 décès ont été notés et deux d’entre eux ont été vraiment identifiés.
Pour plus d’informations, se référer sur ce tableau.
Table 2.1 – les filtres qui ne sont pas respectésAge Sexe Déclaration Durant la grossesse Durant l’accouchement fin d’une gros. ou acc.
51 Féminin Non Non Non Non
74 Féminin Non Non Non NonSource :Données de collectées avec PDA
Ce tableau nous montre que les âges au décès dépassent 49 ans, donc les sujets ne sont pas concernés
par les questions suivantes. Comme les questions liées à la fécondité dans la section caractéristiques
individuelles, un filtre devrait être fait à ce niveau. On note aussi un faible taux de réponse à ces
questions (2 décès sur 5).
13
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Comparaison des données de l’application web à celles de la base
L’application web permet de faire le suivi de la collecte avec des tableaux de bords afin de voir
la performance des enquêteurs sur le terrain. Elle sera utilisée principalement par tous les acteurs du
système (Agent recenseur, Superviseur, Contrôleur, Coordonnateur Régional/Départemental, et aussi les
utilisateurs concernés par le RGPHAE). Elle permet aussi d’ajouter ou de modifier des informations d’un
questionnaire via un formulaire web. Elle est composée d’un espace privé et d’un espace public. Elle permet
le contrôle de la collecte, d’afficher la pyramide des âges de la population, d’afficher le tableau de collecte
par DR, le tableau récapitulatif de la population, l’effectif des résidents collectés, les données collectés des
ménages et les téléchargements (de la nouvelle version de l’application mobile, de l’application destinée
aux superviseurs, des manuels des agents recenseurs et du contrôleur, etc.), les transmissions des données
des agents recenseurs vers les superviseurs, des superviseurs vers le département et du département vers
le niveau central et la saisie des questionnaires.
En comparant les valeurs de la base de données et celles de l’application de suivi web,Nous avons noté
un écart notamment en ce qui concerne les résidents présents. Ceci étant du aux erreurs relevées dans la
base, avec des ménages n’ayant pas d’individus, donc pas de résidents présents ou absents.
Table 2.2 – Tableau récapitulatif obtenu à partir de l’application web
Les doubles comptes
Des doubles comptes ont été relevés, On considère comme double compte des individus ayant exacte-
ment les mêmes caractéristiques individuelles dans un noyau (parfois les prénoms diffèrent d’une ou de 2
14
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Table 2.3 – Répartition de la population totale
MASCULIN FEMININ TOTAL
RESIDENT PRESENT(RP) 608 640 1248
RESIDENT ABSENT (RA) 48 22 70
SOUS TOTAL (RP+RA) 656 662 1318
VISITEUR (V) 8 5 13
SOUS TOTAL 2 (RP+V) 616 645 1261
TOTAL (RP+RA+V) 664 667 1331
Source :Données de collectées avec PDA
lettres).
En effet, nous avons relevé 39 doubles comptes internes c’est-à-dire des individus qui ont été enregistrés
deux fois dans un même ménage. Dans le DR 072301110001, nous avons aussi relevé deux ménages de 16
et de 26 individus, qui ont 13 personnes en commun. Au total, nous avons enregistré 52 doubles comptes
(voir annexe). Ceci est sans doute lié à l’impossibilité de supprimer des individus déjà enregistrés. Pour
parer ces genres de problèmes, l’application ne doit pas permettre d’enregistrer dans un même noyau des
individus ayant les mêmes prénoms, noms et âges. En étudiant les doubles comptes, on se rend compte
que beaucoup d’individus ont été enregistrés comme fils du CM dont la mère ne réside pas dans le mé-
nage et fils du CM dont la mère réside dans le ménage. Certains fils du CM ont été enregistrés à la fois
comme enfant non accompagné et enfant accompagné. On peut en déduire qu’il y a une complexité de
l’application ou un manque de maîtrise de l’application de la part des Agents recenseurs.
Le problème des noyaux
Le noyau familial correspond à la famille biologique. Il est composé des parents (ou de l’un d’entre
eux) et de leurs descendants directs (enfants biologiques) non accompagnés. A la tête de chaque noyau
familial, il y a un chef de noyau. Ainsi, un ménage peut être composé d’un ou plusieurs noyaux familiaux.
Toutefois, un ménage polygame comprenant des enfants non accompagnés forme un seul noyau familial
si tous les membres vivent et prennent leurs repas ensemble dans la même concession. Un noyau peut
également comprendre les ascendants directs, les frères et s ?urs, les oncles et tantes, les petits fils, les
neveux, nièces non-accompagnés à la charge du chef de noyau, etc. En somme, la personne accompagnée
et toutes les personnes à sa charge constituent un noyau. L’enregistrement des membres du ménage repose
sur le principe du lien de parenté le plus proche. Ainsi, la première personne à inscrire dans le questionnaire
15
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
est le chef de ménage. Ensuite, on enregistrera les parents proches du CM avant de passer aux parents
éloignés et aux personnes sans lien avec ce dernier, tout en respectant, autant que possible, l’appartenance
de chacun à un noyau familial déterminé. L’ordre proposé est le suivant :
1. le chef de ménage, s’il s’agit d’un homme ;
2. ses enfants non accompagnés dont la mère ne réside pas dans le ménage par ordre décroissant d’âge,
c’est-à-dire en commençant par le plus âgé et en terminant par le plus jeune, et ce, quel que soit le
sexe ;
3. sa première épouse, s’il y a lieu ;
4. les enfants non accompagnés de la première épouse en commençant par le plus âgé et quel que soit
le sexe ;
5. les autres épouses du CM selon le rang s’il y a lieu (1ère, 2ème, 3ème, ainsi de suite) et leurs enfants
non accompagnés ;
6. les autres membres du noyau familial du CM à condition que ces derniers ne constituent pas eux-
mêmes un noyau familial et qu’ils soient sous l’autorité du CM ; il s’agit des ascendants directs du
CM, des parents proche du CM tels que les frères et s ?urs, oncles et tantes, petit-fils, nièces et
neveux, cousins, autres parents, autres personnes sans lien de parenté avec le CM , par exemple
une domestique qui vit dans le ménage ) ; Après le noyau familial du CM vous devez enregistrer les
autres noyaux familiaux dans l’ordre suivant :
7. les noyaux des enfants du CM dont la mère ne réside pas dans le ménage ;
8. les noyaux des enfants par épouse ;
9. les ascendants du CM lorsque ceux-ci forment un noyau familial distinct ;
10. les parents proches (frères et s ?urs, oncles et tantes, petit-fils, nièces et neveux, cousins, autres
parents, etc.) ;
11. les autres noyaux non apparentés au CM mais qui font partie du ménage (domestiques et autres
employés, par exemple).
Nous avons constaté aussi des Chefs de noyaux qui n’ont personne à leur charge. Or, d’après la
définition donnée dans le manuel le nombre de chef de noyau ne doit pas être supérieur aux autres
personnes autrement dit un noyau ne peut être individuel car chaque chef de noyau doit avoir au moins
une personne en sa charge dans le ménage. Dans le manuel, il est dit « est considéré comme chef de noyau
tout individu qui vit dans le ménage avec son enfant non accompagné que la mère vive ou pas dans le
ménage et/ou son épouse. Pour chaque individu ayant répondu à un de ces critères est chef de noyau
16
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
et par conséquent forme avec ces personnes en sa charge un noyau ». Des individus ont été enregistrés
comme étant chef de noyau alors qu’ils n’ont personne à leur charge.
Durée des interviews
La durée d’interview des enquêtes varie en fonction du type de ménage, du nombre d’individus dans le
ménage et de l’agent recenseur. Tous les AR n’ont pas respectés le Canevas de rapport raison pour laquelle
on ne dispose pas de toutes les durées des interviews. Sur 175 ménages, nous n’avons reçu que 34 durées
d’interview. Ainsi on constate que : La durée d’interview d’un ménage agricole de 7 personnes est de 1
heure 30 minutes. Pour les ménages non agricoles, on constate que la durée d’interview des ménages
de 3 et 4 personnes varie entre 20 et 30 minutes, celle des ménages de 5 à 7 personnes entre
40 et 50 minutes. Pour un ménage non agricole, en moyenne la durée d’interview est de 7,5
minutes par individu. Cette moyenne présuppose qu’il y ait ni décès ni migration dans le ménage.
2.3.2 Conclusion de l’étude
En somme, on peut dire que la qualité des données de l’enquête pré test est moyenne. Beaucoup de
contrôles ont été déjà programmées dans l’application de collecte, ceci a considérablement réduits les
erreurs de cohérences qu’on pourrait observer. Beaucoup de filtres ont été également respectés. Cepen-
dant, il convient d’apporter des corrections sur l’application. A cet effet, je suggère que : L’application
permette de supprimer des individus déjà enregistrés. Les AR peuvent bien se tromper en enregistrant
des informations. Pour éviter les doubles comptes, un message bloquant devrait apparaître chaque fois
qu’on enregistre des individus ayant exactement les mêmes caractéristiques individuelles dans un noyau et
si c’est dans un ménage, on envoie un message d’alerte à l’AR pour qu’il vérifie ses informations. Le code
Village Quartier aussi doit être pré chargé et L’AR affecté dans un DR ne doit pas avoir la possibilité de
modifier ce code. J’ai rencontré également des statuts de concession de code 0 alors que ce code n’existe
pas, l’application ne doit pas permettre l’enregistrement de ces erreurs, ces champs devraient être en
rouge jusqu’à ce les informations soient corrigées. Si la concession est habitée et que l’AR n’enregistre pas
de ménage dans la concession un message bloquant doit apparaître afin que l’AR corrige l’incohérence.
Apparemment, la notion des noyaux n’est pas claire chez les agents recenseurs. Quand doit-on créer un
noyau ? Un noyau peut-il être individuel ? Ces questions sont à éclaircir aux AR. Ces derniers confondent
très souvent fils dont la mère réside dans le ménage et fils du CM dont la mère ne réside pas dans le mé-
nage.Les noyaux donnent un recensement plus exhaustif de la population, cependant ils sont complexes. A
cet effet, je propose une alternative, soit on augmente la durée de formation des AR pour qu’ils maîtrisent
parfaitement l’application, soit on supprime les noyaux en demandant dans l’ordre les informations sur
17
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
le CM, les épouses du CM, les fils du CM et les autre membres du ménage. Dans la section décès, si
la femme a moins de 15 ans ou plus de 49 ans, un filtre doit être fait pour certaines variables comme
décès intervenu durant l’accouchement, décès intervenu durant la grossesse ou durant les 42 jours suivant
la grossesse ou l’accouchement. Certains filtres doivent être faits au fur et à mesure des variables, par
exemple celui qui n’a pas renseigné les caractéristiques du logement ne devrait pas le faire pour les biens
d’équipements du ménage. On peut également programmer des messages d’alerte si le nombre de pièces à
usage d’habitation ou le nombre de certains biens d’équipements sont supérieurs au nombre d’individus
dans le ménage, parce qu’il n’est pas raisonnable qu’un ménage de 5 individus ait 10 téléviseurs.Le pré-test
a permis aux équipes techniques et conception de gérer les dysfonctionnements notés dans l’application
et le questionnaire. Après la correction des erreurs notées, une nouvelle version est déployée et devrait
être testée et corrigée avant l’enquête pilote prévue du 25 novembre au 12 décembre 2012.
2.4 Le test de l’application
L’organisation du test de l’application consistait à confier à chaque stagiaire une section ou partie de
section du questionnaire. Les observations du jour était envoyées à Madon Awissi SALL qui elle à son
tour les sélectionnées avant de les envoyer aux développeurs. Les observations sont les différences notées
entre ce qui est programmé dans l’application et ce qui est prévu dans le manuel de spécification des
contrôles. J’ai fait le test sur la section « Caractéristiques individuelles », plus précisément de la variable
B15(adresse il y a 10 ans) à B48(la fin). Au cours de ce test, j’ai eu à relever les erreurs suivantes :
r Lorsqu’on enregistre un fils du CM vivant dans le ménage. A la question survie des parents, on
demande si ses parents sont encore en vie alors que l’un des parent est le CM. on constate qu’aucun
contrôle n’est fait.
r J’ai enregistré un CM âgé de 60 ans qui fréquente l’école française et qui est en petite section. Pour
la petite section, moyenne section et grande section, les bornes supérieures ne sont pas fixées.
r J’ai enregistré un enfant de 20 ans qui est au CM2 et qui a le BAC. Les contrôles sur le plus haut
diplôme obtenu ont été faits en fonction de l’âge. En principe, ce contrôle devait être fait en fonction
de la dernière classe fréquentée. Par exemple un individu de 20 ans peut bien avoir le bac à condition
qu’il atteigne au moins la classe de terminale.
r J’ai enregistré un individu qui est en troisième, il a le BFEM en français mais qui n’est pas alpha-
bétisé c’est-à-dire ne sait ni lire ni écrire en français. . Comme prévu dans le manuel si l’individu a
un niveau qui dépasse CE 2, elle doit être alphabétisée en français.
18
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
r J’ai enregistré un individu de 20 ans qui fréquente actuellement l’école et qui est occupé. Un message
d’alerte devait être envoyé d’après le manuel de spécification mais aucun contrôle n’apparaît.
r Si on essaie d’enregistrer un individu de 20 ans comme étant retraité. Le message suivant "L’individu
a 20 ans, Retraité/Vieillard ne convient pas" apparaît mais en cliquant sur OK, on se rend compte
que L’application passe à la question B40. Or on devrait donner à L’agent Recenseur la possibilité
de corriger en même temps.
r En enregistrant un individu âgé de 6 ans, l’application nous demande sa situation matrimoniale.
D’après le questionnaire, cette question concerne les individus qui ont plus de 10 ans donc un saut
devait être fait à ce niveau pour les individus de moins de 10 ans.
r Il y a des questionnaires qu’on n’arrive pas à clôturer même si tous les champs sont remplis.
r Pour les individus ayant déjà fréquenté l’école, un contrôle est fait entre l’âge et le niveau d’ins-
truction. Dans le manuel de spécification des contrôles, ce contrôle doit être fait lorsque l’individu
fréquente actuellement l’école. On a essayé d’enregistrer une mère de famille qui s’est arrêté au CM
2 et le message suivant apparait " Cet individu est trop âgé pour être en CM2".
19
Chapitre 3
La documentation des données
d’enquête
La documentation consiste à archiver des données d’enquêtes ou de recensement suivant des normes
internationales recommandées par l’IHSN « International Household Survey Network » (Réseau Interna-
tional des enquêtes sur les ménages). Une bonne documentation présente un certain nombre de caracté-
ristiques. Elle doit décrire les données avec précision. L’information doit être claire afin que les données
soient utilisées correctement. En principe toute information permettant à des utilisateurs d’employer des
ensembles de données de manière effective et correcte doit être conservée et diffusée. Constituer une do-
cumentation est en général un travail long et difficile et pour réduire considérablement cette charge, des
normes internationales ont été mises en place. Ces normes que sont le « Data Documentation Initiative
» DDI et le Dublin Core (DC) fournissent un cadre rigoureux pour organiser le processus de documen-
tation. L’initiative DDI est une tentative visant à établir une norme pour la documentation relative aux
micro-données fondée sur le langage XML. Son but est de fournir un moyen simple d’enregistrer toutes les
caractéristiques saillantes des ensembles de micro-données et de les communiquer à d’autres. L’initiative
DDI offre aux analystes une meilleure connaissance du contenu de ces données car elle fournit des ren-
seignements détaillés pour décrire les ensembles de micro-données de manière aussi précise et exhaustive
que possible.
La norme Dublin Core relative aux méta données repose sur les mêmes principes que la norme DDI. Elle
consiste en un ensemble d’éléments (ou « balises ») organisés de manière à constituer un fichier XML. La
norme Dublin Core comprend deux niveaux généraux et 6 spécifiques. Dans le Toolkit, seuls les éléments
généraux de la norme Dublin Core sont utilisés.
20
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
3.1 La documentation de l’EMSILD
3.1.1 Présentation de l’enquête
Le secteur des bâtiments et travaux publics (BTP) apparaît comme l’une des principales composantes
de l’économie sénégalaise, tant par sa contribution au PIB que par le nombre de personnes qu’il emploie. Ce
segment de l’économie contribue à hauteur de 29,6 pour cent de la valeur ajoutée du secteur secondaire
en 2006 du fait, notamment d’une forte expansion durant ces dernières années liée à la croissance des
investisseurs publics réalisés dans le domaine des infrastructures et à la poussée de la construction de
logement des ménages. L’offre de services immobiliers a connu ces dernières années un renchérissement
du loyer, représentant ainsi un poids important dans le budget des ménages, en particulier ceux de
Dakar. Afin d’apporter des éléments de mesure et d’analyse pertinents sur les déterminants de la flambée
de ces prix, susceptibles d’aider à la prise de décision, l’Agence Nationale de la Statistique et de la
Démographie (ANSD) se propose de mener une étude monographique sur les services immobiliers du
logement dans la région de Dakar. Pour ce faire, il est prévu de mener une enquête auprès des principaux
acteurs intervenant dans le secteur immobilier, que sont : les propriétaires de logements, les locataires,
les promoteurs immobiliers publics et privés, les agences immobilières, les institutions financières qui
interviennent dans le crédit immobilier et les intermédiaires communément appelés « courtiers ».
La documentation de l’enquête
Le Toolkit est composé de 3 outils :
4 Le méta data editor qui permet de créer un projet et de le documenter
4 Le Nesstar Explorer qui permet de lire le projet documenté.
4 Le Report Center qui permet de générer le rapport de la documentation.
4 Le CD Buider qui permet d’élaborer le produit final à diffuser sous forme d’un CD ROM.
Avant toute documentation, il faudra rassembler et organiser tous les documents relatifs à l’enquête. On
devra au préalable créer un dossier qui porte le nom de l’enquête, dans lequel sont créés 3 sous dossiers
comme le montre la figure2.2.
Dans le répertoire Documents sont rangés tous les documents relatifs à l’enquête, on mettra tous les
documents administratifs dans le sous dossier "Administratifs", les rapports dans le sous dossier "Rapport"
et les documents techniques comme les manuels et questionnaires dans le sous dossier "Techniques". Il
faudra ensuite rassembler et préparer les données d’enquête, s’assurer de disposer des dernières versions
des fichiers et les ranger dans le répertoire Données. On distinguera les données brutes des données d’ana-
lyse si nécessaire. Il est recommandé de créer un identifiant unique pour fusionner les fichiers de même
21
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Figure 3.1 – Préalable pour une bonne documentation
structure.
Si l’on dispose du masque de saisie, du dictionnaire de données, du fichier de données ou d’autres pro-
grammes, on les rangera dans le répertoire Programme. On distinguera également les programmes de
saisie et des programmes de Tabulation. Tous les documents disponibles doivent être en format de créa-
tion mais aussi être transformé en PDF et tous les documents en formats papiers doivent être scannés et
mis en PDF.
La documentation avec le méta data editor comprend 5 étapes :
] La description du document ;
] La description de l’étude ;
] La documentation des fichiers et variables ;
] Groupe de variables ;
] Les ressources externes ;
3.1.2 La description du document
Il s’agit de documenter le titre, le producteur, la date de production du document, la version du DDI
(permet aux utilisateurs de savoir s’ils ont la version la plus récente) et le numéro d’identification du
document DDI (Code unique permettant d’identifier le document) comme le montre cette figure.
3.1.3 La description de l’étude
Elle fournit des informations générales sur l’étude. Elle indique comment citer l’étude, les responsables
de la collecte, la compilation et la distribution des données, elle résume le contenu des données, elle donne
des informations sur les méthodes de collecte des données et leur traitement, etc. Elle comprend différentes
22
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Figure 3.2 – Description du document sur Meta data editor
étapes comme le montre cette figure.
Figure 3.3 – Description de l’étude sur Meta data editor
En dessous de chaque champ, des instructions sont fournies permettant ainsi de guider la personne
qui documente l’enquête.
4 on identifie l’étude à partir du titre de l’enquête, du type d’étude et du numéro d’identification.
4 la version de l’étude, il s’agit de la description de la version c’est-à-dire de préciser si les données
sont saisies ou apurées, et de la date de production de l’enquête.
4 cette partie permet d’avoir un aperçu sur l’enquête, Elle concerne le résumé de l’enquête, les types
23
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
de données, et les unités d’analyse.
4 les domaines thématiques : Cette partie facilite la recherche des enquêtes à partir des sujets abordés
et des mots clés.
4 Couverture : il s’agit dans cette partie de renseigner le pays, les zones géographiques et l’unité
géographique (le niveau le plus bas couvert par les données) concernés par l’enquête.
4 Cette partie fournit des informations sur les structures qui ont réalisés l’enquête et sur celles qui
l’ont financée.
4 Échantillonnage : cette partie donne une idée sur la méthode d’échantillonnage, l’écart au plan de
sondage, le taux de réponse et la pondération.
4 Collecte des données : cette partie nous renseigne sur les dates de collecte, les périodes de référence,
le responsable, l’organisation, les difficultés et solutions de la collecte, ainsi que le(s) questionnaire(s)
de l’enquête.
4 Traitement des données : il s’agit dans cette partie de préciser les règles garantissant la cohérence
globale des données. Dans le cas de plusieurs questionnaires, les préciser pour chacun, si opportun.
4 Accès aux données : Cette partie concerne la politique d’accès aux données de la structure respon-
sable de l’enquête. On y spécifie l’autorité qui contrôle l’accès aux données et les conditions d’accès
aux données.
4 Responsabilité et droits d’auteurs : il s’agit dans cette partie de donner des Informations concernant
les responsabilités des utilisateurs lors de l’exploitation des résultats et des données ainsi que les
droits d’auteurs.
4 Contacts : il s’agit des Noms et adresses des personnes responsables de la collecte des données.
Cela correspond à la personne ressource qui sera contacté pour les problèmes ou les questions des
utilisateurs. L’attribut e-mail est utilisé pour indiquer une adresse e-mail d’un contact.
3.1.4 La documentation des fichiers de données
Une documentation peut contenir un ou plusieurs fichiers de données. L’enquête EMSILD est composée
de 6 questionnaires et chaque questionnaire de plusieurs fichiers de données. La documentation d’un fichier
de donnée comprend 4 parties :
4 La description du fichier : Les éléments de ce groupe donnent des informations de base sur chaque
fichier de données. Il s’agit de décrire le contenu du fichier, le producteur des données, la version
des données, les valeurs manquantes et les notes s’il en existe.
24
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
4 Les variables clés et relation : La plupart des études comporte des fichiers interdépendants, ce
groupe vise à définir les relations entre les fichiers. Pour le cas de l’EMSILD les questionnaires sont
indépendants et donc ce champ n’est pas rempli.
4 Les variables : Cette partie donne une description plus détaillée sur la variable. Elle comprend 3
sous parties que sont la description de la variable, la description de la question et les imputations
et construction de variables.
4 La saisie des données : Ce groupe d’éléments est utilisé pour saisir les méta données liées à chaque
variable.
3.1.5 Les groupes de variables
Les fichiers de données peuvent contenir des centaines de variables. L’éditeur de méta données fournit
un outil pour regrouper ces variables. Leur regroupement permet de parcourir plus rapidement des listes
de variables et de guider l’analyse en indiquant quels éléments d’un ensemble de données sont reliés
conceptuellement. Les groupes de variables servent aussi à créer la section Dictionnaire de données pour
les projets diffusés à l’aide du Créateur de CD-ROM. Pour le cas de notre enquête, les variables sont
regroupées comme suit :
Figure 3.4 – Les groupes de variables sur méta data éditor
25
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
3.1.6 Les ressources externes
La section des ressources externes fournit une liste des ressources telles que des documents (manuels,
questionnaires, rapports techniques et analytiques), des programmes d’ordinateur (saisie de données, édi-
tion, tabulation, analyse), des photos et des cartes associés à l’étude et elle en donne une description. Les
ressources de même nature doivent être regroupées dans un répertoire.
La documentation est un travail qui est généralement réalisé en équipe, cependant elle requiert une cer-
taine connaissance en statistique. Pour s’assurer qu’on a bien documenté l’étude, on validera les méta
données, les ressources externes, les relations entre les fichiers de donnée et les variables. Après la docu-
mentation de l’étude sous le méta data editor, on pourra lire l’étude avec de l’outil Nesstar.
Dans le menu Documentation, on exportera le DDI et le DC vers le répertoire initial, ensuite on génère
le rapport de l’étude à l’aide de l’IHSN report Center contenu dans le menu outil.
3.2 L’atelier de perfectionnement
3.2.1 Objectifs et résultats attendus
Dans le cadre du Programme Statistique Accéléré (PSA) s’est tenu l’atelier de formation en archivage
de données, du 27 au 31 Août 2012 à Saly-Mbour. Cet atelier a permis à l’Agence Nationale de la
Statistique et de la Démographie (ANSD) et aux structures du Système Statistique National (SSN)
impliquées dans le programme (Agriculture, Eaux et Forêts, Pêche, Education et Sécurité alimentaire) de
revisiter l’outil Toolkit pour la documentation et l’archivage des données et la plateforme Nada pour la
dissémination. Le PSA est un programme qui a été initié au Sénégal en avril 2007 et qui cible l’ensemble
des structures productrices de données statistiques. Dans le cadre de ce projet, plusieurs ateliers ont été
organisés par l’ANSD et avec le concours technique et financier de la Banque Mondiale pour la mise à
niveau des agents en charge de l’archivage et de la documentation dans les différentes structures engagées
dans le programme. Cet atelier, organisé conjointement par l’ANSD et l’Organisation de la Coopération
et du Développement Economiques (OCDE), a pour principal objectif de renforcer les capacités en termes
de bonnes pratiques en matière de documentation et d’archivage des données d’enquête. L’atteinte de cet
objectif passe par la redynamisation de la documentation des enquêtes à travers la désignation des points
focaux au niveau des différents services producteurs impliqués et leur mise à niveau sur le processus et
les outils utilisés (Toolkit et NADA). Les principaux résultats attendus de cet atelier sont :
\ Les agents en charge de la documentation des enquêtes sont formés sur le processus ;
\ Les enquêtes ciblées sont documentées et mises en ligne ;
26
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
\ Les points focaux des autres structures sont désignés.
3.2.2 Les travaux effectués
Au cours de cet atelier, les participants ont travaillé en binôme et chaque binôme était tenu de docu-
menter une enquête à la fin du séminaire. En ce qui nous concerne, nous devions documenter l’Enquête
sur la Vulnérabilité enfants, des Interventions et des Besoins des Acteurs (DVEIBA). Cette enquête est
composée de deux questionnaires : un questionnaire enfant et un questionnaire ménage. Avant cet atelier,
j’avais eu à documenter l’EMSILD et c’était l’occasion pour moi d’éclaircir certains points et de perfec-
tionner les techniques déjà acquises.
Nous avions également appris de nouvelles techniques dont les plus importantes :
4 La fusion des bases de données avant de commencer la documentation : Lorsque les fichiers d’un
questionnaire sont de même structure, il convient de les fusionner avant de commencer à documenter
l’étude. Dans notre cas, on disposait des fichiers de données par section mais la création d’un
identifiant nous a permis de fusionner les fichiers du questionnaire enfant et ceux du questionnaire
ménage avec le logiciel SPSS.
4 La notion de référence absolue et référence relative : Dans la partie ressources externes, le lien de
la ressource doit être relatif. Ceci permettra d’ouvrir le lien dans un autre ordinateur.
4 Les dépôts de variables : ils permettent de faciliter le travail de documentation et d’éliminer les
erreurs d’incohérences. Il s’agit de créer un catalogue de variables et de l’appliquer aux variables
qui ont les mêmes modalités.
4 L’élaboration du produit final à diffuser sur internet avec l’outil NADA. L’animateur a présenté
l’outil NADA portable, et nous avons suivi avec lui toutes les étapes de l’élaboration du produit à
diffuser sur le net.
4 Les bonnes pratiques d’archivage : il s’agit des préparations, de l’organisation des fichiers et tech-
niques de documentation notamment les dix étapes à suivre pour une bonne présentation des ar-
chives.
4 La distinction de la date de production contenue dans la partie description du document et celle
contenue dans la partie documentation de l’étude. C’est-à-dire la date de production de la docu-
mentation (la 1ère) et celle de l’enquête (la deuxième).
4 Avec ces nouveaux acquis, nous avons documenté l’enquête sur la Vulnérabilité des enfants, l’inter-
vention et le besoin des acteurs et avons élaboré le produit final avec NADA. Après l’atelier nous
27
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
avons corrigé les documentations réalisées avant l’atelier de Saly en fonction des techniques acquises.
Au final, nous avons documenté deux enquêtes que sont l’EMSILD et la DVEIBA.
28
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
L’apport du stage
Ce stage d’immersion a été riche de découvertes et d’enseignements, il nous a permis aussi d’observer
le fonctionnement d’un institut National de Statistique comme l’ANSD.
Il nous a offert l’occasion de participer aux activités du recensement général de la population (activité
qui se répète tous les dix ans). La particularité de cette édition est l’utilisation des PDA comme moyens
de collecte pour la première fois au Sénégal.
Au cours de collecte des données, dispensé par Monsieur Dansokho, nous avons décrit les différents moyens
de collecte, leurs avantages et leurs inconvénients.
A travers cette activité, plus précisément l’étude de la qualité des données, j’ai constaté l’avantage des
PDA sur les questionnaires papiers en termes de cohérence de réponses, de respect des filtres et saut. Avec
les questionnaires papiers, l’exploitation des données auraient pris beaucoup plus de temps à cause des
opérations de saisie.
Toujours dans cette activité, j’ai participé à l’enquête pré-test comme assistant des superviseurs. En
confrontant la réalité du terrain, j’ai constaté la difficulté de réaliser des recensements fiables dans des
pays comme le Sénégal. Bien que le pré test avait pour vocation de tester le dispositif informatique, nous
avons assisté à des refus de réponse et à d’autres problèmes auxquels confrontaient les agents recenseurs.
Ce stage m’a permis également de maitriser le logiciel d’archivage Toolkit, qui est un outil indispensable
pour la diffusion des données d’enquête. L’atelier de perfectionnement organisé à Saly a été une bonne
expérience puisqu’il nous a permis d’observer le déroulement d’une telle activité et d’échanger avec des
personnes de diverses structures.
J’ai constaté qu’en entreprise, le travail d’équipe prédomine et exige certaines qualités comme la sociabi-
lité, l’ouverture d’esprit, la rigueur entre autres. Ce stage est très instructif du point de vue organisation
et fonctionnement de l’agence. Les 4 directions de l’agence sont interdépendantes, par exemple la DMIS
gère les traitements et les documentations des enquêtes réalisées par la DSECN et la DSDS. Des activités
comme le recensement sollicitent toutes les divisions.
Au cours de ce stage, nous avons constaté le rôle essentiel que jouent les structures de Statistique comme
l’ANSD au Sénégal. La connaissance des certains indicateurs est indispensable pour les prises de décision
économiques et sociales.
Le stage s’est déroulé dans de très bonnes conditions, la seule difficulté que j’ai eu à rencontrer est le
manque d’encadrement à un certain moment. Après avoir rédigé mon rapport d’étude sur la qualité des
données, aucune suggestion n’a été faite, il a fallu attendre la reprise de Madame Madon AWISSI SALL
(qui était en congé) pour le corriger.
29
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Conclusion
Du 09 juillet au 14 septembre, j’ai effectué mon stage de validation de deuxième année d’étude en
formation d’Ingénieur des Travaux Statistiques. Comme son nom l’indique, ce stage de découverte nous
a permis d’observer le fonctionnement d’un Institut National de Statistique et de voir le rôle de chaque
division au sein de l’ANSD. Au cours de ce stage au BTDE (Bureau des Traitements des Données d’En-
quête), nous avons travaillé sur la préparation du Recensement Général de la Population de l’Agriculture
de l’Elevage notamment sur l’enquête pré test et le test de l’application. Nous avons également travaillé
sur l’archivage des données de l’EMSILD et la DVEIBA. Ce stage reste un excellent souvenir et constitue
désormais une expérience professionnelle valorisante et encourageante pour l’avenir.
30
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Bibliographie
Cours de Techniques d’expressions,El haji SECK Comment Rédiger et soutenir un rapport de stage,
2012.
ANSD,Manuel de l’agent recenseur, 2012.
ANSD,Manuel d’utilisation de l’application web, 2012.
IHSN,Microdata Management Toolkit, 2006. www.surveynetwork.org/Toolkit
32
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
Table 3.1 – Liste des doubles comptesIDDR N̊ conc N̊ Mén PRENOM NOM Lien avec le CN Age
72301110001 3 1 NENE DIALLO 2 60
72301110001 3 1 NENE DIALLO 2 60
72301110001 7 1 NENE DIALLO 2 60
72301110001 3 1 AISSATA GUISSE 2 65
72301110001 3 1 AISSATOU GUISSE 2 65
72301110001 7 1 AISSATOU GUISSE 2 65
72301110001 3 1 NDEYE MBAYE 2 49
72301110001 7 1 NDEYE MBAYE 2 49
72301110001 3 1 ALASSANE SECK 3 36
72301110001 3 1 ALASSANE SECK 3 36
72301110001 7 1 ALASSANE SECK 3 36
72301110001 3 1 COUMBEL SECK 3 31
72301110001 3 1 COUMBL SECK 3 31
72301110001 7 1 COUMBEL SECK 3 31
72301110001 3 1 DIAGA SECK 3 11
72301110001 7 1 DIAGA SECK 3 11
72301110001 3 1 GNEUP GUERE SECK 3 22
72301110001 7 1 GNEUP GUERE SECK 3 22
72301110001 3 1 MAMADOU SECK 3 29
72301110001 7 1 MAMADOU SECK 3 29
72301110001 3 1 NDEYE ISSEU SECK 3 15
72301110001 7 1 NDEYE ISSEU SECK 3 15
72301110001 3 1 SAMBA SECK 3 25
72301110001 3 1 SAMBA SECK 3 25
72301110001 7 1 SAMBA SECK 3 25
72301110001 3 1 SOULEYMANE SECK 3 19
72301110001 7 1 SOULEYMANE SECK 3 19
14301110008 3 1 AWA GUEYE 3 24
14301110008 3 1 AWA GUEYE 3 24
14301110008 3 1 KANGUE GUEYE 3 25
14301110008 3 1 KANGUE GUEYE 3 25
33
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
IDDR N̊ conc N̊ Mén PRENOM NOM Lien avec le CN Age
14301110008 3 1 KINE GUEYE 3 22
14301110008 3 1 KINE GUEYE 3 22
14301110008 6 1 ASSANE KHOLL 3 0
14301110008 6 1 ASSANE KHOLL 3 0
14301110008 6 1 MOMAR KHOLL 4 39
14301110008 6 1 MOMAR KHOLL 1 39
14301110004 6 1 ABDOULAYE NIKHOR BOB 1 39
14301110004 6 2 ABDOULAYE NIOKHOR BOB 1 39
14301110006 2 1 GUENEBA TALL 3 22
14301110006 2 1 GUENEBA TALL 1 22
11301220006 1 1 LIKA NGUEYE 2 32
11301220006 1 1 LIKA NGUEYE 2 32
11301220006 1 1 AMINATA SIDIBE 3 7
11301220006 1 1 AMINATA SIDIBE 3 7
11301220006 1 1 PAPE ALIOUNE SIDIBE 3 5
11301220006 1 1 PAPE ALIOUNE SIDIBE 3 5
72301110003 4 1 FALLOU NDIAYE 3 11
72301110003 4 1 FALLOU NDIAYE 3 11
72301110007 2 1 MAMADOU MOUSTAPHA DIOUF 2 28
72301110007 2 1 MAMADOU MOUSTAPHA DIOUF 1 28
72301110007 2 1 ASTOU FALL 7 19
72301110007 2 1 ASTOU FALL 3 19
72301110007 2 1 DIOBA FALL 7 20
72301110007 2 1 DIOBA FALL 3 20
34
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
IDDR N̊ conc N̊ Mén PRENOM NOM Lien avec le CN Age
72301110007 2 1 NDEYE MAREME NDIAYE 1 24
72301110007 2 1 NDEYE MAREME NDIAYE 2 24
14301110001 6 1 ABLAYE DIENE 3 25
14301110001 6 1 ABLAYE DIENE 1 25
14301110001 6 1 AMET DIENE 1 32
14301110001 6 1 AMETH DIENE 6 32
14301110001 6 1 DEMBA DIENE 3 27
14301110001 6 1 DEMBA DIENE 1 27
14301110001 6 1 MAIMOUNA DIENE 1 34
14301110001 6 1 MAIMOUNA DIENE 6 34
14301110001 6 1 NDEYE BAHAO DIENE 1 30
14301110001 6 1 NDEYE BAHAO DIENE 6 30
14301110001 6 1 SEYDOU DIENE 3 21
14301110001 6 1 SEYDOU DIENE 1 21
14301110002 5 1 OUSMANE DIEDHOU 7 18
14301110002 5 1 OUSMANE DIEDOU 6 16
14301110010 9 1 MAMADOU SYLLA 7 18
14301110010 9 1 MOUHAMMADOU SYLLA 3 18
72203020001 9 2 KENE TINE 3 25
72203020001 9 2 KENE TINE 1 25
72203020003 7 1 YANGANE TINE 4 38
72203020003 7 1 YANGANE TINE 1 38
72203020006 1 1 THERESE SATOU DIOP 7 2
72203020006 1 1 THERESE SATOU DIOP 3 2
72203020006 1 1 JEAN MAGUETTE NDIR 7 34
72203020006 1 1 JEAN MAGUETTE NDIR 1 34
72203020008 1 1 IVONE TINE 0 13
72203020008 1 1 IVONE TINE 1 14
72301110001 5 1 NDIAWAR DIOP 6 12
72301110001 5 1 NDIAWAR DIOP 3 16
72301110003 3 1 MOUSSA DIOP 3 42
72301110003 3 1 MOUSSA DIOP 3 42
35
Exploitation des données de l’enquête pré pilote du RGPHAE 2012
IDDR N̊ conc N̊ Mén PRENOM NOM Lien avec le CN Age
72301110003 4 1 FALLOU NDIAYE 3 11
72301110003 4 1 FALLOU NDIAYE 3 11
72301110003 5 1 AMIE NGOM 1 45
72301110003 5 1 AMIE NGOM 1 45
72301110007 2 1 MAMADOU MOUSTAPHA DIOUF 2 28
72301110007 2 1 MAMADOU MOUSTAPHA DIOUF 1 28
72301110007 2 1 ASTOU FALL 7 19
72301110007 2 1 ASTOU FALL 3 19
72301110007 2 1 DIOBA FALL 7 20
72301110007 2 1 DIOBA FALL 3 20
72301110007 2 1 NDEYE MAREME NDIAYE 1 24
72301110007 2 1 NDEYE MAREME NDIAYE 2 24
72301110008 4 1 BIRAME SYLLA 3 23
72301110008 4 1 BIRAME SYLLA 1 23
36