+ All Categories
Home > Documents > Exploitations données

Exploitations données

Date post: 22-Jan-2023
Category:
Upload: ensae
View: 0 times
Download: 0 times
Share this document with a friend
37
République du Sénégal Un peuple-Un but-Une foi Ministère de l’Economie et des Finances Agence Nationale de la Statistique et de la Démographie Rapport de stage Exploitation des données de l’enquête pré pilote du RGPHAE 2012 Rédigé par : Adama M LO Elève Ingénieur Statisticien Encadreur : Madame Madon AWISSI SALL Experte en Traitement des données d’enquête 09 Juillet-14 Septembre 2012
Transcript

République du SénégalUn peuple-Un but-Une foi

Ministère de l’Economie et des Finances

Agence Nationale de la Statistique et de la Démographie

Rapport de stage

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Rédigé par :

Adama M LO

Elève Ingénieur Statisticien

Encadreur :

Madame Madon AWISSI SALL

Experte en Traitement

des données d’enquête

09 Juillet-14 Septembre 2012

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Remerciements

Tout d’abord, je tiens à remercier mon maître de stage, Monsieur Oumar Fall, Chef de Division des

bases de données et des systèmes d’information pour son accueil.

Je remercie tout particulièrement Madame Madon Awissi SALL, Madame Mary Sow THIAM et Monsieur

Ibrahima DIOP qui m’ont encadrés et accompagnés tout au long de cette expérience professionnelle.

Je remercie également mes camarades stagiaires avec qui j’ai pu échanger des idées et travailler de ma-

nière efficace et sympathique ainsi que tout le personnel de la Direction de Management de l’Information

Statistique(DMIS).

1

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Sigles et Abréviations

ACP :Agence comptable

AR : Agent Recenseur

BTDE :Bureau de Traitement des Données d’Enquête

DAGRH :Direction de l’Administration Générale et des Ressources Humaines

DSECN :Direction des Statistiques Économiques et de la Comptabilité Nationale

DSDS :Direction des Statistiques Démographiques et Sociales

DMIS :Direction du Management de l’Information Statistique

DVBEIA : Diagnostic sur la Vulnérabilité des Enfants, de l’Intervention et des Besoins des Acteurs

EMSILD :Enquête Monographique sur les Services de Logement à Dakar

INS :Institut National de Statistique

PDA :Personal Digital Assitant

RGPHAE : Recensement Général de la Population et de l’Agriculture

2

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Avant propos

La formation des Ingénieurs des Travaux Statistiques s’étend sur 4 ans et comprend des cours théo-

riques, des stages pratiques et des enquêtes sur le terrain. A la fin de la deuxième année, l’élève ITS

effectue obligatoirement un stage d’immersion de 2 mois dans l’Institut National de Statistique de son

pays. Ce stage lui permet d’une part de se familiariser avec son futur milieu professionnel et d’autre part

de mettre en pratique les connaissances théoriques acquises au cours de ces deux années de formation.

A la fin du stage, le stagiaire doit rédiger un rapport qu’il défendra devant un jury. Ce présent rapport

s’inscrit dans ce cadre.

Conformément à ma demande, j’ai été affecté à la DMIS (une des 5 directions de l’agence Nationale de la

Statistique et de la Démographie). J’ai effectué le stage du 09 Juillet au 14 Septembre 2012 au Bureau de

traitement de données d’enquête (BTDE). Plus largement, cela a été l’occasion, d’observer le fonctionne-

ment d’un institut comme l’ANSD, son organisation structurelle et les relations entre les départements. Il

nous a également permis de comprendre l’importance et l’apport des INS dans un pays comme le nôtre,

vu le besoin accru des données fiables et l’importance des indicateurs socioéconomiques.

3

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Introduction

Au cours de ce stage au Bureau des Traitements des Données d’Enquête (BTDE), j’ai travaillé es-

sentiellement sur deux activités que sont la préparation du Recensement Général de la Population, de

l’Habitat, de l’Agriculture et de l’Elevage 2012 et l’archivage des données d’enquêtes.

Dans le cadre de l’organisation du Recensement Général de la Population de l’Habitat de l’Agriculture et

de l’Elevage (RGPHAE), j’ai eu l’occasion de participer à l’enquête pré test du RGPHAE et d’analyser la

qualité des données issues de cette enquête. Cette analyse a pour but de vérifier la cohérence des données

collectées avec les PDA (Personal Digital Assistant, ce sont des microordinateurs de poche). Le rapport

de cette analyse a permis de déceler certaines erreurs et d’améliorer l’application de collecte. Une fois

l’application améliorée, j’ai aussi participé au test de la nouvelle version déployée sur les PDA.

La seconde activité est la documentation d’enquêtes avec le logiciel d’archivage des données d’enquête

Micro data Management Toolkit. Dans le cadre de cette activité, nous avons eu à participer à un atelier de

perfectionnement sur les techniques d’archivage des données d’enquête. J’ai eu à documenter 2 enquêtes

que sont l’Enquête Monographique sur les Services du Logement à Dakar (EMSILD) et l’Enquête sur le

Vulnérabilité des Enfants de l’intervention et des besoins des acteurs (DVEIBA).

Ce présent rapport sera organisé en deux parties et chaque partie fera l’objet d’une activité.

4

Chapitre 1

Présentation de la structure d’accueil

L’agence Nationale de la Statistique et de la Démographie(ANSD) est une structure administrative

créée par la loi N2004-21 du 21 juillet 2004 portant organisation des activités statistiques. Elle est or-

ganisée par le décret N̊ 2005-436 du 23 Mai 2005, placée sous l’autorité du Ministre de l’Economie et

des Finances, elle est dotée de la personnalité juridique et d’une autonomie de gestion. Elle est chargée

d’assurer la coordination technique des activités du Système Statistique National et de réaliser elle-même

les activités de production et de diffusion des données statistiques pour les besoins du gouvernement, des

administrations publiques, du secteur privé, des partenaires du développement et du public.

En d’autres termes, elle est chargée de :

4 Veiller à l’élaboration et à la mise en ?uvre des programmes pluriannuels et annuels d’activités

statistiques ;

4 Assurer la mise en application des méthodes, concepts, définitions, normes, classifications et nomen-

clature approuvés par le comité technique des programmes statistiques ;

4 Réaliser des enquêtes d’inventaire à couverture nationale notamment les recensements générales de

la population et les recensements d’entreprises ;

4 Produire les comptes de la nation

4 Suivre la conjoncture et la prévision statistique,élaborer les indicateurs économiques, sociaux et

démographiques ;

4 Suivre la coopération technique internationale en matière statistique.

4 Promouvoir la formation du personnel spécialisé pour le fonctionnement du système national d’in-

formation statistique par l’organisation des cycles de formation appropriés notamment au sein d’une

école à vocation régionale ou sous régionale intégrée à l’agence

5

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

4 Favoriser le développement des sciences statistiques et la recherche économique appliquée relevant

de sa compétence ;

4 Centraliser et diffuser les synthèses des données statistiques produites par l’ensemble du système

statistique national ; Élaborer et de gérer les fichiers des entreprises et des localités ;

4 Assurer le secrétariat et l’organisation des réunions du Conseil National de la statistique et du

comité technique des programmes statistiques ainsi que de ses comités sectoriels ;

4 Préparer des dossiers à soumettre aux réunions du conseil national de la statistique et du comité

technique des programmes statistiques ;

L’agence est en outre chargée de suivi de la coopération technique internationale en matière de statis-

tique. A ce titre, elle représente le Sénégal dans les réunions sous régionales, régionales et internationales

relatives aux questions relevant de sa compétence et suit les activités des organisations internationales

en ce qui concerne les questions statistiques. L’agence peut entreprendre, à la demande du gouvernement

et des administrations publiques et privées, des études et recherches sur les questions statistiques, écono-

miques et sociales à titre onéreux ou gracieux dans les conditions définies par le conseil d’orientation. De

tels travaux donnent lieu à la signature de contrats de service ou de protocole d’accord entre l’agence, le

commanditaire de tels travaux, et éventuellement les bailleurs de fonds.

L’ANSD est une structure administrative dotée de la personnalité juridique et d’une autonomie de ges-

tion. Placée sous la tutelle du ministère de l’économie et des finances, elle est administrée par le conseil

de surveillance, un organe de délibération composé de neuf membres nommés par décret pour une durée

de 2 ans renouvelable sur proposition du ministre de tutelle. C’est le CS qui définit et oriente la politique

générale de l’ANSD. Celle-ci est donc dirigé par un Directeur Général nommé par décret qui est quant

à lui assisté par un Directeur Général Adjoint également nommé par décret. Outre la direction générale,

l’agence se compose de services centraux et de subdivisions au niveau régional. L’ensemble est organisé

en Cellules, Directions, Divisions, Bureaux et Services :

La Cellule de Programmation, d’Harmonisation de Coordination Statistique et de Co-

opération Internationale (CPCCI) :

Elle appuie le directeur général à la préparation des dossiers relatifs au Conseil National de Statistique

et au comité techniques des programmes statistique, notamment la préparation des sessions de ces organes

et commissions et groupes de travail qu’ils mettent en place, du suivi de l’exécution de leurs décisions, etc.

Elle assure également le suivi de la coordination du système statistique en animant notamment, les secré-

tariats du conseil national de la statistique et du conseil des programmes statistiques ; la coordination des

6

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

concepts et des nomenclatures ainsi que les comparaisons méthodologiques internationales. Placée sous la

supervision directe du Directeur Général Adjoint, la CPCCI compte 2 unités :

– L’unité de programmation et de coordination statistique.

– L’unité d’harmonisation et de coopération internationale

Les Directions : Au niveau central, l’ANSD comprend 6 unités centrales :

– Direction des Statistiques Économiques et de la Comptabilité Nationale(DSECN) :

Elle est chargée d’établir des statistiques économiques globales et les comptes nationaux. Elle est

composée de la Division des Statistiques Économiques, de la Division des Statistiques Conjonctu-

relles et de la Division de la Comptabilité Nationale et des Études Analytiques.

– Direction des Statistiques Démographiques et Sociales(DSDS) :

Elle est chargée de la conception, de l’exécution et de l’analyse des enquêtes et recensements démo-

graphiques et socioéconomiques auprès des ménages. Elle traite et centralise les fichiers reprenant

les copies des actes d’état civil reçues et saisies au niveau régional. Elle est composée de la Division

du Recensement et des Statistiques Démographiques, de la Division des Statistique Sociales, du

suivi des conditions et de Pauvreté et de la Direction des Opérations de Terrain.

– Direction du Management de l’Information Statistique(DMIS) :

Elle est chargée d’assurer la mise à disposition d’un système d’information efficient pour l’ensemble

des activités de l’ANSD ; d’organiser et de piloter le développement des compétences informatiques

du personnel de l’ANSD ; de constituer des bases de donner exhaustives et fiables pour les activi-

tés de l’ANSD ; d’assurer l’administration des réseaux informatiques et des bases de données ; de

superviser l’acquisition ou le développement d’applications informatiques ; d’assurer le traitements

et la sauvegarde des données d’enquête, de gérer la cartographie censitaire et le système d’informa-

tion statistique ; d’organiser la gestion du savoir ; de gérer le centre de documentation et d’assurer

la conservation des archives ; d’assurer le contrôle de qualité de l’impression des publications ; de

définir la politique de diffusion et d’organiser la diffusion des données produites ; gérer les relations

avec les usagers de la statistique et de promouvoir la culture statistique au sein de la société. Elle

est composée de la Division de la Documentation, de la diffusion et des Relations avec les Usagers

et de la Division des Systèmes d’informations et des Bases de Données nationales.

– Direction de l’Administration Générale et des Ressources Humaines (DAGRH) :

La DAGRH est chargée de la gestion du personnel et des compétences de l’agence, d’assurer la sécu-

rité de l’agence sur toutes les questions juridiques et réglementaires, d’assurer l’approvisionnement

de l’agence et la gestion de la logistique et du matériel. Elle gère les stocks de l’agence.

7

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

– Agence comptable (ACP) : L’ACP assure la gestion des moyens financiers. Elle tient la comp-

tabilité des deniers de l’agence selon le système de comptabilité en vigueur, veille à la disponibilité

d’une bonne information financière fiable, à temps et régulière. Elle supervise l’élaboration de la

comptabilité matière de l’agence.

– Direction chargé de L’ENSAE-Sénégal :

Il est chargé de préparer les dossiers de l’école. A cet égard, il est chargé d’animer les groupes de

travail mis en place à cet effet. Il est également chargé de mettre en ?uvre le programme intérimaire

défini pour la poursuite des activités de formation en cours. Il assure la supervision et l’évaluation

des personnels mis à la disposition du Département de Statistique de l’Ecole Nationale d’Economie

Appliquée, transférée à l’ANSD.

Au niveau régional, l’ANSD comprend 14 services régionaux de la Statistique et de la Démographie.

8

Chapitre 2

L’enquête pré pilote du RGPHAE 2012

Le recensement général de la population est une opération importante car elle permet d’avoir une

photographie de la population et de ses caractéristiques. Tous les 10 ans, le Sénégal en tant que Pays

en développement doit faire un recensement de sa population comme le préconise les Nations Unies. Il

y a eu ceux de 1976, de 1988 et de 2002 qui n’ont pas respectés ce délai prescrit à cause des problèmes

de financement. A ce jour, doit se réaliser dans l’année en cours (2012) le recensement général de la

population, de l’habitat, de l’agriculture et de l’élevage (RGPHAE).

2.1 Contexte et Objectifs

Le recensement est un long processus qui demande beaucoup de sérieux et de méthodologie. En effet,

il rassemble le document de projet c’est-à-dire le plaidoyer, le document technique, le plan de communi-

cation, la cartographie, le dénombrement et la recherche de financement. Pour ce faire, il y aura l’enquête

pilote d’ici au mois d’octobre qui permettra de confronter la réalité du terrain avec le processus du recen-

sement.

L’innovation concerne l’ajout des sections telles que l’agriculture et l’élevage, et le plus important, l’uti-

lisation des PDA comme moyen de collecte.

Pour mettre en ?uvre cela, une application de collecte a été développée et le besoin de la tester s’est fait

sentir. L’objectif de cette enquête est de :

\ Tester les applications informatiques à savoir l’application de collecte sur PDA, l’application du

superviseur, l’application départementale et la base de données.

\ Déceler les erreurs applicatives et les incohérences.

\ Corriger les erreurs.

9

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

\ Estimer la durée des interviews.

\ Avoir une meilleure maitrise de la charge de travail des agents recenseurs et des autres acteurs.

En effet, étant le point focal du recensement, il fallait s’assurer que l’application est fidèle au questionnaire

et qu’elle réduit le risque d’erreurs et d’incohérences. Le test de l’application a donc été programmé le

weekend du samedi 14 et du dimanche 15 juillet 2012.

2.2 L’enquête pré test

Avant de démarrer l’enquête proprement dite, une formation a été organisée pour permettre aux agents

recenseurs de se familiariser avec les deux outils de collecte à savoir le PDA et le questionnaire papier.

Elle a été prévue pour une durée de trois jours : du mardi 10 au jeudi 12 juillet 2012. Pour le premier

jour, tous les acteurs concernés se sont réunis pour faire une présentation générale du RGPHAE. A la

fin de chaque journée, des réunions de débriefing réunissaient les agents de la DSDS et de la DMIS. Au

cours de ces réunions, les différents contrôleurs et superviseurs discutaient des problèmes rencontrés avec

l’application durant la journée.

Pour la préparation de cette enquête 40 étudiants de l’ENSAE ont été recrutés à l’ANSD. Ces derniers

sont organisés en 8 équipes de 5, soit deux équipes pour chaque quartier. L’enquête a eu lieu les samedi 14

et dimanche 15 Juillet 2012 et concernait 40 DR des quartiers et village de Biscuiterie (Dakar), Parcelles

assainies Unité 6 (Dakar), Médina Fall (Thiès) et Lalane (Thiès). J’ai participé à cette enquête comme

assistant de Monsieur Pape Demba Diouf, superviseur dans le quartier de Biscuiterie. Les problèmes les

plus récurrents que rencontraient les agents recenseurs sur le terrain sont les suivants :

– Indisponibilité des enquêtés : Nombre d’interviews sont interrompus faute d’indisponibilité des en-

quêtés. Souvent les enquêtés affirment qu’ils n’ont pas de temps et reportent l’interview à une date

ultérieure.

– Refus : Certains enquêtés refusaient de répondre à certaines questions parce que les trouvant gê-

nantes (le nombre d’enfants, les noms des enfants, la formulation de certaines questions, etc.)

– Nombre de chargeurs insuffisants : J’ai assisté à des décharges fréquentes et simultanées des PDA,

les agents recenseurs chargeaient leurs PDA à tour de rôle et cela leur a fait perdre du temps.

– Différence entre ce qu’ont relevé les cartographes et ce qui est trouvé sur le terrain : Par exemple, lors

de la cartographie des bureaux ont été enregistrés comme des ménages ; Dans certains immeubles,

le nombre de ménages a été surestimé ...

10

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

En principe avant le recensement, une phase de concrétisation devrait être effectuée, cette activité permet

de mettre à jour les données relevées par les cartographes, donc à contrôler les changements pouvant

survenir entre temps (déménagement, aménagement, destruction d’habitation, etc.). Cette activité n’a

pas été effectuée car le test du dispositif informatique était la principale raison de l’enquête.

J’ai aussi assisté aux transferts des données des PDA vers les machines des superviseurs et à la remontée

des données vers le niveau central.

2.2.1 Les problèmes liés à l’application

Chaque agent recenseur était tenu de rendre un rapport suivant un canevas, dans lequel il précisera le

nombre de questionnaires collectés, les durées des interviews, les durées des interruptions, les problèmes

rencontrés et les recommandations. Ainsi mes camarades stagiaires et moi avons reçu et compilé 50

rapports des agents recenseurs. Au lendemain de cette enquête, un débriefing a été organisé permettant

aux agents recenseurs de faire part des difficultés rencontrées liées à l’application. Le rapport final révèle

que les problèmes les plus rencontrés par les agents recenseurs sont :

] Incompréhension de certains concepts (agricole) du questionnaire par les agents recenseurs.

] Remplissage de la composition des ménages et de la constitution des ménages dans le cas ou le

ménage est constitué de plusieurs d’individus.

] Difficultés à trouver certaines professions dans la liste des professions disponibles.

] Sensibilité faible des PDA.

] Impossibilité de changer le noyau des individus et de supprimer des individus.

] Impossibilité de clôturer un ménage ou il y a un individu âgé de moins de 1 an.

2.2.2 Les recommandations

Pour résoudre les différents problèmes rencontrés durant cette phase de collecte, les agents recenseurs

ont formulé les recommandations suivantes.

4 Augmenter la durée de formation des agents recenseurs.

4 Alléger le questionnaire, en regroupant certaines questions (sections agriculture, habitat...)

4 Permettre de modifier certaines informations et de supprimer des individus déjà enregistrés.

4 Bloquer les autres applications qui sont sur le PDA lors de la collecte.

4 Avoir des batteries qui peuvent durer en moyenne 5H ; préparer deux batteries pleines pour chaque

PDA afin de parer aux difficultés de charge.

11

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

2.3 L’analyse des données de l’enquête pré pilote

Après ce test, il fallait s’assurer de la cohérence et de la qualité des données recueillies. Il s’agit d’une

analyse technique sur les filtres, les sauts, les valeurs manquantes et aberrantes. Mais aussi estimer la

durée moyenne des interviews pour les ménages agricoles et non agricole. Ainsi cette étude a été faite

en différentes étapes. Un travail préliminaire consistait à exporter les données de CS pro vers SPSS et

de se répartir les différentes sections du questionnaire. En ce qui me concerne, je devais travailler sur les

sections suivantes : Individu (du début à B20), Décès, Migration et Habitat.

2.3.1 Les résultats de l’analyse des données

Nous avons procédé dans un premier temps à l’analyse des valeurs manquantes et aberrantes pour

chaque variable puis dans un second temps à la vérification de la cohérence des données. Nous calculerons

aussi les moyennes des interviews pour différents type de ménage.

Les incohérences

4 On observe qu’à Guédiawaye, IDDR : 014301110007, 9 ème et 10 ème concessions : la variable «

nombre de ménage dans la concession » est renseigné 0, alors qu’en réalité chacune d’elle a un

ménage.

Dans les concessions 9 et 10, il y a respectivement des ménages de 3 et 2 individus. S’il n’y a

pas de ménages dans la concession, l’application ne doit pas permettre l’enregistrement d’individus

puisqu’on ne peut recenser des individus n’appartenant à aucun ménage. Dés que la concession est

habitée, la modalité 0 doit être exclue pour la variable nombre de ménage dans la concession.

De la même manière, si la concession n’est pas habitée, le nombre de ménage dans la concession

doit être 0 automatiquement.

4 On a relevé aussi 5 ménages sans résidents (masculin et féminin) alors qu’en réalité, ce sont des

ménages individuels.

Ils ont tous été enregistrés comme Chefs de ménage, Chefs de noyau, Résidents présents, les autres

caractéristiques individuelles n’ont pas été renseignées.

Ceci pourrait être du à une erreur de manipulation de la part de l’agent recenseur, donc l’appli-

cation devrait permettre à l’enquêteur de supprimer des individus s’il s’est trompé. D’autre part,

l’application doit exiger de renseigner certaines caractéristiques individuelles avant d’enregistrer un

individu.

4 On relève 4 ménages n’ayant pas de Chef de Ménage : Le premier IDDR : 011301220002, 3ème

concession, 1er ménage, ce ménage est individuel et le seul individu est enregistré comme frère du

12

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

CM.

Dans le deuxième, IDDR : 014301110008, 10ème Concession, 1er ménage, ce ménage est composé

de 7 personnes, l’un enregistré comme mère du CM et les autres comme frère ou s ?ur du CM.

Dans le 3ème, IDDR : 072203020010, 3éme concession, 1er ménage, il y a 4 personnes, 2 sans lien

de parenté avec le CM, une épouse et un frère du CM. Dans le 4ème, IDDR : 07203111003, 4ème

concession, 1er ménage, ce ménage est composé de 17 personnes dont 2 épouses, 5 fils, la mère du

CM, un frère du CM et 8 sans liens de parenté avec le CM.

4 J’ai aussi constaté des sauts pour certaines variables : Dans la section « caractéristiques individuelles

», dans le DR 014301110001, 4ème concession, 1er ménage, j’ai constaté des sauts de variables pour

un individu, les variables lien de parenté avec le CM, lien de parenté avec le Chef de Noyau, lien

de résidence jusqu’à ethnie n’ont pas été renseigné, l’agent recenseur(AR) continue à renseigner les

variables à partir de la Religion.

4 Concernant la section habitat, Dans le DR 072203020005, 1er concession, 1er ménage, nous avons

constaté que les biens d’équipements du ménage sont renseignés alors que toutes les autres variables

de la section habitat ne le sont pas. Nous avons relevé 45 ménages pour lesquels toutes les variables de

la section habitat ont été renseignées sauf la variable mode d’acquisition du logement. En principe,

les variables caractéristiques du logement devraient être obligatoires, elles doivent être renseignées

avant de poursuivre avec les autres variables, aucun saut ne devrait être permis par l’application.

4 Nous avons relevé aussi 2 Chefs de noyau qui sont enregistrés comme visiteurs.

4 Concernant la section décès, 5 décès ont été notés et deux d’entre eux ont été vraiment identifiés.

Pour plus d’informations, se référer sur ce tableau.

Table 2.1 – les filtres qui ne sont pas respectésAge Sexe Déclaration Durant la grossesse Durant l’accouchement fin d’une gros. ou acc.

51 Féminin Non Non Non Non

74 Féminin Non Non Non NonSource :Données de collectées avec PDA

Ce tableau nous montre que les âges au décès dépassent 49 ans, donc les sujets ne sont pas concernés

par les questions suivantes. Comme les questions liées à la fécondité dans la section caractéristiques

individuelles, un filtre devrait être fait à ce niveau. On note aussi un faible taux de réponse à ces

questions (2 décès sur 5).

13

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Comparaison des données de l’application web à celles de la base

L’application web permet de faire le suivi de la collecte avec des tableaux de bords afin de voir

la performance des enquêteurs sur le terrain. Elle sera utilisée principalement par tous les acteurs du

système (Agent recenseur, Superviseur, Contrôleur, Coordonnateur Régional/Départemental, et aussi les

utilisateurs concernés par le RGPHAE). Elle permet aussi d’ajouter ou de modifier des informations d’un

questionnaire via un formulaire web. Elle est composée d’un espace privé et d’un espace public. Elle permet

le contrôle de la collecte, d’afficher la pyramide des âges de la population, d’afficher le tableau de collecte

par DR, le tableau récapitulatif de la population, l’effectif des résidents collectés, les données collectés des

ménages et les téléchargements (de la nouvelle version de l’application mobile, de l’application destinée

aux superviseurs, des manuels des agents recenseurs et du contrôleur, etc.), les transmissions des données

des agents recenseurs vers les superviseurs, des superviseurs vers le département et du département vers

le niveau central et la saisie des questionnaires.

En comparant les valeurs de la base de données et celles de l’application de suivi web,Nous avons noté

un écart notamment en ce qui concerne les résidents présents. Ceci étant du aux erreurs relevées dans la

base, avec des ménages n’ayant pas d’individus, donc pas de résidents présents ou absents.

Table 2.2 – Tableau récapitulatif obtenu à partir de l’application web

Les doubles comptes

Des doubles comptes ont été relevés, On considère comme double compte des individus ayant exacte-

ment les mêmes caractéristiques individuelles dans un noyau (parfois les prénoms diffèrent d’une ou de 2

14

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Table 2.3 – Répartition de la population totale

MASCULIN FEMININ TOTAL

RESIDENT PRESENT(RP) 608 640 1248

RESIDENT ABSENT (RA) 48 22 70

SOUS TOTAL (RP+RA) 656 662 1318

VISITEUR (V) 8 5 13

SOUS TOTAL 2 (RP+V) 616 645 1261

TOTAL (RP+RA+V) 664 667 1331

Source :Données de collectées avec PDA

lettres).

En effet, nous avons relevé 39 doubles comptes internes c’est-à-dire des individus qui ont été enregistrés

deux fois dans un même ménage. Dans le DR 072301110001, nous avons aussi relevé deux ménages de 16

et de 26 individus, qui ont 13 personnes en commun. Au total, nous avons enregistré 52 doubles comptes

(voir annexe). Ceci est sans doute lié à l’impossibilité de supprimer des individus déjà enregistrés. Pour

parer ces genres de problèmes, l’application ne doit pas permettre d’enregistrer dans un même noyau des

individus ayant les mêmes prénoms, noms et âges. En étudiant les doubles comptes, on se rend compte

que beaucoup d’individus ont été enregistrés comme fils du CM dont la mère ne réside pas dans le mé-

nage et fils du CM dont la mère réside dans le ménage. Certains fils du CM ont été enregistrés à la fois

comme enfant non accompagné et enfant accompagné. On peut en déduire qu’il y a une complexité de

l’application ou un manque de maîtrise de l’application de la part des Agents recenseurs.

Le problème des noyaux

Le noyau familial correspond à la famille biologique. Il est composé des parents (ou de l’un d’entre

eux) et de leurs descendants directs (enfants biologiques) non accompagnés. A la tête de chaque noyau

familial, il y a un chef de noyau. Ainsi, un ménage peut être composé d’un ou plusieurs noyaux familiaux.

Toutefois, un ménage polygame comprenant des enfants non accompagnés forme un seul noyau familial

si tous les membres vivent et prennent leurs repas ensemble dans la même concession. Un noyau peut

également comprendre les ascendants directs, les frères et s ?urs, les oncles et tantes, les petits fils, les

neveux, nièces non-accompagnés à la charge du chef de noyau, etc. En somme, la personne accompagnée

et toutes les personnes à sa charge constituent un noyau. L’enregistrement des membres du ménage repose

sur le principe du lien de parenté le plus proche. Ainsi, la première personne à inscrire dans le questionnaire

15

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

est le chef de ménage. Ensuite, on enregistrera les parents proches du CM avant de passer aux parents

éloignés et aux personnes sans lien avec ce dernier, tout en respectant, autant que possible, l’appartenance

de chacun à un noyau familial déterminé. L’ordre proposé est le suivant :

1. le chef de ménage, s’il s’agit d’un homme ;

2. ses enfants non accompagnés dont la mère ne réside pas dans le ménage par ordre décroissant d’âge,

c’est-à-dire en commençant par le plus âgé et en terminant par le plus jeune, et ce, quel que soit le

sexe ;

3. sa première épouse, s’il y a lieu ;

4. les enfants non accompagnés de la première épouse en commençant par le plus âgé et quel que soit

le sexe ;

5. les autres épouses du CM selon le rang s’il y a lieu (1ère, 2ème, 3ème, ainsi de suite) et leurs enfants

non accompagnés ;

6. les autres membres du noyau familial du CM à condition que ces derniers ne constituent pas eux-

mêmes un noyau familial et qu’ils soient sous l’autorité du CM ; il s’agit des ascendants directs du

CM, des parents proche du CM tels que les frères et s ?urs, oncles et tantes, petit-fils, nièces et

neveux, cousins, autres parents, autres personnes sans lien de parenté avec le CM , par exemple

une domestique qui vit dans le ménage ) ; Après le noyau familial du CM vous devez enregistrer les

autres noyaux familiaux dans l’ordre suivant :

7. les noyaux des enfants du CM dont la mère ne réside pas dans le ménage ;

8. les noyaux des enfants par épouse ;

9. les ascendants du CM lorsque ceux-ci forment un noyau familial distinct ;

10. les parents proches (frères et s ?urs, oncles et tantes, petit-fils, nièces et neveux, cousins, autres

parents, etc.) ;

11. les autres noyaux non apparentés au CM mais qui font partie du ménage (domestiques et autres

employés, par exemple).

Nous avons constaté aussi des Chefs de noyaux qui n’ont personne à leur charge. Or, d’après la

définition donnée dans le manuel le nombre de chef de noyau ne doit pas être supérieur aux autres

personnes autrement dit un noyau ne peut être individuel car chaque chef de noyau doit avoir au moins

une personne en sa charge dans le ménage. Dans le manuel, il est dit « est considéré comme chef de noyau

tout individu qui vit dans le ménage avec son enfant non accompagné que la mère vive ou pas dans le

ménage et/ou son épouse. Pour chaque individu ayant répondu à un de ces critères est chef de noyau

16

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

et par conséquent forme avec ces personnes en sa charge un noyau ». Des individus ont été enregistrés

comme étant chef de noyau alors qu’ils n’ont personne à leur charge.

Durée des interviews

La durée d’interview des enquêtes varie en fonction du type de ménage, du nombre d’individus dans le

ménage et de l’agent recenseur. Tous les AR n’ont pas respectés le Canevas de rapport raison pour laquelle

on ne dispose pas de toutes les durées des interviews. Sur 175 ménages, nous n’avons reçu que 34 durées

d’interview. Ainsi on constate que : La durée d’interview d’un ménage agricole de 7 personnes est de 1

heure 30 minutes. Pour les ménages non agricoles, on constate que la durée d’interview des ménages

de 3 et 4 personnes varie entre 20 et 30 minutes, celle des ménages de 5 à 7 personnes entre

40 et 50 minutes. Pour un ménage non agricole, en moyenne la durée d’interview est de 7,5

minutes par individu. Cette moyenne présuppose qu’il y ait ni décès ni migration dans le ménage.

2.3.2 Conclusion de l’étude

En somme, on peut dire que la qualité des données de l’enquête pré test est moyenne. Beaucoup de

contrôles ont été déjà programmées dans l’application de collecte, ceci a considérablement réduits les

erreurs de cohérences qu’on pourrait observer. Beaucoup de filtres ont été également respectés. Cepen-

dant, il convient d’apporter des corrections sur l’application. A cet effet, je suggère que : L’application

permette de supprimer des individus déjà enregistrés. Les AR peuvent bien se tromper en enregistrant

des informations. Pour éviter les doubles comptes, un message bloquant devrait apparaître chaque fois

qu’on enregistre des individus ayant exactement les mêmes caractéristiques individuelles dans un noyau et

si c’est dans un ménage, on envoie un message d’alerte à l’AR pour qu’il vérifie ses informations. Le code

Village Quartier aussi doit être pré chargé et L’AR affecté dans un DR ne doit pas avoir la possibilité de

modifier ce code. J’ai rencontré également des statuts de concession de code 0 alors que ce code n’existe

pas, l’application ne doit pas permettre l’enregistrement de ces erreurs, ces champs devraient être en

rouge jusqu’à ce les informations soient corrigées. Si la concession est habitée et que l’AR n’enregistre pas

de ménage dans la concession un message bloquant doit apparaître afin que l’AR corrige l’incohérence.

Apparemment, la notion des noyaux n’est pas claire chez les agents recenseurs. Quand doit-on créer un

noyau ? Un noyau peut-il être individuel ? Ces questions sont à éclaircir aux AR. Ces derniers confondent

très souvent fils dont la mère réside dans le ménage et fils du CM dont la mère ne réside pas dans le mé-

nage.Les noyaux donnent un recensement plus exhaustif de la population, cependant ils sont complexes. A

cet effet, je propose une alternative, soit on augmente la durée de formation des AR pour qu’ils maîtrisent

parfaitement l’application, soit on supprime les noyaux en demandant dans l’ordre les informations sur

17

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

le CM, les épouses du CM, les fils du CM et les autre membres du ménage. Dans la section décès, si

la femme a moins de 15 ans ou plus de 49 ans, un filtre doit être fait pour certaines variables comme

décès intervenu durant l’accouchement, décès intervenu durant la grossesse ou durant les 42 jours suivant

la grossesse ou l’accouchement. Certains filtres doivent être faits au fur et à mesure des variables, par

exemple celui qui n’a pas renseigné les caractéristiques du logement ne devrait pas le faire pour les biens

d’équipements du ménage. On peut également programmer des messages d’alerte si le nombre de pièces à

usage d’habitation ou le nombre de certains biens d’équipements sont supérieurs au nombre d’individus

dans le ménage, parce qu’il n’est pas raisonnable qu’un ménage de 5 individus ait 10 téléviseurs.Le pré-test

a permis aux équipes techniques et conception de gérer les dysfonctionnements notés dans l’application

et le questionnaire. Après la correction des erreurs notées, une nouvelle version est déployée et devrait

être testée et corrigée avant l’enquête pilote prévue du 25 novembre au 12 décembre 2012.

2.4 Le test de l’application

L’organisation du test de l’application consistait à confier à chaque stagiaire une section ou partie de

section du questionnaire. Les observations du jour était envoyées à Madon Awissi SALL qui elle à son

tour les sélectionnées avant de les envoyer aux développeurs. Les observations sont les différences notées

entre ce qui est programmé dans l’application et ce qui est prévu dans le manuel de spécification des

contrôles. J’ai fait le test sur la section « Caractéristiques individuelles », plus précisément de la variable

B15(adresse il y a 10 ans) à B48(la fin). Au cours de ce test, j’ai eu à relever les erreurs suivantes :

r Lorsqu’on enregistre un fils du CM vivant dans le ménage. A la question survie des parents, on

demande si ses parents sont encore en vie alors que l’un des parent est le CM. on constate qu’aucun

contrôle n’est fait.

r J’ai enregistré un CM âgé de 60 ans qui fréquente l’école française et qui est en petite section. Pour

la petite section, moyenne section et grande section, les bornes supérieures ne sont pas fixées.

r J’ai enregistré un enfant de 20 ans qui est au CM2 et qui a le BAC. Les contrôles sur le plus haut

diplôme obtenu ont été faits en fonction de l’âge. En principe, ce contrôle devait être fait en fonction

de la dernière classe fréquentée. Par exemple un individu de 20 ans peut bien avoir le bac à condition

qu’il atteigne au moins la classe de terminale.

r J’ai enregistré un individu qui est en troisième, il a le BFEM en français mais qui n’est pas alpha-

bétisé c’est-à-dire ne sait ni lire ni écrire en français. . Comme prévu dans le manuel si l’individu a

un niveau qui dépasse CE 2, elle doit être alphabétisée en français.

18

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

r J’ai enregistré un individu de 20 ans qui fréquente actuellement l’école et qui est occupé. Un message

d’alerte devait être envoyé d’après le manuel de spécification mais aucun contrôle n’apparaît.

r Si on essaie d’enregistrer un individu de 20 ans comme étant retraité. Le message suivant "L’individu

a 20 ans, Retraité/Vieillard ne convient pas" apparaît mais en cliquant sur OK, on se rend compte

que L’application passe à la question B40. Or on devrait donner à L’agent Recenseur la possibilité

de corriger en même temps.

r En enregistrant un individu âgé de 6 ans, l’application nous demande sa situation matrimoniale.

D’après le questionnaire, cette question concerne les individus qui ont plus de 10 ans donc un saut

devait être fait à ce niveau pour les individus de moins de 10 ans.

r Il y a des questionnaires qu’on n’arrive pas à clôturer même si tous les champs sont remplis.

r Pour les individus ayant déjà fréquenté l’école, un contrôle est fait entre l’âge et le niveau d’ins-

truction. Dans le manuel de spécification des contrôles, ce contrôle doit être fait lorsque l’individu

fréquente actuellement l’école. On a essayé d’enregistrer une mère de famille qui s’est arrêté au CM

2 et le message suivant apparait " Cet individu est trop âgé pour être en CM2".

19

Chapitre 3

La documentation des données

d’enquête

La documentation consiste à archiver des données d’enquêtes ou de recensement suivant des normes

internationales recommandées par l’IHSN « International Household Survey Network » (Réseau Interna-

tional des enquêtes sur les ménages). Une bonne documentation présente un certain nombre de caracté-

ristiques. Elle doit décrire les données avec précision. L’information doit être claire afin que les données

soient utilisées correctement. En principe toute information permettant à des utilisateurs d’employer des

ensembles de données de manière effective et correcte doit être conservée et diffusée. Constituer une do-

cumentation est en général un travail long et difficile et pour réduire considérablement cette charge, des

normes internationales ont été mises en place. Ces normes que sont le « Data Documentation Initiative

» DDI et le Dublin Core (DC) fournissent un cadre rigoureux pour organiser le processus de documen-

tation. L’initiative DDI est une tentative visant à établir une norme pour la documentation relative aux

micro-données fondée sur le langage XML. Son but est de fournir un moyen simple d’enregistrer toutes les

caractéristiques saillantes des ensembles de micro-données et de les communiquer à d’autres. L’initiative

DDI offre aux analystes une meilleure connaissance du contenu de ces données car elle fournit des ren-

seignements détaillés pour décrire les ensembles de micro-données de manière aussi précise et exhaustive

que possible.

La norme Dublin Core relative aux méta données repose sur les mêmes principes que la norme DDI. Elle

consiste en un ensemble d’éléments (ou « balises ») organisés de manière à constituer un fichier XML. La

norme Dublin Core comprend deux niveaux généraux et 6 spécifiques. Dans le Toolkit, seuls les éléments

généraux de la norme Dublin Core sont utilisés.

20

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

3.1 La documentation de l’EMSILD

3.1.1 Présentation de l’enquête

Le secteur des bâtiments et travaux publics (BTP) apparaît comme l’une des principales composantes

de l’économie sénégalaise, tant par sa contribution au PIB que par le nombre de personnes qu’il emploie. Ce

segment de l’économie contribue à hauteur de 29,6 pour cent de la valeur ajoutée du secteur secondaire

en 2006 du fait, notamment d’une forte expansion durant ces dernières années liée à la croissance des

investisseurs publics réalisés dans le domaine des infrastructures et à la poussée de la construction de

logement des ménages. L’offre de services immobiliers a connu ces dernières années un renchérissement

du loyer, représentant ainsi un poids important dans le budget des ménages, en particulier ceux de

Dakar. Afin d’apporter des éléments de mesure et d’analyse pertinents sur les déterminants de la flambée

de ces prix, susceptibles d’aider à la prise de décision, l’Agence Nationale de la Statistique et de la

Démographie (ANSD) se propose de mener une étude monographique sur les services immobiliers du

logement dans la région de Dakar. Pour ce faire, il est prévu de mener une enquête auprès des principaux

acteurs intervenant dans le secteur immobilier, que sont : les propriétaires de logements, les locataires,

les promoteurs immobiliers publics et privés, les agences immobilières, les institutions financières qui

interviennent dans le crédit immobilier et les intermédiaires communément appelés « courtiers ».

La documentation de l’enquête

Le Toolkit est composé de 3 outils :

4 Le méta data editor qui permet de créer un projet et de le documenter

4 Le Nesstar Explorer qui permet de lire le projet documenté.

4 Le Report Center qui permet de générer le rapport de la documentation.

4 Le CD Buider qui permet d’élaborer le produit final à diffuser sous forme d’un CD ROM.

Avant toute documentation, il faudra rassembler et organiser tous les documents relatifs à l’enquête. On

devra au préalable créer un dossier qui porte le nom de l’enquête, dans lequel sont créés 3 sous dossiers

comme le montre la figure2.2.

Dans le répertoire Documents sont rangés tous les documents relatifs à l’enquête, on mettra tous les

documents administratifs dans le sous dossier "Administratifs", les rapports dans le sous dossier "Rapport"

et les documents techniques comme les manuels et questionnaires dans le sous dossier "Techniques". Il

faudra ensuite rassembler et préparer les données d’enquête, s’assurer de disposer des dernières versions

des fichiers et les ranger dans le répertoire Données. On distinguera les données brutes des données d’ana-

lyse si nécessaire. Il est recommandé de créer un identifiant unique pour fusionner les fichiers de même

21

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Figure 3.1 – Préalable pour une bonne documentation

structure.

Si l’on dispose du masque de saisie, du dictionnaire de données, du fichier de données ou d’autres pro-

grammes, on les rangera dans le répertoire Programme. On distinguera également les programmes de

saisie et des programmes de Tabulation. Tous les documents disponibles doivent être en format de créa-

tion mais aussi être transformé en PDF et tous les documents en formats papiers doivent être scannés et

mis en PDF.

La documentation avec le méta data editor comprend 5 étapes :

] La description du document ;

] La description de l’étude ;

] La documentation des fichiers et variables ;

] Groupe de variables ;

] Les ressources externes ;

3.1.2 La description du document

Il s’agit de documenter le titre, le producteur, la date de production du document, la version du DDI

(permet aux utilisateurs de savoir s’ils ont la version la plus récente) et le numéro d’identification du

document DDI (Code unique permettant d’identifier le document) comme le montre cette figure.

3.1.3 La description de l’étude

Elle fournit des informations générales sur l’étude. Elle indique comment citer l’étude, les responsables

de la collecte, la compilation et la distribution des données, elle résume le contenu des données, elle donne

des informations sur les méthodes de collecte des données et leur traitement, etc. Elle comprend différentes

22

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Figure 3.2 – Description du document sur Meta data editor

étapes comme le montre cette figure.

Figure 3.3 – Description de l’étude sur Meta data editor

En dessous de chaque champ, des instructions sont fournies permettant ainsi de guider la personne

qui documente l’enquête.

4 on identifie l’étude à partir du titre de l’enquête, du type d’étude et du numéro d’identification.

4 la version de l’étude, il s’agit de la description de la version c’est-à-dire de préciser si les données

sont saisies ou apurées, et de la date de production de l’enquête.

4 cette partie permet d’avoir un aperçu sur l’enquête, Elle concerne le résumé de l’enquête, les types

23

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

de données, et les unités d’analyse.

4 les domaines thématiques : Cette partie facilite la recherche des enquêtes à partir des sujets abordés

et des mots clés.

4 Couverture : il s’agit dans cette partie de renseigner le pays, les zones géographiques et l’unité

géographique (le niveau le plus bas couvert par les données) concernés par l’enquête.

4 Cette partie fournit des informations sur les structures qui ont réalisés l’enquête et sur celles qui

l’ont financée.

4 Échantillonnage : cette partie donne une idée sur la méthode d’échantillonnage, l’écart au plan de

sondage, le taux de réponse et la pondération.

4 Collecte des données : cette partie nous renseigne sur les dates de collecte, les périodes de référence,

le responsable, l’organisation, les difficultés et solutions de la collecte, ainsi que le(s) questionnaire(s)

de l’enquête.

4 Traitement des données : il s’agit dans cette partie de préciser les règles garantissant la cohérence

globale des données. Dans le cas de plusieurs questionnaires, les préciser pour chacun, si opportun.

4 Accès aux données : Cette partie concerne la politique d’accès aux données de la structure respon-

sable de l’enquête. On y spécifie l’autorité qui contrôle l’accès aux données et les conditions d’accès

aux données.

4 Responsabilité et droits d’auteurs : il s’agit dans cette partie de donner des Informations concernant

les responsabilités des utilisateurs lors de l’exploitation des résultats et des données ainsi que les

droits d’auteurs.

4 Contacts : il s’agit des Noms et adresses des personnes responsables de la collecte des données.

Cela correspond à la personne ressource qui sera contacté pour les problèmes ou les questions des

utilisateurs. L’attribut e-mail est utilisé pour indiquer une adresse e-mail d’un contact.

3.1.4 La documentation des fichiers de données

Une documentation peut contenir un ou plusieurs fichiers de données. L’enquête EMSILD est composée

de 6 questionnaires et chaque questionnaire de plusieurs fichiers de données. La documentation d’un fichier

de donnée comprend 4 parties :

4 La description du fichier : Les éléments de ce groupe donnent des informations de base sur chaque

fichier de données. Il s’agit de décrire le contenu du fichier, le producteur des données, la version

des données, les valeurs manquantes et les notes s’il en existe.

24

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

4 Les variables clés et relation : La plupart des études comporte des fichiers interdépendants, ce

groupe vise à définir les relations entre les fichiers. Pour le cas de l’EMSILD les questionnaires sont

indépendants et donc ce champ n’est pas rempli.

4 Les variables : Cette partie donne une description plus détaillée sur la variable. Elle comprend 3

sous parties que sont la description de la variable, la description de la question et les imputations

et construction de variables.

4 La saisie des données : Ce groupe d’éléments est utilisé pour saisir les méta données liées à chaque

variable.

3.1.5 Les groupes de variables

Les fichiers de données peuvent contenir des centaines de variables. L’éditeur de méta données fournit

un outil pour regrouper ces variables. Leur regroupement permet de parcourir plus rapidement des listes

de variables et de guider l’analyse en indiquant quels éléments d’un ensemble de données sont reliés

conceptuellement. Les groupes de variables servent aussi à créer la section Dictionnaire de données pour

les projets diffusés à l’aide du Créateur de CD-ROM. Pour le cas de notre enquête, les variables sont

regroupées comme suit :

Figure 3.4 – Les groupes de variables sur méta data éditor

25

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

3.1.6 Les ressources externes

La section des ressources externes fournit une liste des ressources telles que des documents (manuels,

questionnaires, rapports techniques et analytiques), des programmes d’ordinateur (saisie de données, édi-

tion, tabulation, analyse), des photos et des cartes associés à l’étude et elle en donne une description. Les

ressources de même nature doivent être regroupées dans un répertoire.

La documentation est un travail qui est généralement réalisé en équipe, cependant elle requiert une cer-

taine connaissance en statistique. Pour s’assurer qu’on a bien documenté l’étude, on validera les méta

données, les ressources externes, les relations entre les fichiers de donnée et les variables. Après la docu-

mentation de l’étude sous le méta data editor, on pourra lire l’étude avec de l’outil Nesstar.

Dans le menu Documentation, on exportera le DDI et le DC vers le répertoire initial, ensuite on génère

le rapport de l’étude à l’aide de l’IHSN report Center contenu dans le menu outil.

3.2 L’atelier de perfectionnement

3.2.1 Objectifs et résultats attendus

Dans le cadre du Programme Statistique Accéléré (PSA) s’est tenu l’atelier de formation en archivage

de données, du 27 au 31 Août 2012 à Saly-Mbour. Cet atelier a permis à l’Agence Nationale de la

Statistique et de la Démographie (ANSD) et aux structures du Système Statistique National (SSN)

impliquées dans le programme (Agriculture, Eaux et Forêts, Pêche, Education et Sécurité alimentaire) de

revisiter l’outil Toolkit pour la documentation et l’archivage des données et la plateforme Nada pour la

dissémination. Le PSA est un programme qui a été initié au Sénégal en avril 2007 et qui cible l’ensemble

des structures productrices de données statistiques. Dans le cadre de ce projet, plusieurs ateliers ont été

organisés par l’ANSD et avec le concours technique et financier de la Banque Mondiale pour la mise à

niveau des agents en charge de l’archivage et de la documentation dans les différentes structures engagées

dans le programme. Cet atelier, organisé conjointement par l’ANSD et l’Organisation de la Coopération

et du Développement Economiques (OCDE), a pour principal objectif de renforcer les capacités en termes

de bonnes pratiques en matière de documentation et d’archivage des données d’enquête. L’atteinte de cet

objectif passe par la redynamisation de la documentation des enquêtes à travers la désignation des points

focaux au niveau des différents services producteurs impliqués et leur mise à niveau sur le processus et

les outils utilisés (Toolkit et NADA). Les principaux résultats attendus de cet atelier sont :

\ Les agents en charge de la documentation des enquêtes sont formés sur le processus ;

\ Les enquêtes ciblées sont documentées et mises en ligne ;

26

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

\ Les points focaux des autres structures sont désignés.

3.2.2 Les travaux effectués

Au cours de cet atelier, les participants ont travaillé en binôme et chaque binôme était tenu de docu-

menter une enquête à la fin du séminaire. En ce qui nous concerne, nous devions documenter l’Enquête

sur la Vulnérabilité enfants, des Interventions et des Besoins des Acteurs (DVEIBA). Cette enquête est

composée de deux questionnaires : un questionnaire enfant et un questionnaire ménage. Avant cet atelier,

j’avais eu à documenter l’EMSILD et c’était l’occasion pour moi d’éclaircir certains points et de perfec-

tionner les techniques déjà acquises.

Nous avions également appris de nouvelles techniques dont les plus importantes :

4 La fusion des bases de données avant de commencer la documentation : Lorsque les fichiers d’un

questionnaire sont de même structure, il convient de les fusionner avant de commencer à documenter

l’étude. Dans notre cas, on disposait des fichiers de données par section mais la création d’un

identifiant nous a permis de fusionner les fichiers du questionnaire enfant et ceux du questionnaire

ménage avec le logiciel SPSS.

4 La notion de référence absolue et référence relative : Dans la partie ressources externes, le lien de

la ressource doit être relatif. Ceci permettra d’ouvrir le lien dans un autre ordinateur.

4 Les dépôts de variables : ils permettent de faciliter le travail de documentation et d’éliminer les

erreurs d’incohérences. Il s’agit de créer un catalogue de variables et de l’appliquer aux variables

qui ont les mêmes modalités.

4 L’élaboration du produit final à diffuser sur internet avec l’outil NADA. L’animateur a présenté

l’outil NADA portable, et nous avons suivi avec lui toutes les étapes de l’élaboration du produit à

diffuser sur le net.

4 Les bonnes pratiques d’archivage : il s’agit des préparations, de l’organisation des fichiers et tech-

niques de documentation notamment les dix étapes à suivre pour une bonne présentation des ar-

chives.

4 La distinction de la date de production contenue dans la partie description du document et celle

contenue dans la partie documentation de l’étude. C’est-à-dire la date de production de la docu-

mentation (la 1ère) et celle de l’enquête (la deuxième).

4 Avec ces nouveaux acquis, nous avons documenté l’enquête sur la Vulnérabilité des enfants, l’inter-

vention et le besoin des acteurs et avons élaboré le produit final avec NADA. Après l’atelier nous

27

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

avons corrigé les documentations réalisées avant l’atelier de Saly en fonction des techniques acquises.

Au final, nous avons documenté deux enquêtes que sont l’EMSILD et la DVEIBA.

28

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

L’apport du stage

Ce stage d’immersion a été riche de découvertes et d’enseignements, il nous a permis aussi d’observer

le fonctionnement d’un institut National de Statistique comme l’ANSD.

Il nous a offert l’occasion de participer aux activités du recensement général de la population (activité

qui se répète tous les dix ans). La particularité de cette édition est l’utilisation des PDA comme moyens

de collecte pour la première fois au Sénégal.

Au cours de collecte des données, dispensé par Monsieur Dansokho, nous avons décrit les différents moyens

de collecte, leurs avantages et leurs inconvénients.

A travers cette activité, plus précisément l’étude de la qualité des données, j’ai constaté l’avantage des

PDA sur les questionnaires papiers en termes de cohérence de réponses, de respect des filtres et saut. Avec

les questionnaires papiers, l’exploitation des données auraient pris beaucoup plus de temps à cause des

opérations de saisie.

Toujours dans cette activité, j’ai participé à l’enquête pré-test comme assistant des superviseurs. En

confrontant la réalité du terrain, j’ai constaté la difficulté de réaliser des recensements fiables dans des

pays comme le Sénégal. Bien que le pré test avait pour vocation de tester le dispositif informatique, nous

avons assisté à des refus de réponse et à d’autres problèmes auxquels confrontaient les agents recenseurs.

Ce stage m’a permis également de maitriser le logiciel d’archivage Toolkit, qui est un outil indispensable

pour la diffusion des données d’enquête. L’atelier de perfectionnement organisé à Saly a été une bonne

expérience puisqu’il nous a permis d’observer le déroulement d’une telle activité et d’échanger avec des

personnes de diverses structures.

J’ai constaté qu’en entreprise, le travail d’équipe prédomine et exige certaines qualités comme la sociabi-

lité, l’ouverture d’esprit, la rigueur entre autres. Ce stage est très instructif du point de vue organisation

et fonctionnement de l’agence. Les 4 directions de l’agence sont interdépendantes, par exemple la DMIS

gère les traitements et les documentations des enquêtes réalisées par la DSECN et la DSDS. Des activités

comme le recensement sollicitent toutes les divisions.

Au cours de ce stage, nous avons constaté le rôle essentiel que jouent les structures de Statistique comme

l’ANSD au Sénégal. La connaissance des certains indicateurs est indispensable pour les prises de décision

économiques et sociales.

Le stage s’est déroulé dans de très bonnes conditions, la seule difficulté que j’ai eu à rencontrer est le

manque d’encadrement à un certain moment. Après avoir rédigé mon rapport d’étude sur la qualité des

données, aucune suggestion n’a été faite, il a fallu attendre la reprise de Madame Madon AWISSI SALL

(qui était en congé) pour le corriger.

29

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Conclusion

Du 09 juillet au 14 septembre, j’ai effectué mon stage de validation de deuxième année d’étude en

formation d’Ingénieur des Travaux Statistiques. Comme son nom l’indique, ce stage de découverte nous

a permis d’observer le fonctionnement d’un Institut National de Statistique et de voir le rôle de chaque

division au sein de l’ANSD. Au cours de ce stage au BTDE (Bureau des Traitements des Données d’En-

quête), nous avons travaillé sur la préparation du Recensement Général de la Population de l’Agriculture

de l’Elevage notamment sur l’enquête pré test et le test de l’application. Nous avons également travaillé

sur l’archivage des données de l’EMSILD et la DVEIBA. Ce stage reste un excellent souvenir et constitue

désormais une expérience professionnelle valorisante et encourageante pour l’avenir.

30

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

ANNEXE

31

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Bibliographie

Cours de Techniques d’expressions,El haji SECK Comment Rédiger et soutenir un rapport de stage,

2012.

ANSD,Manuel de l’agent recenseur, 2012.

ANSD,Manuel d’utilisation de l’application web, 2012.

IHSN,Microdata Management Toolkit, 2006. www.surveynetwork.org/Toolkit

32

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

Table 3.1 – Liste des doubles comptesIDDR N̊ conc N̊ Mén PRENOM NOM Lien avec le CN Age

72301110001 3 1 NENE DIALLO 2 60

72301110001 3 1 NENE DIALLO 2 60

72301110001 7 1 NENE DIALLO 2 60

72301110001 3 1 AISSATA GUISSE 2 65

72301110001 3 1 AISSATOU GUISSE 2 65

72301110001 7 1 AISSATOU GUISSE 2 65

72301110001 3 1 NDEYE MBAYE 2 49

72301110001 7 1 NDEYE MBAYE 2 49

72301110001 3 1 ALASSANE SECK 3 36

72301110001 3 1 ALASSANE SECK 3 36

72301110001 7 1 ALASSANE SECK 3 36

72301110001 3 1 COUMBEL SECK 3 31

72301110001 3 1 COUMBL SECK 3 31

72301110001 7 1 COUMBEL SECK 3 31

72301110001 3 1 DIAGA SECK 3 11

72301110001 7 1 DIAGA SECK 3 11

72301110001 3 1 GNEUP GUERE SECK 3 22

72301110001 7 1 GNEUP GUERE SECK 3 22

72301110001 3 1 MAMADOU SECK 3 29

72301110001 7 1 MAMADOU SECK 3 29

72301110001 3 1 NDEYE ISSEU SECK 3 15

72301110001 7 1 NDEYE ISSEU SECK 3 15

72301110001 3 1 SAMBA SECK 3 25

72301110001 3 1 SAMBA SECK 3 25

72301110001 7 1 SAMBA SECK 3 25

72301110001 3 1 SOULEYMANE SECK 3 19

72301110001 7 1 SOULEYMANE SECK 3 19

14301110008 3 1 AWA GUEYE 3 24

14301110008 3 1 AWA GUEYE 3 24

14301110008 3 1 KANGUE GUEYE 3 25

14301110008 3 1 KANGUE GUEYE 3 25

33

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

IDDR N̊ conc N̊ Mén PRENOM NOM Lien avec le CN Age

14301110008 3 1 KINE GUEYE 3 22

14301110008 3 1 KINE GUEYE 3 22

14301110008 6 1 ASSANE KHOLL 3 0

14301110008 6 1 ASSANE KHOLL 3 0

14301110008 6 1 MOMAR KHOLL 4 39

14301110008 6 1 MOMAR KHOLL 1 39

14301110004 6 1 ABDOULAYE NIKHOR BOB 1 39

14301110004 6 2 ABDOULAYE NIOKHOR BOB 1 39

14301110006 2 1 GUENEBA TALL 3 22

14301110006 2 1 GUENEBA TALL 1 22

11301220006 1 1 LIKA NGUEYE 2 32

11301220006 1 1 LIKA NGUEYE 2 32

11301220006 1 1 AMINATA SIDIBE 3 7

11301220006 1 1 AMINATA SIDIBE 3 7

11301220006 1 1 PAPE ALIOUNE SIDIBE 3 5

11301220006 1 1 PAPE ALIOUNE SIDIBE 3 5

72301110003 4 1 FALLOU NDIAYE 3 11

72301110003 4 1 FALLOU NDIAYE 3 11

72301110007 2 1 MAMADOU MOUSTAPHA DIOUF 2 28

72301110007 2 1 MAMADOU MOUSTAPHA DIOUF 1 28

72301110007 2 1 ASTOU FALL 7 19

72301110007 2 1 ASTOU FALL 3 19

72301110007 2 1 DIOBA FALL 7 20

72301110007 2 1 DIOBA FALL 3 20

34

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

IDDR N̊ conc N̊ Mén PRENOM NOM Lien avec le CN Age

72301110007 2 1 NDEYE MAREME NDIAYE 1 24

72301110007 2 1 NDEYE MAREME NDIAYE 2 24

14301110001 6 1 ABLAYE DIENE 3 25

14301110001 6 1 ABLAYE DIENE 1 25

14301110001 6 1 AMET DIENE 1 32

14301110001 6 1 AMETH DIENE 6 32

14301110001 6 1 DEMBA DIENE 3 27

14301110001 6 1 DEMBA DIENE 1 27

14301110001 6 1 MAIMOUNA DIENE 1 34

14301110001 6 1 MAIMOUNA DIENE 6 34

14301110001 6 1 NDEYE BAHAO DIENE 1 30

14301110001 6 1 NDEYE BAHAO DIENE 6 30

14301110001 6 1 SEYDOU DIENE 3 21

14301110001 6 1 SEYDOU DIENE 1 21

14301110002 5 1 OUSMANE DIEDHOU 7 18

14301110002 5 1 OUSMANE DIEDOU 6 16

14301110010 9 1 MAMADOU SYLLA 7 18

14301110010 9 1 MOUHAMMADOU SYLLA 3 18

72203020001 9 2 KENE TINE 3 25

72203020001 9 2 KENE TINE 1 25

72203020003 7 1 YANGANE TINE 4 38

72203020003 7 1 YANGANE TINE 1 38

72203020006 1 1 THERESE SATOU DIOP 7 2

72203020006 1 1 THERESE SATOU DIOP 3 2

72203020006 1 1 JEAN MAGUETTE NDIR 7 34

72203020006 1 1 JEAN MAGUETTE NDIR 1 34

72203020008 1 1 IVONE TINE 0 13

72203020008 1 1 IVONE TINE 1 14

72301110001 5 1 NDIAWAR DIOP 6 12

72301110001 5 1 NDIAWAR DIOP 3 16

72301110003 3 1 MOUSSA DIOP 3 42

72301110003 3 1 MOUSSA DIOP 3 42

35

Exploitation des données de l’enquête pré pilote du RGPHAE 2012

IDDR N̊ conc N̊ Mén PRENOM NOM Lien avec le CN Age

72301110003 4 1 FALLOU NDIAYE 3 11

72301110003 4 1 FALLOU NDIAYE 3 11

72301110003 5 1 AMIE NGOM 1 45

72301110003 5 1 AMIE NGOM 1 45

72301110007 2 1 MAMADOU MOUSTAPHA DIOUF 2 28

72301110007 2 1 MAMADOU MOUSTAPHA DIOUF 1 28

72301110007 2 1 ASTOU FALL 7 19

72301110007 2 1 ASTOU FALL 3 19

72301110007 2 1 DIOBA FALL 7 20

72301110007 2 1 DIOBA FALL 3 20

72301110007 2 1 NDEYE MAREME NDIAYE 1 24

72301110007 2 1 NDEYE MAREME NDIAYE 2 24

72301110008 4 1 BIRAME SYLLA 3 23

72301110008 4 1 BIRAME SYLLA 1 23

36


Recommended