Théorie et mise en oeuvre pratique avec R
Le Comité d’experts des Nations Unies sur la gestion de l’information géospatiale mondiale (UN-GGIM) « a reconnu l’importance cruciale d’intégrer les informations géospatiales aux statistiques et aux données socio-économiques et le développement d’une infrastructure statistique géospatiale ». La demande pour les données géolocalisées augmente du fait de l’intérêt croissant accordé au caractère spatial des phénomènes. L’Insee a entrepris de mieux intégrer cette dimension dans son système d’information.
Afin de valoriser ces investissements l’Insee a coordonné la rédaction, par des experts de l’Insee et du monde académique, d’un manuel d’analyse spatiale. Ce manuel a bénéficié du soutien d’Eurostat et du Forum Européen de Géographie et de Statistique (EFGS). Il dresse un panorama des méthodes qui peuvent être employées quand on connaît la localisation des unités statistiques étudiées (logements, établissements, individus, etc.).
L’objectif de l’Insee Méthode n° 131 est de répondre aux questions concrètes des chargés d’étude : que faire avec ces nouvelles sources de données géolocalisées ? Dans quels cas doit-on prendre en compte leur dimension spatiale ? Comment appliquer les méthodes de statistique et d’économétrie spatiale ? La pédagogie est pensée également pour illustrer des enjeux plus spécifiques aux instituts nationaux de statistique : échantillonnage spatial, confidentialité, estimation sur petits domaines.
Après une introduction de la directrice générale d’Eurostat, Mariana Kotzeva, et du président de l’EFGS, Janusz Dygaszewicz, un guide d’utilisation présente l’articulation des 14 chapitres du manuel. La lecture des trois premiers chapitres est recommandée pour faciliter la compréhension de l’ensemble. Ils décrivent les étapes suivies lorsqu’on commence à analyser des données spatiales : décrire la localisation des observations, mesurer les interactions spatiales et choisir le modèle approprié. Le préambule de chaque chapitre précise les autres chapitres dont la lecture préalable est nécessaire à une bonne compréhension. Le corps du texte présente la théorie, les exemples d’application pratique et le code informatique (langage R) associé. Les encadrés sont des extensions plus techniques dont la lecture n’est pas indispensable pour comprendre l’essentiel de la méthode.