Cet article est une introduction à la collecte automatisée de données sur le web. Il présente les principes fondamentaux du web scraping, comme l’envoi de requêtes et l’analyse de pages HTML, tout en proposant des exemples concrets et reproductibles. Destiné aux débutants, il vise à rendre ces techniques compréhensibles et applicables pour explorer et structurer des données du web.
Cet article peut être utilisé comme support pour une initiation aux bases de la collecte automatique de données du web avec R.
@articles{article_10,title={Premiers pas en web scraping},subtitle={Introduction à la collecte automatique de données du web},author={Christophe, Léa and Pécout, Hugues and Cura, Robin and Cebeillac, Alexandre and Rey-Coyrehourcq, Sébastien},doi={10.48645/apqy-q532},url={https://rzine.fr/docs/20250718_rzine_webscraping/},language={fr},journal={Rzine},publisher={FR2007 CIST},year={2025},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/rzine_webscraping},tags={scraping, collecte},issn={2743-8791},}
Cet article est le fruit d’un dialogue interdisciplinaire entre membres du GT Notebook initié dans le cadre d’un atelier proposé à la journée d’études normande sur les données de la recherche qui s’est déroulée en décembre 2021. Il présente une analyse exploratoire reproductible de données ouvertes et liées d’un fragment de graphe Wikidata, interrogeables sous la forme de triplets RDF. Les enjeux d’un tel processus inter-disciplinaire sont esquissés en conclusion. Une ébauche des requêtes SPARQL élaborées a fait l’objet d’une présentation et d’échanges au sein des ateliers du Web Sémantique au printemps 2021.
@articles{article_9,title={Spatio-temporal Wikidata. Exploration de données ouvertes et liées du Web 3.0},subtitle={Histoire de cadre : élaboration d’une trajectoire spatio-temporelle},author={Krummeich, Raphaëlle and Pécout, Hugues and Rey-Coyrehourcq, Sébastien},doi={10.48645/qw41-b476},url={https://rzine.fr/docs/20250717_wikidata_sparql_rzine/},language={fr},journal={Rzine},publisher={FR2007 CIST},year={2025},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/wikidata_sparql_rzine},tags={wikidata, reproductibilite, sparql, science ouverte},issn={2743-8791},}
This paper presents an effective approach for handling two-mode networks, utilizing the concept of ‘place’ or structural equivalence as its fundamental framework. It primarily relies on the Places and igraph R packages. To illustrate this method, it employs an edge list representing students and their respective universities in the United States. The data source for this analysis is derived from the directory of an alumni club, specifically the American University Club of Shanghai, which was originally published in 1936. The paper proceeds through four main steps: (1) identification of places from the edge list, (2) transformation of the list of places into a network of places, along with its transposed network of universities, (3) visualization and analysis of the network, including community detection, and (4) the introduction of a more flexible approach grounded in the concepts of regular equivalence or k-places.
@articles{article_8,title={Uncovering Places in Two-Mode Networks},subtitle={Using Structural Equivalence to Study Affiliation Networks},author={Armand, Cécile},doi={10.48645/nk8x-8d47},url={https://rzine.fr/docs/20241003_carmand_place/},language={en},journal={Rzine},publisher={FR2007 CIST},year={2024},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/place-rzine},tags={network, two-mode},issn={2743-8791},}
Cet article présente la réalisation d’une analyse de données à l’aide de la régression géographiquement pondérée ou GWR (Geographical Weighted Regression). L’objectif est d’offrir une première introduction à cette méthode qui appartient au champ de la statistique spatiale et qui permet d’étudier le phénomène de non stationnarité spatiale, à savoir la variabilité des variables explicatives dans l’espace. Un phénomène en réalité fréquent mais trop peu étudié en science humaines et sociales. Cet article présente l’utilisation de cette méthode, appliquée au prix de l’immobilier par EPCI en France hexagonale.
@articles{article_7,title={La régression géographiquement pondérée : GWR},subtitle={Comment prendre en compte l’effet local du spatial en statistique},author={Audard, Frédéric and Le Campion, Grégoire and Pierson, Julie},doi={10.48645/wk1m-hg05},url={https://rzine.fr/docs/20240930_gwr/},language={fr},journal={Rzine},publisher={FR2007 CIST},year={2024},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/GWR_Rzine},type={{Research article}},tags={GWR, régression géographique, pondérée},issn={2743-8791},}
Cet article présente une méthodologie d’analyse de l’accessibilité multimodale d’un territoire à partir des données GTFS et du logiciel OpenTripPlanner. Nous détaillerons la manière dont ce nouvel outil ouvre de nouvelles perspectives d’analyse de l’accessibilité en lien avec les nouvelles données de mobilité.
Le répertoire OTP, contenant le logiciel Java et les données nécessaires aux calculs d’accessibilité, est disponible en ligne (https://zenodo.org/records/10793738).
@articles{article_6,title={Analyse d’accessibilité multimodale},subtitle={Avec R et OpenTripPlanner},author={Ullès, Jean-Clément and Le Texier, Marion},doi={10.48645/5qht-d313},url={https://rzine.fr/docs/20240529_ulles_letexier_otp/},language={fr},journal={Rzine},publisher={FR2007 CIST},year={2024},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/OTP_RZINE},type={{Research article}},tags={OpenTripPlanner, otp2, OpenStreetMap, sf},issn={2743-8791},}
Cet article présente une méthode de caractérisation des formes du relief à l’échelle de bassins-versants. La méthode utilise l’algorithme geomorphons pour identifier les caractéristiques topographiques d’un terrain à partir de données issues d’un modèle numérique de terrain. Les résultats peuvent être utilisés pour cartographier et analyser les paysages à différentes échelles géographiques.
@articles{article_5,title={Caractérisation des formes du relief à l’échelle de bassins-versants},subtitle={Analyse quantitative des formes du relief via l’algorithme Geomorphons pour trois bassins-versants montagnards},author={Theureaux, Olivier and Passy, Paul and Feuillet, Thierry and Birre, Déborah},doi={10.48645/s8je-kz92},url={https://rzine.fr/docs/20230425_geomorphon/},language={fr},journal={Rzine},publisher={FR2007 CIST},year={2023},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/fiche_rzine_geomorphon},type={{Research article}},keywords={raster, terra, tmap, sf, relief, geomorphons, MNT, BD, Topage, MNT, RGE, bassins-versants },tags={raster, terra, tmap, sf, relief, geomorphons, MNT, BD, Topage, MNT, RGE, bassins-versants },issn={2743-8791},}
Cet article présente une analyse territoriale multiscalaire menée sur la concentration de l’emploi dans les communes de la métropole du Grand Paris (MGP). Cette analyse reproductible utilise des données de l’INSEE librement accessibles et montre l’usage et l’intérêt des fonctions du package MTA (Multiscalar Territorial Analysis) pour révéler l’existence d’inégalités territoriales dans un contexte multiscalaire.
Mots clefs : MTA multiscalaire, territoire, INSEE, déviation, équirépartition, voisinage, autocorrélation, spatial, HyperAtlas, Lorenz, Métropole Grand Paris
@articles{article_4,title={Analyse territoriale multiscalaire},subtitle={Application à la concentration de l’emploi dans la métropole du Grand Paris},author={Ysebaert, Ronan and Grasland, Claude},doi={10.48645/HJVQ-YP94},url={https://rzine.fr/docs/20211101_ysebaert_grasland_MTA/},language={fr},journal={Rzine},publisher={FR2007 CIST},year={2021},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/mta_rzine},type={{Research article}},keywords={MTA multiscalaire, territoire, INSEE, déviation, équirépartition, voisinage, autocorrélation, spatial, HyperAtlas, Lorenz, Métropole Grand Paris},tags={MTA multiscalaire, territoire, INSEE, déviation, équirépartition, voisinage, autocorrélation, spatial, HyperAtlas, Lorenz, Métropole Grand Paris},issn={2743-8791},}
Cet article vise à présenter une méthode efficace et simple pour réaliser, analyser et représenter des corrélations avec R, de la mise en forme des données à la réalisation de graphiques. Il ne contient que de brefs rappels sur la notion de corrélation en statistique.
Mots clefs : easystats, Pearson, Spearman, Kendall, correlation, see, Test d’hypothèses, Statistiques inférentielles, corrélogramme, corrplot, cor.test
@articles{article_3,title={Analyse des corrélations avec easystats},subtitle={Guide pratique avec R},author={{Le Campion}, Grégoire},doi={10.48645/QHAV-CB52},url={https://rzine.fr/docs/20200526_glecampion_initiation_aux_correlations/},language={fr},journal={Rzine},publisher={FR2007 CIST},year={2021},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/Rzine_correlation},type={{Research article}},keywords={easystats, Pearson, Spearman, Kendall, correlation, see, Test d'hypothèses, Statistiques inférentielles, corrélogramme, corrplot, cor.test},tags={easystats, Pearson, Spearman, Kendall, correlation, see, Test d'hypothèses, Statistiques inférentielles, corrélogramme, corrplot, cor.test},issn={2743-8791},}
Cet article rend compte d’une série de traitements permettant d’explorer la base de données MERIMEE qui consigne l’ensemble des bâtiments classés aux monuments historiques. Nous prenons l’exemple des fiches “Mérimée” du patrimoine architectural toulousain disponibles sur le site data.gouv.fr.
Cet article suit plusieurs objectifs. Tout d’abord, il montre qu’il est possible de réaliser une belle carte d’édition joliment mise en page entièrement avec R, sans passer par un logiciel de DAO. Elle vise aussi à montrer comment, avec une projection cartographique adéquate, faire varier la hauteur des frontières pour exprimer les valeurs de discontinuités.
Mots clefs : cartographie, PIB, discontinutés, rideau de fer, europe, inégalités, sémiologie graphique, carte
@articles{article_1,title={Le nouveau rideau de fer},subtitle={Un exemple de carte en 2.5D},author={Lambert, Nicolas},doi={10.48645/a4ra-yr11},url={https://rzine.fr/docs/20191125_ironcurtain/},language={fr},journal={Rzine},publisher={FR2007 CIST},year={2021},copyright={Creative Commons Attribution Share Alike 4.0 International},repository={https://github.com/rzine-reviews/ironcurtain},type={{Research article}},keywords={cartographie, PIB, discontinutés, rideau de fer, europe, inégalités, sémiologie graphique, carte},tags={cartographie, PIB, discontinutés, rideau de fer, europe, inégalités, sémiologie graphique, carte},issn={2743-8791},}