Premiers pas en web scraping

Introduction à la collecte automatique de données du web

Auteur·es :
Léa Christophe (UMR Géographie-cités, Université Paris 1 Panthéon-Sorbonne)
Hugues Pecout (UMR Géographie-cités, CNRS)
Robin Cura (UMR PRODIG, Université Paris 1 Panthéon-Sorbonne)
Alexandre Cebeillac (UMR IDEES, Université de Rouen Normandie)
Sébastien Rey-Coyrehourcq (UMR IDEES, Université de Rouen Normandie)

Evaluateur·trices :
Nathalie Abadie (UMR LASTIG, IGN)
Thibault Le Corre (Université de Montréal (UdeM), département de géographie)

Résumé :
Cet article est une introduction à la collecte automatisée de données sur le web. Il présente les principes fondamentaux du web scraping, comme l’envoi de requêtes et l’analyse de pages HTML, tout en proposant des exemples concrets et reproductibles. Destiné aux débutants, il vise à rendre ces techniques compréhensibles et applicables pour explorer et structurer des données du web. Cet article peut être utilisé comme support pour une initiation aux bases de la collecte automatique de données du web avec R.

Pour le consulter, cliquez ici

Name		Name	Last commit message	Last commit date
Latest commit History 110 Commits
correction_exo_HTML		correction_exo_HTML
data		data
exo_HTML		exo_HTML
figures		figures
index_cache/html		index_cache/html
index_files/figure-html		index_files/figure-html
offline_data		offline_data
.gitignore		.gitignore
.gitlab-ci.yml		.gitlab-ci.yml
README.md		README.md
Rzine_citation.csl		Rzine_citation.csl
biblio.bib		biblio.bib
cite.bib		cite.bib
correction_exo_HTML.zip		correction_exo_HTML.zip
exo_HTML.zip		exo_HTML.zip
featured.png		featured.png
index.Rmd		index.Rmd
index.html		index.html
rzine_webscraping.Rproj		rzine_webscraping.Rproj

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Premiers pas en web scraping

Introduction à la collecte automatique de données du web

About

Uh oh!

Releases

Packages

Contributors 6

Uh oh!

Languages

rzine-reviews/rzine_webscraping

Folders and files

Latest commit

History

Repository files navigation

Premiers pas en web scraping

Introduction à la collecte automatique de données du web

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 6

Uh oh!

Languages

Packages