Scraper automatisé pour télécharger les images de profils Vinted.
pip install -r requirements.txtSyntaxe de base :
python downloader_vinted.py <url_profil> [options]Options disponibles :
--update: Mode mise à jour (télécharge uniquement les nouveaux articles)--debut N: Commencer à partir de l'article N--article N: Télécharger uniquement l'article N--max N: Limiter à N articles maximum--profile-pic: Télécharger aussi la photo de profil (skip si existe déjà )
python downloader_vinted.py https://www.vinted.fr/member/12345 --profile-pic→ Télécharge tous les articles + la photo de profil
python downloader_vinted.py https://www.vinted.fr/member/12345 --update→ Ne télécharge que les articles ajoutés depuis le dernier scrape
# Télécharger seulement les 50 premiers articles
python downloader_vinted.py https://www.vinted.fr/member/12345 --max 50
# Télécharger 20 articles avec photo de profil
python downloader_vinted.py https://www.vinted.fr/member/12345 --max 20 --profile-pic# Télécharger uniquement l'article numéro 10
python downloader_vinted.py https://www.vinted.fr/member/12345 --article 10→ Télécharge seulement le 10ème article trouvé
# Commencer Ă partir de l'article 25
python downloader_vinted.py https://www.vinted.fr/member/12345 --debut 25→ Ignore les 24 premiers articles, commence au 25ème
# Mise Ă jour + photo de profil
python downloader_vinted.py https://www.vinted.fr/member/12345 --update --profile-pic
# 100 articles max + photo de profil
python downloader_vinted.py https://www.vinted.fr/member/12345 --max 100 --profile-pic
# Commencer Ă l'article 50, max 20 articles
python downloader_vinted.py https://www.vinted.fr/member/12345 --debut 50 --max 20# Télécharger tous les articles
python downloader_vinted.py https://www.vinted.fr/member/12345# Tout en une commande
python downloader_vinted.py https://www.vinted.fr/member/12345 --profile-pic# Chaque jour, récupérer seulement les nouveaux articles
python downloader_vinted.py https://www.vinted.fr/member/12345 --update --profile-pic# Scraper plusieurs profils
python downloader_vinted.py https://www.vinted.fr/member/111 --profile-pic
python downloader_vinted.py https://www.vinted.fr/member/222 --profile-pic
python downloader_vinted.py https://www.vinted.fr/member/333 --profile-pic# Tester sur un petit échantillon
python downloader_vinted.py https://www.vinted.fr/member/12345 --max 10 --profile-picLes images sont nommées : username_articleID_numeroPhoto.extension
Exemples :
wizard_12345678_01.jpg→ Article 12345678, photo 1wizard_12345678_02.jpg→ Article 12345678, photo 2archer_98765432_01.webp→ Article 98765432, photo 1
Avantages :
- Retrouver l'article original :
https://www.vinted.fr/items/12345678 - Identifier le vendeur directement dans le nom
- Aucune collision de noms mĂŞme en regroupant plusieurs profils
diksa/
├── downloader_vinted.py
├── requirements.txt
├── README.md
└── profiles/
├── wizard/
│ ├── journal_scraping.json
│ ├── wizard_profile.jpg
│ ├── wizard_12345678_01.jpg
│ ├── wizard_12345678_02.jpg
│ └── wizard_87654321_01.jpg
├── archer/
│ ├── journal_scraping.json
│ ├── archer_profile.webp
│ └── archer_98765432_01.jpg
└── giant/
└── ...
- Python 3.8+
- Google Chrome (pour Selenium)
- ChromeDriver (géré automatiquement par webdriver-manager)
Collecter des images de vêtements pour étudier les styles populaires.
Créer un dataset d'images de vêtements pour entraîner des modèles.
Suivre les nouveaux articles de vendeurs concurrents automatiquement avec --update.
Q : Combien de temps pour scraper un profil de 200 articles ? R : Environ 5-10 minutes (avec pauses anti-détection de 1-3s entre articles).
Q : Est-ce que le scraper fonctionne si Vinted change son HTML ? R : Non, les sélecteurs CSS devront être mis à jour dans le code.
Q : Puis-je scraper plusieurs profils en parallèle ? R : Non recommandé, risque de ban IP. Lancez les scrapes séquentiellement.
Q : Que fait le fichier journal_scraping.json ?
R : Il sauvegarde les articles déjà téléchargés pour éviter les doublons et permettre --update.
Q : Comment retrouver l'article original d'une image ?
R : Nom de fichier wizard_12345678_01.jpg → Article sur https://www.vinted.fr/items/12345678
Ce projet est à but éducatif. Le scraping de Vinted peut violer leurs Conditions d'Utilisation. Utilisez à vos risques et périls. Respectez les lois sur la protection des données (RGPD).