Skip to content

abduoqb/vinted-scraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Vinted Scraper

Scraper automatisé pour télécharger les images de profils Vinted.

Installation

pip install -r requirements.txt

Utilisation

Scraper principal (downloader_vinted.py)

Syntaxe de base :

python downloader_vinted.py <url_profil> [options]

Options disponibles :

  • --update : Mode mise Ă  jour (tĂ©lĂ©charge uniquement les nouveaux articles)
  • --debut N : Commencer Ă  partir de l'article N
  • --article N : TĂ©lĂ©charger uniquement l'article N
  • --max N : Limiter Ă  N articles maximum
  • --profile-pic : TĂ©lĂ©charger aussi la photo de profil (skip si existe dĂ©jĂ )

Exemples d'utilisation

1. Scraper complet avec photo de profil

python downloader_vinted.py https://www.vinted.fr/member/12345 --profile-pic

→ Télécharge tous les articles + la photo de profil

2. Mode mise Ă  jour (nouveaux articles uniquement)

python downloader_vinted.py https://www.vinted.fr/member/12345 --update

→ Ne télécharge que les articles ajoutés depuis le dernier scrape

3. Limiter le nombre d'articles

# Télécharger seulement les 50 premiers articles
python downloader_vinted.py https://www.vinted.fr/member/12345 --max 50

# Télécharger 20 articles avec photo de profil
python downloader_vinted.py https://www.vinted.fr/member/12345 --max 20 --profile-pic

4. Télécharger un article spécifique

# Télécharger uniquement l'article numéro 10
python downloader_vinted.py https://www.vinted.fr/member/12345 --article 10

→ Télécharge seulement le 10ème article trouvé

5. Commencer Ă  partir d'un article

# Commencer Ă  partir de l'article 25
python downloader_vinted.py https://www.vinted.fr/member/12345 --debut 25

→ Ignore les 24 premiers articles, commence au 25ème

6. Combiner plusieurs options

# Mise Ă  jour + photo de profil
python downloader_vinted.py https://www.vinted.fr/member/12345 --update --profile-pic

# 100 articles max + photo de profil
python downloader_vinted.py https://www.vinted.fr/member/12345 --max 100 --profile-pic

# Commencer Ă  l'article 50, max 20 articles
python downloader_vinted.py https://www.vinted.fr/member/12345 --debut 50 --max 20

Workflows complets

Workflow 1 : Scraper basique

# Télécharger tous les articles
python downloader_vinted.py https://www.vinted.fr/member/12345

Workflow 2 : Scraper complet avec photo de profil

# Tout en une commande
python downloader_vinted.py https://www.vinted.fr/member/12345 --profile-pic

Workflow 3 : Mise Ă  jour quotidienne

# Chaque jour, récupérer seulement les nouveaux articles
python downloader_vinted.py https://www.vinted.fr/member/12345 --update --profile-pic

Workflow 4 : Multi-profils

# Scraper plusieurs profils
python downloader_vinted.py https://www.vinted.fr/member/111 --profile-pic
python downloader_vinted.py https://www.vinted.fr/member/222 --profile-pic
python downloader_vinted.py https://www.vinted.fr/member/333 --profile-pic

Workflow 5 : Test rapide (10 articles)

# Tester sur un petit échantillon
python downloader_vinted.py https://www.vinted.fr/member/12345 --max 10 --profile-pic

Format des fichiers

Les images sont nommées : username_articleID_numeroPhoto.extension

Exemples :

  • wizard_12345678_01.jpg → Article 12345678, photo 1
  • wizard_12345678_02.jpg → Article 12345678, photo 2
  • archer_98765432_01.webp → Article 98765432, photo 1

Avantages :

  • Retrouver l'article original : https://www.vinted.fr/items/12345678
  • Identifier le vendeur directement dans le nom
  • Aucune collision de noms mĂŞme en regroupant plusieurs profils

Structure des dossiers

diksa/
├── downloader_vinted.py
├── requirements.txt
├── README.md
└── profiles/
    ├── wizard/
    │   ├── journal_scraping.json
    │   ├── wizard_profile.jpg
    │   ├── wizard_12345678_01.jpg
    │   ├── wizard_12345678_02.jpg
    │   └── wizard_87654321_01.jpg
    ├── archer/
    │   ├── journal_scraping.json
    │   ├── archer_profile.webp
    │   └── archer_98765432_01.jpg
    └── giant/
        └── ...

Prérequis

  • Python 3.8+
  • Google Chrome (pour Selenium)
  • ChromeDriver (gĂ©rĂ© automatiquement par webdriver-manager)

Cas d'usage

Analyse de tendances

Collecter des images de vêtements pour étudier les styles populaires.

Dataset pour IA

Créer un dataset d'images de vêtements pour entraîner des modèles.

Veille concurrentielle

Suivre les nouveaux articles de vendeurs concurrents automatiquement avec --update.


FAQ

Q : Combien de temps pour scraper un profil de 200 articles ? R : Environ 5-10 minutes (avec pauses anti-détection de 1-3s entre articles).

Q : Est-ce que le scraper fonctionne si Vinted change son HTML ? R : Non, les sélecteurs CSS devront être mis à jour dans le code.

Q : Puis-je scraper plusieurs profils en parallèle ? R : Non recommandé, risque de ban IP. Lancez les scrapes séquentiellement.

Q : Que fait le fichier journal_scraping.json ? R : Il sauvegarde les articles déjà téléchargés pour éviter les doublons et permettre --update.

Q : Comment retrouver l'article original d'une image ? R : Nom de fichier wizard_12345678_01.jpg → Article sur https://www.vinted.fr/items/12345678


Avertissement légal

Ce projet est à but éducatif. Le scraping de Vinted peut violer leurs Conditions d'Utilisation. Utilisez à vos risques et périls. Respectez les lois sur la protection des données (RGPD).

About

🛍️ Vinted Scraper - Python tool to download product images from Vinted sellers with Selenium and anti-detection

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages