Faire du scraping avec Google Dorks - Exemple

Faire du scraping avec Google Dorks - Exemple


Faire du scraping avec Google Dorks - Exemple

Voici une mĂ©thode qui peut ĂȘtre intĂ©ressante pour le scraping en s'aidant des rĂ©sultats de recherche avancĂ©e de Google (aussi appelĂ©e Google Dorks).

Sommaire :

Google dorks c'est quoi ?

Les Google Dorks sont les recherches avancées de Google. Il existe des commandes pour chercher sur un site web spécifique, une URL, des fichiers .pdf, etc...

Pour les utiliser, il suffit de les taper dans la barre de recherche Google.

Il existe aussi une page web pour construire ces recherches plus aisĂ©ment. : https://www.google.com/advanced_search

Quelques commande Google Dorks

  1. Recherche d'un mot exact :

    • Utilisation : "mot exact"
    • Exemple : "intelligence artificielle"
  2. Exclure un mot :

    • Utilisation : -mot
    • Exemple : pomme -iphone
  3. Recherche dans un site spĂ©cifique :

    • Utilisation : site:domaine.com
    • Exemple : intelligence artificielle site:wikipedia.org
  4. Rechercher une URL spĂ©cifique :

    • Utilisation : inurl:mot
    • Exemple : inurl:blog
  5. Rechercher un texte dans le titre de la page :

    • Utilisation : intitle:mot
    • Exemple : intitle:recette
  6. Rechercher des mots dans le texte :

    • Utilisation : intext:mot
    • Exemple : intext:"machine learning"
  7. Recherche de fichiers spĂ©cifiques :

    • Utilisation : filetype:type
    • Exemple : introduction machine learning filetype:pdf
  8. Recherche de pages liĂ©es :

    • Utilisation : link:domaine.com
    • Exemple : link:openai.com
  9. Recherche de pages qui mentionnent un certain mot, mais sans le mot lui-mĂȘme :

    • Utilisation : info:domaine.com
    • Exemple : info:openai.com
  10. Recherche par plage de nombres :

    • Utilisation : mot $X..$Y
    • Exemple : laptop $500..$1000
  11. Rechercher dans le cache Google d'une URL :

    • Utilisation : cache:URL
    • Exemple : cache:openai.com

Exemple Google Dorks pour le scraping

Voila quelques exemple concret d'utilisation pour le scraping.

Recherche d'une page contact d'un site web specifique :

 -   site:bvl-menuiserie.fr inurl:contact

scraping google dorks

Recherche d'un sitemap :

 -   site:m-habitat.fr "sitemap"

scraping google dorks

Recherche de menuisier Ă  paris avec une page contact :

 -   "menuisier" "paris" email inurl:contact

scraping google dorks

Scraper les résultats de recherche Google

Une fois que vous avez trouvé les résultats qui vous intéressent, il va falloir scraper le contenu (si vous avez beaucoup de pages).

Il existe plusieurs solutions, personnellement j'utilise le logiciel "Browser Automation Studio" de Bablosoft.

C'est un logiciel gratuit qui permet de scraper et d'automatiser des tùches. Il n'est pas simple d'utilisation, si vous souhaitez vous former, j'ai créé une formation.

Lien formation Browser Automation Studio

Il existe d'autres logiciels comme Octoparse ou Outscraper, mais le plus souvent payants ou trÚs limités en version gratuite.

Si vous souhaitez que je scrape des résultats de recherche pour vous, je peux le faire, n'hésitez pas à me contacter.

Commentaires

Posts les plus consultés de ce blog

13 endroits diffĂ©rents pour soumettre votre musique ! – Cymatics.fm

Comment créer un tunnel de vente rentable ?

🚀 DĂ©bloquez TOUT votre potentiel musical avec notre LiSTE d' EMAiLs pros & perso des plus grands RAPPEURS ✨(Hip-hop Fr ➕ US) !

Aide-mĂ©moire (full)) ChatGPT ⭐ T👌°P invites / PROMPTS pour les PROS et ➕ . . . 2023

Blog SEO : Conseils pour améliorer votre référencement

Tutoriel BlueGriffon : Comment concevoir un site Web avec BlueGriffon (thesitewizard.com)

Comment fonctionne FL Studio ? Conseils pour les débutants | Bax Music Blog

🚀 TOP prompts ChatGPT ( FULL)) pour booster votre business 2024 *°

Les 17 meilleurs films sur la MDMA et l'ecstasy - Reportages - Mixmag

MUSIC LIBRARIES LIST 2023