Utilisation de Google Sheets comme grattoir Web de base / benlcollins.com

 


https://www.benlcollins.com/spreadsheets/google-sheet-web-scraper/



Utilisation de Google Sheets comme grattoir Web de base

Vous souhaitez crĂ©er un grattoir Web dans Google Sheets ? Il s'avĂšre que le grattage Web de base, la rĂ©cupĂ©ration automatique des donnĂ©es des sites Web, est possible directement dans votre feuille de calcul Google, sans avoir besoin d'Ă©crire de code.

Vous pouvez extraire des informations spécifiques d'un site Web et les afficher dans votre feuille de calcul Google en utilisant certaines des formules spéciales de Sheets.

Par exemple, rĂ©cemment, j'avais besoin de connaĂźtre les auteurs d'une longue liste d'articles de blog Ă  partir d'un rapport Google Analytics, afin d'identifier les auteurs vedettes qui tiraient les pages vues. Il aurait Ă©tĂ© extrĂȘmement fastidieux d'ouvrir chaque lien et d'entrer manuellement le nom de chaque auteur. Heureusement, certaines techniques sont disponibles dans Google Sheets pour le faire pour nous.

Exemple de base de Web Scraper

Récupérez le fichier de solution pour ce tutoriel :
Cliquez ici pour obtenir votre propre copie >>

Pour les besoins de cet article, je vais démontrer la technique en utilisant des articles du New York Times.

Étape 1:

Prenons un article alĂ©atoire du New York Times et copions l'URL dans notre feuille de calcul, dans la cellule A1 :

Exemple d'URL du New York Times
Exemple d'URL du New York Times

Étape 2:

AccĂ©dez au site Web, dans cet exemple le New York Times :

Capture d'Ă©cran du New York Times
Capture d'Ă©cran du New York Times

Remarque - je sais ce que vous pensez, n'Ă©tait-ce pas censĂ© ĂȘtre automatisĂ© ?!? Oui, et ça l'est. Mais nous devons d'abord voir comment le New York Times Ă©tiquette l'auteur sur la page Web, afin que nous puissions ensuite crĂ©er une formule Ă  utiliser Ă  l'avenir.

Étape 3:

Survolez la signature de l'auteur et faites un clic droit pour faire apparaĂźtre le menu et cliquez "Inspect Element"comme indiquĂ© dans la capture d'Ă©cran suivante :

Le New York Times inspecte la sélection des éléments
Le New York Times inspecte la sélection des éléments

Cela fait apparaĂźtre la fenĂȘtre d'inspection du dĂ©veloppeur oĂč nous pouvons inspecter l'Ă©lĂ©ment HTML pour le byline :

ÉlĂ©ment New York Times dans la console dĂ©veloppeur
ÉlĂ©ment New York Times dans la console dĂ©veloppeur

Étape 4:

Dans la nouvelle fenĂȘtre de la console dĂ©veloppeur, il y a une ligne de code HTML qui nous intĂ©resse, et c'est celle en surbrillance :

<span class="byline-author" data-byline-name="JENNIFER MEDINA" itemprop="name" data-twitter-handle="jennymedina">JENNIFER MEDINA</span>

Nous allons utiliser la fonction IMPORTXML dans Google Sheets, avec un deuxiĂšme argument (appelĂ© "xpath-query") qui accĂšde Ă  l'Ă©lĂ©ment HTML spĂ©cifique ci-dessus.

La requĂȘte xpath, //span[@class='byline-author'], recherche les Ă©lĂ©ments span avec un nom de classe "byline-author", puis renvoie la valeur de cet Ă©lĂ©ment, qui est le nom de notre auteur.

Copiez cette formule dans la cellule B1, Ă  cĂŽtĂ© de notre URL :

=IMPORTXML(A1,"//span[@class='byline-author']")

La sortie finale pour l'exemple du New York Times est la suivante :

Exemple de scraper Web de base utilisant importXML dans Google Sheets
Exemple de grattage Web de base Ă  l'aide d'importXML dans Google Sheets

Exemple de Web Scraper avec des articles multi-auteurs

Considérez l'article suivant :

http://www.nytimes.com/2015/09/25/us/pope-francis-congress-speech.html

Dans ce cas, il y a deux auteurs dans la signature. La formule de l'Ă©tape 4 ci-dessus fonctionne toujours et renverra les deux noms dans des cellules sĂ©parĂ©es, l'une sous l'autre :

Récupération Web à deux auteurs à l'aide d'importXMLRécupération Web à deux auteurs à l'aide d'importXML
Web scrape Ă  deux auteurs Ă  l'aide d'importXML

C'est bien pour un cas Ă  usage unique, mais si vos donnĂ©es sont structurĂ©es en lignes (c'est-Ă -dire une longue liste d'URL dans la colonne A), vous devrez alors ajuster la formule pour afficher les deux noms d'auteur sur la mĂȘme ligne.

Pour ce faire, j'utilise une formule Index pour limiter la requĂȘte au premier auteur, de sorte que le rĂ©sultat n'existe que sur cette ligne. La nouvelle formule est :

=INDEX(IMPORTXML(A1,"//span[@class='byline-author']"),1)

Notez que le deuxiÚme argument est 1, qui se limite au prénom.

Ensuite, dans la cellule adjacente, C1, j'ajoute une autre formule pour collecter la deuxiĂšme signature de l'auteur :

=INDEX(IMPORTXML(A1,"//span[@class='byline-author']"),2)

Cela fonctionne en utilisant 2 pour renvoyer le nom de l'auteur en deuxiÚme position du tableau renvoyé par la fonction IMPORTXML.

Le résultat est:

Deux auteurs web scrape sur la mĂȘme ligne
Deux auteurs web scrape sur la mĂȘme ligne

Autres exemples de grattoirs Web multimédias

D'autres sites Web utilisent des structures HTML diffĂ©rentes, de sorte que la formule doit ĂȘtre lĂ©gĂšrement modifiĂ©e pour trouver les informations en rĂ©fĂ©rençant la balise HTML spĂ©cifique pertinente. Encore une fois, la meilleure façon de procĂ©der pour un nouveau site est de suivre les Ă©tapes ci-dessus.

Voici quelques exemples supplĂ©mentaires :

Pour Business Insider, la signature de l'auteur est accessible avec :

=IMPORTXML(A1,"//li[@class='single-author']")

Pour le Washington Post :

=INDEX(IMPORTXML(A1,"//span[@itemprop='name']"),1)

Utilisation de la fonction IMPORTHTML pour gratter des tableaux sur des sites Web

Récupérez le fichier de solution pour ce tutoriel :
Cliquez ici pour obtenir votre propre copie >>

ConsidĂ©rez la page WikipĂ©dia suivante, montrant un tableau des bĂątiments les plus hauts du monde :

https://en.wikipedia.org/wiki/List_of_tallest_buildings

Bien que nous puissions simplement copier et coller, cela peut ĂȘtre fastidieux pour les grandes tables et ce n'est pas automatique. En utilisant la formule IMPORTHTML , nous pouvons demander Ă  Google Sheets de faire le gros du travail pour nous :

=importhtml(A1,"table",2)

ce qui nous donne la sortie :

Importation Google Sheets du tableau Wikipedia
Importation Google Sheets du tableau Wikipedia

Trouver le numéro de table (dans cet exemple, 2) implique un peu d'essais et d'erreurs, en testant les valeurs à partir de 1 jusqu'à ce que vous obteniez la sortie souhaitée.

Notez que cette formule fonctionne également pour les listes sur les pages Web, auquel cas vous modifiez la référence "table" dans la formule en "liste".

Lectures complémentaires

Pour des exemples plus avancĂ©s, consultez :

Comment importer des statistiques de réseaux sociaux populaires dans Google Sheets

Autres formules d'IMPORT :

Si vous souhaitez Ă©tendre cette technique, vous voudrez consulter ces autres formules Google Sheet :

IMPORTDATA â€“ importe les donnĂ©es Ă  une URL donnĂ©e au format .csv ou .tsv

IMPORTFEED â€“ importe un flux RSS ou ATOM

IMPORTRANGE - importe une plage de cellules Ă  partir d'une feuille de calcul spĂ©cifiĂ©e.

156 réflexions sur "Utiliser Google Sheets comme grattoir Web de base"

  1. Existe-t-il un moyen de rĂ©cupĂ©rer des donnĂ©es protĂ©gĂ©es par un mot de passe, telles que le nombre total d'abonnĂ©s dans ma newsletter par e-mail ? Quelle est la syntaxe pour cela ?

    1. Salut Cindy !

      Malheureusement, ces formules IMPORT ne peuvent pas fonctionner avec des donnĂ©es derriĂšre un mur de mots de passe. Quel fournisseur de service de messagerie utilisez-vous ? Il est relativement facile de se connecter Ă  l'API MailChimp (je n'en ai pas essayĂ© d'autres) et d'extraire toutes sortes de donnĂ©es d'abonnĂ©s aux e-mails de cette façon. Je publierai un article Ă  ce sujet prochainement.

      Bravo,
      Ben

      1. Salut Ben - cela ne semble pas fonctionner sous forme d'essai de mise au rebut en utilisant votre formule mais je reçois "le contenu importé est vide".

        Business Insider a-t-il changĂ© son code ?

        Merci,

          1. Salut Ben. J'essaie d'utiliser une partie de votre message pour crĂ©er une certaine formule, mais j'ai du mal. Peut-ĂȘtre que vous pourriez aider. J'aimerais crĂ©er une formule Google Sheets pour extraire des donnĂ©es en direct de Yahoo Finance afin d'obtenir certaines informations sur les actions. La fonction "Googlefinance" n'affiche pas tout ce dont j'ai besoin et elle prĂ©sente Ă©galement des donnĂ©es dĂ©calĂ©es d'au moins 20 minutes par rapport au temps rĂ©el. Quoi qu'il en soit, je veux que ma formule affiche les pourcentages YTD, 1 mois, 3 mois, 6 mois, 1 an, 3 ans, 5 ans, 10 ans et maximum de retour sur investissement. J'aimerais que la formule affiche ces rĂ©sultats dans une colonne et recherche les donnĂ©es de Yahoo Finance en fonction des symboles boursiers que je saisirais manuellement dans une autre colonne. Un exemple serait que je taperais manuellement "ZROZ" dans la cellule A1 et la formule donnerait les cellules B1: J1 avec toutes les donnĂ©es en direct de Yahoo Finance. Le site est https: // finance.yahoo. com/quote/ZROZ/ performance?p=ZROZ

            Des idées??

      2. Ben, bonjour.
        comment prendre une cellule du tableau et la diriger vers le site, par exemple, A1 est la ligne de connaissance du produit, A2 est le prix du produit.?

      3. Salut Ben,
        Si j'ai besoin de me connecter à un tas de sites Web (à cause des abonnements) puis de télécharger du contenu en fonction d'un critÚre qui m'intéresse, puis-je le faire avec l'API Mailchimp et si oui, comment puis-je faire cela ?
        Les Ă©tapes que j'envisage sont les suivantes :
        1. Ouvrir des feuilles de calcul google
        2. Créer une liste de sites Web avec les colonnes de noms d'utilisateur et de mots de passe dont je veux récupérer mon contenu
        3. Exécuter les formules (avec une sorte de commande d'exécution, je suppose), c'est-à-dire, effectuez l'importation
        4. Enregistrez tout le contenu sur mon Google Drive
        5. Exécutez mon critÚre sur ces documents, par exemple, des documents PDF, des fichiers ZIP, etc., ou un tableau récapitulatif des informations, puis téléchargez "détail"
        6. Enregistrer le contenu détaillé sur vers un autre emplacement sur G-drive.

        Merci d'avance,

      4. Salut Ben,

        Jolies choses!

        Avez-vous dĂ©jĂ  publiĂ© quelque chose en vous connectant Ă  des sites Web avec un identifiant et un mot de passe ?

      5. Vous vous demandez maintenant que nous sommes en 2020, est-ce toujours le cas ? Vous cherchez Ă  obtenir des donnĂ©es d'un site protĂ©gĂ© par un mot de passe. Je me demande si c'est possible si je me connecte d'abord, puis exĂ©cute la commande ?

      6. Hey ben,
        Comment collectez-vous manuellement des donnĂ©es brutes et les mettez-vous facilement dans des feuilles Google ?

    1. Salut Dave,

      Malheureusement, je n'ai pas non plus Ă©tĂ© en mesure de rĂ©cupĂ©rer les donnĂ©es d'achat du client. Je pense que le problĂšme est que le contenu de la page est gĂ©nĂ©rĂ© dynamiquement (c'est une page Java Server ou .jsp, ce qui signifie que le contenu est crĂ©Ă© par programme), de sorte que les formules d'importation ne peuvent pas analyser ces donnĂ©es.

      Je vous tiendrai au courant si quelque chose fonctionne !

      Bravo,
      Ben

  2. Pouvons-nous rĂ©cupĂ©rer des donnĂ©es de Google.com et afficher toutes les URL dans une colonne par rapport Ă  une requĂȘte pour, par exemple, je recherche "Usman Farooq"

  3. Bonjour gars,

    Je ne sais pas si c'est spĂ©cifique Ă  la rĂ©gion (europe) ou google a changĂ© quelque chose (le message a 2 ans), mais j'ai dĂ» utiliser un point-virgule Â» ; " au lieu de deux-points ", " dans la formule.

    1. Salut Piotrek,

      Oui tu as raison! Il s'agit d'un changement rĂ©gional standard pour la syntaxe de l'Europe continentale.

      Bravo,
      Ben

  4. Bonjour,
    j'essaie d'utiliser cette mĂ©thode pour les annonces Street Easy. Le mien fonctionnera, puis je reviendrai Ă  la feuille plus tard et j'obtiendrai le message "
    Le contenu importĂ© par erreur est vide". et des idĂ©es pourquoi cela pourrait se produire?

    Merci

  5. En tant que personne qui utilise la programmation pour le grattage Web, cet article a Ă©tĂ© trĂšs utile. Je commence souvent avec des frameworks complexes comme Scrapy pour Python, sans rĂ©aliser qu'il existe des solutions plus simples. Bravo, Simon

  6. Bonjour ben;
    Tout d'abord, je voudrais admettre que ces infos sont gĂ©niales et incroyables, merci beaucoup ! et je voudrais vous poser 2 autres questions;

    1-Existe-t-il un moyen de rĂ©cupĂ©rer les donnĂ©es d'un site Web comprenant plusieurs pages ?
    2- (En fait, cette question dépend de votre réponse à la 1Úre question) Donc, s'il existe un moyen de pagination, existe-t-il un moyen automatisé de récupérer les données des pages qui nécessitent une vérification de l'ùge (en saisissant la date de naissance) parmi ces multiples pages?

    DĂ©solĂ© pour mon mauvais anglais j'espĂšre qu'il est assez bon pour vous faire comprendre mes questions 🙂

    Merci d'avance

    Salutations

    1. Salut Ozan,

      Il n'y a donc aucun moyen pour les formules standard de gĂ©rer la pagination et de rĂ©cupĂ©rer les donnĂ©es de plusieurs pages. Potentiellement, vous pouvez modifier l'URL Ă  chaque fois, en fonction de la façon dont elle a Ă©tĂ© configurĂ©e, de sorte que vous puissiez changer le numĂ©ro de pagination Ă  chaque fois, par exemple

      Dans une cellule mettre https://techcrunch.com/page/2/
      puis dans la cellule suivante : https://techcrunch.com/page/3/
      Dans la cellule suivante : https://techcrunch.com/page/4/
      etc ..

      puis exécutez la formule IMPORT pour chacun d'entre eux.

      Il n'y a aucun moyen de rĂ©cupĂ©rer des donnĂ©es qui nĂ©cessitent d'abord une vĂ©rification de l'Ăąge, sans utiliser Apps Script pour le faire par programmation. Les formules IMPORT sont assez basiques (mais puissantes !).

      J'espĂšre que cela pourra aider!

      Ben

  7. Salut Ben,

    J'essaie de récupérer une valeur pour une crypto-monnaie à partir de cette page

    https://bittrex.com/Market/Index?MarketName=BTC-ANS

    La valeur que je veux est dans le html comme ceci

    0.00203969

    J'ai essayé quelques syntaxes différentes, par exemple this

    =importxml(A1,"//span[@span data-bind='text: summary.displayLast()']")

    Mais impossible de trouver la bonne syntaxe.

    Pourriez-vous aider s'il vous plaĂźt.

    Merci

    1. Salut Sean,

      Malheureusement, je ne pense pas que ce sera possible avec ces formules IMPORT, car le site Bittrex est gĂ©nĂ©rĂ© dynamiquement en javascript cĂŽtĂ© client. J'ai essayĂ© toutes les astuces que je connais, mais je ne peux obtenir que les parties statiques comme les en-tĂȘtes, pas les donnĂ©es. En savoir plus sur ce problĂšme ici : https://www.benlcollins.com/spreadsheets/import-social-media-statistics/#notWorking

      Votre prochaine Ă©tape serait d'envisager d'Ă©crire un script Apps pour extraire ces donnĂ©es via l'API dont ils disposent (documents ici : https://bittrex.com/Home/Api ).

      Bravo,
      Ben

        1. Merci Ben c'est super, la prochaine question pourrait ĂȘtre idiote mais une fois que j'ai extrait ces donnĂ©es, comment puis-je les utiliser dans une autre formule sur la feuille?

          J'essaie de calculer une somme en utilisant cette valeur de prix * le nombre de piÚces que je détiens et cela ne fonctionne pas.

          Merci!

          1. Salut Sean,

            J'ai trouvĂ© cette formule =IMPORTXML(A1,"//span[@id='quote_price']"), avec l'URL dans la cellule A1, qui fonctionnait bien pour ĂȘtre utilisĂ©e dans d'autres formules (par exemple somme). J'ai fait formater la cellule en tant que nombre (ou comptabilitĂ©). Vous pouvez Ă©galement essayer d'envelopper votre formule existante avec la formule VALUE, comme ceci :

            =VALUE(existing formula in here)

            J'espĂšre que cela pourra aider! N'hĂ©sitez pas Ă  partager votre formule si elle pose toujours problĂšme.

            Ben

            1. DĂ©solĂ© Ben tu m'as perdu 🙂

              Au Q1 j'ai l'URL http://coinmarketcap.com/currencies/antshares

              À O1, j'ai ceci =IMPORTXML(Q1,"//span[@id='quote_price']")

              O1 est formaté en tant que financier mais, pour une raison quelconque, a toujours le symbole $

              À L13 j'ai une somme de mes piùces

              À L15, j'aimerais avoir un calcul et j'ai essayĂ© cela, mais cela ne fonctionne pas = somme (L13 * O1)

              Vous ne savez pas ce que vous voulez dire en enveloppant le formala existant avec le paramĂštre de valeur.

              Pouvez-vous expliquer avec un exemple selon mes champs ci-dessus?

              Merci beaucoup!

              Sean

              1. Salut Sean,

                Le $ est juste le formatage qui a été ajouté, c'est toujours un nombre.

                Si vous avez votre nombre total de piĂšces dans la cellule L13, en utilisant la formule SUM, par exemple SUM(L1:L10) disons, alors il vous suffit de multiplier cela par le taux $ de la formule IMPORT dans la cellule O1 pour obtenir la valeur, vous pas besoin d'utiliser la somme ici aussi.

                Bravo,
                Ben

                1. Je fais manifestement quelque chose de mal
.

                  La valeur L13 est 120

                  La valeur L10 est 10

                  à L15 je peux faire =sum(L13*L10) et j'obtiens le résultat attendu de 1200

                  À O1, j'ai la valeur importĂ©e de 8 $

                  Si j'essaie d'obtenir un total en utilisant cette valeur comme suit = somme (01 * L13)

                  Au lieu d'un nombre, j'obtiens #VALUE !

                  Je ne vois pas ou est le problùme 🙁

  8. Désolé, je viens de voir ça

    Fonction d' erreur
    Le paramĂštre MULTIPLY 1 attend des valeurs numĂ©riques. Mais '$8.04' est un texte et ne peut pas ĂȘtre converti en nombre.

    J'ai formaté O1 en tant que Number - Financial

    Avez-vous une idĂ©e de la raison pour laquelle il est toujours traitĂ© comme du texte ?

    1. Vous ne savez pas pourquoi le vĂŽtre s'affiche sous forme de texte, vous pouvez donc essayer les deux astuces suivantes partout oĂč vous souhaitez utiliser O1, remplacez-les par :

      VALUE(O1)

      ou

      O1 * 1

      N'hésitez pas à partager votre fiche si toujours pas de joie !

        1. Salut Sean,

          HonnĂȘtement, je ne sais pas pourquoi il est importĂ© sous forme de texte avec un "$" devant et n'est pas reconnu comme un nombre. Quoi qu'il en soit, voici une nouvelle formule qui ne traitera que de ce problĂšme (j'ai mis Ă  jour votre feuille avec la formule dans la case jaune):

          =iferror(value(IMPORTXML(Q3,"//span[@id='quote_price']")),value(substitute(IMPORTXML(Q3,"//span[@id='quote_price']"),"$ ”,””))))

          J'espĂšre que cela pourra aider! Une fois triĂ©, je supprimerai le lien vers votre feuille des commentaires ici.

          Bravo,
          Ben

  9. Salut Ben,

    Merci pour l'exemple. J'essaie d'obtenir le seul numĂ©ro disponible dans cette URL : https://blockexplorer.com/api/status?q=getDifficulty

    Lorsque je clique sur "inspecter l'Ă©lĂ©ment", il ne semble pas avoir de balises, d'en-tĂȘtes et il n'est mĂȘme pas dĂ©fini explicitement comme un document HTML ou XML - c'est juste du texte brut ! Et je ne trouve pas la bonne syntaxe en utilisant la fonction IMPORTXML pour que Google Sheets l'aime. Je n'arrĂȘte pas d'obtenir un #N/A ou #VALUE !

    J'ai essayé de mettre des caractÚres génériques et d'autres choses, mais je n'arrive pas à le faire fonctionner


    1. Salut Daniel,

      En supposant que vous ayez cette URL dans la cellule A1, vous pouvez utiliser cette formule pour obtenir les donnĂ©es dans votre feuille :

      =importdata(A1)

      Pour extraire uniquement le nombre, essayez la formule suivante :

      =regexextract(importdata(A1),"\d+.\d+")

      J'espĂšre que cela pourra aider!

      Ben

  10. Salut Ben,
    c'Ă©tait trĂšs utile.

    J'ai une question. Comment puis-je obtenir plusieurs donnĂ©es Ă  partir d'une page Web.
    Par exemple : je souhaite extraire toutes les URL des images et les balises alt correspondantes d'une liste de pages Web.
    Pourriez-vous s'il vous plaĂźt expliquer?
    Merci
    Abarna

  11. Salut Ben,

    J'ai un problĂšme similaire Ă  ceux ci-dessus concernant les feuilles de Crypto Currency. J'ai rĂ©ussi Ă  extraire les valeurs actuelles de coinmarketcap.com et cela fonctionne bien. Cependant, j'essaie maintenant d'extraire des donnĂ©es d'un autre site https://www.cryptocompare.com/coins/ndc/overview pour ĂȘtre prĂ©cis, en utilisant cette formule - =IMPORTXML(J23,"//div[@class=' valeur de prix']").
    Je suis presque sĂ»r d'avoir fait une erreur fondamentale, mais je n'ai dĂ©couvert que c'Ă©tait possible qu'hier
.lol J'ai parcouru youtube et les forums pour trouver une solution et je suis tombĂ© sur celui-ci
 Ce qui prĂ©cĂšde est le meilleur que j'ai rĂ©ussi Ă  trouver. Toute aide Ă  ce sujet serait apprĂ©ciĂ©e.

    Acclamations

    Carlton

  12. Salut Ben,

    Merci d'avoir répondu à toutes les questions, j'ai un problÚme pourriez-vous s'il vous plaßt le résoudre.
    ProblĂšme : J'essaie de rĂ©cupĂ©rer des donnĂ©es Ă  partir de l'URL de Google Maps ( https://www.google.com/maps/place/Inox+Movies+-+LEPL+Icon/@16.5027383,80.657804,17z/data=!3m1!4b1!4m5 !3m4!1s0x3a35fac8af6a8e6f:0x31b258f18dfbe910!8m2!3d16.5027383!4d80.6599927 )

    Ă  partir de cette URL, je voudrais que le nom de l'entreprise soit au format ci-dessous
    (Inox Movies - IcĂŽne LEPL)

    La formule est
    =query(importxml(A1,"//h1[@class='section-hero-header-title']"))

    Je ne reçois aucune donnĂ©e (montrant : ErrorImported content is empty.) Veuillez donc vĂ©rifier une fois et nous corriger ce que nous faisons mal.

    Merci d'avance


    1. Salut Sivaji,

      J'ai Ă©galement essayĂ© d'extraire ces donnĂ©es, mais malheureusement, je n'ai pas pu non plus. Pas sĂ»r que ce soit possible avec ces formules IMPORT

  13. Salut Ben,
    Merci pour l'article, il a l'air gĂ©nial et il semble que tu rĂ©pondes Ă  toutes les questions des dĂ©butants !
    J'essaie de faire ceci :
    1. la page Web suivante ( http://www.gcatholic.org/events/year/2017.htm#end ) rĂ©pertorie toutes les nominations et dĂ©missions des Ă©vĂȘques de l'Église catholique.
    2. Je souhaite importer rĂ©guliĂšrement dans une feuille de calcul Google le prĂ©nom, le nom, le titre et le pays des derniers Ă©vĂȘques nommĂ©s (et uniquement les nommĂ©s, pas les informations concernant ceux qui ont dĂ©missionnĂ© ou autre).
    J'essayais de le faire moi-mĂȘme aprĂšs avoir lu votre article, mais c'est plus compliquĂ© que je ne le pensais, et je suis plutĂŽt dĂ©butant.
    Merci pour toute aide,
    CĂ©dric

    1. Hi CĂ©dric,

      Vous pouvez utiliser cette formule pour obtenir rapidement toutes les donnĂ©es de cette page dans votre feuille de calcul Google :

      =importhtml("http://www.gcatholic.org/events/year/2017.htm","table",4)

      Cela devrait vous faire gagner du temps. Le moyen le plus rapide d'extraire ensuite les dĂ©tails de ces donnĂ©es est probablement manuellement, car les donnĂ©es ne sont pas structurĂ©es, c'est-Ă -dire textuelles, elles changent donc d'une ligne Ă  l'autre.

      J'espĂšre que cela pourra aider!

      Ben

      1. Merci Ben.
        Votre formule fonctionne en quelque sorte, mais je suppose que j'étais trop ambitieux en voulant importer à partir d'une page non structurée.
        CĂ©dric

  14. Bonjour Ben,
    Votre article est vraiment utile. Merci d'utiliser la fonction de requĂȘte ici. Malheureusement, votre suggestion ne peut pas rĂ©soudre mon problĂšme. Je veux vous expliquer avec cette image ci-dessous :
    https://cdn.pbrd.co/images/GNYpBTL.jpg

    Je rĂ©cupĂšre des donnĂ©es du thĂ©saurus de Collins pour diffĂ©rentes collections de mots. Lorsque je rĂ©cupĂšre les donnĂ©es de Collins, j'obtiens plus de 15 synonymes et leurs exemples respectifs dans une nouvelle colonne avec chaque synonyme dans une nouvelle ligne. L'image ci-dessus contient des synonymes et un exemple respectif de synonyme dans les 3e et 4e colonnes couvrant toutes les lignes des 3e et 4e colonnes de la feuille pour un seul mot Constitution. Comme il entre dans de nombreuses lignes, je ne peux pas utiliser la fonction Importxml sur d'autres lignes pour diffĂ©rents mots dans l'image. Avec votre exemple, il devient fastidieux d'ajouter un dĂ©calage Ă  15 synonymes diffĂ©rents. Donc, ce que je veux, c'est gratter les donnĂ©es de la maniĂšre dont tous les synonymes et leurs exemples respectifs dans une seule ligne elle-mĂȘme. Y a-t-il un moyen de le faire?

    1. Salut Bharat,

      Essayez d'envelopper votre fonction avec la transposefonction, elle ressemblera donc Ă  ceci :

      =TRANSPOSE(IMPORTXML(...))

      Cela devrait transformer les donnĂ©es en deux lignes pour vous. Il est beaucoup plus complexe d'obtenir ces donnĂ©es dans une seule ligne dans le bon ordre, mais c'est possible. Jetez un oeil Ă  cette feuille d'exemple : https://docs.google.com/a/benlcollins.com/spreadsheets/d/1e-mjf_HNWyYvkhFYWqRb2lTanAx77l-YXZO1YYPs71w/edit?usp=sharing

      J'espĂšre que cela pourra aider!

      Ben

  15. Bonjour, super article et ressources B.

    Connaissez-vous la fonction importxml Google Sheets pour identifier si le site utilise un schĂ©ma VideoObject comme celui-ci ?

    {
    "@context": "http://schema.org",
    "@type": "VideoObject",
    "name": "Title",
    "description": "Video description",
    "thumbnailUrl": [
    "https: //example.com/photos/1×1/photo.jpg »,
    « https://example.com/photos/4×3/photo.jpg »,
    « https://example.com/photos/16× 9/photo.jpg"
    ],
    "uploadDate": "2015-02-05T08:00:00+08:00",
    "durée": "PT1M33S",
    "contentUrl": "http://www.example.com /video123.flv",
    "embedUrl": "http://www.example.com/videoplayer.swf?video=123",
    "interactionCount": "2347"
    }

  16. Ben, il semble que vous soyez la personne vers qui se tourner pour extraire des donnĂ©es de pages Web. Voici donc :
    1. J'ai une liste d'entitĂ©s commerciales dans une feuille Google et le nom de l'entitĂ© commerciale est un lien hypertexte et je souhaite extraire le lien hypertexte vers une cellule de la mĂȘme ligne.
    2. Le lien qui vient d'ĂȘtre discutĂ© ci-dessus m'amĂšne ensuite Ă  une page contenant des informations sur cette entitĂ© commerciale - voir cet exemple - http://www.americanwineryguide.com/wineries/bridge-press-cellars/
    3. Je cherche Ă  les dĂ©tails d'extraction tels que l'adresse, l'e-mail, le tĂ©lĂ©phone, la fondation, les cas, etc. dans les cellules de la mĂȘme ligne.

    Qu'est-ce que tu penses?

    1. Salut Doug,

      Oui, cela devrait ĂȘtre possible, en fonction de l'URL que vous avez partagĂ©e. La formule IMPORT pour extraire les donnĂ©es de cet exemple est la suivante :

      =importxml(A1,"//div[@id='winery_detail_box1a']")

      Cela //div[@id='winery_detail_box1a']peut varier pour diffĂ©rents sites Web, vous devez donc utiliser la fonction Inspecter l'Ă©lĂ©ment pour trouver l'identitĂ© de l'Ă©lĂ©ment (voir le message ci-dessus).

      Bravo,
      Ben

  17. Bonjour ben!

    Merci pour un guide trĂšs utile! J'ai testĂ© cela sur plusieurs pages et cela fonctionne parfaitement.

    Cependant, j'échoue continuellement sur ce site (en suédois)
    http://www.morningstar.se/Funds/Quicktake/Overview.aspx?perfid=0P00009NT9&programid=0000000000

    J'essaie d'extraire par exemple le tableau avec "Årlig avkastning %" comme titre. En fait, je ne peux rien extraire de cette page sans utiliser IMPORTDATA.

    De plus, les addons chromés, par exemple Scraper, peuvent extraire avec le XPath
    "//*@id="ctl00_ctl01_cphContent_cphMain_quicktake1_col1_ctl00_ctl04″]/table"

    Mais j'Ă©choue dans ma feuille de calcul Google, donc je soupçonne que cela a quelque chose Ă  voir avec Java ?

    Avez-vous des propositions?

    1. Salut Émile,

      Si vous utilisez la fonction IMPORTDATA et faites dĂ©filer les donnĂ©es (ligne 1075 pour moi), vous verrez le tableau de donnĂ©es pour Årlig avkastning %. Cependant, ce n'est Ă©videmment pas trĂšs utile dans ce format. Vous pourrez peut-ĂȘtre extraire avec des formules REGEX mais ce serait assez difficile Ă  faire


      Vous avez raison de dire que la fonction IMPORTXML ne semble pas pouvoir renvoyer quoi que ce soit. Probablement parce que la page est (partiellement) gĂ©nĂ©rĂ©e par javascript.

      Bravo,
      Ben

    1. Hey Ritu - Malheureusement, je ne pense pas que vous puissiez le faire avec ces formules. Les valeurs sont gĂ©nĂ©rĂ©es par javascript, de sorte que les valeurs rĂ©elles tdet spanne sont que des espaces rĂ©servĂ©s vides dans lesquels le javascript peut insĂ©rer des valeurs. Si vous essayez de le faire =importdata("http://www.bitcoinrates.in/"), vous verrez que les tables sont vides.

    1. Salut Robi,

      Enfin rattrapé les commentaires.

      Vous feriez peut-ĂȘtre mieux de saisir toute la table en utilisant la formule IMPORTHTML comme ceci :

      =importhtml(A1,"table",2)

      De cette façon, vous obtenez toutes les colonnes.

      Si vous souhaitez ensuite extraire une entrĂ©e spĂ©cifique, vous pouvez utiliser la fonction QUERY pour l'extraire :

      =query(importhtml(A1,"table",2),"select * where Col2='#52'")

      oĂč dans ce cas j'ai prĂ©cisĂ© que je veux #52.

      J'espĂšre que cela pourra aider!

      Ben

  18. Salut Ben,
    est-il possible de faire la mĂȘme chose Ă  partir de Google Trends et si un graphique linĂ©aire du site Web peut ĂȘtre extrait sous forme de tableau Ă  l'aide de importxml ()

    merci
    Sid

  19. Salut Ben,
    Merci beaucoup pour ton article.
    J'essaie d'extraire des donnĂ©es d'un site Web avec une liste d'attributs comme celle-ci :

    Design :
    bottes d'hiver
    Utilisation recommandée : tous les
    jours ; Loisirs; RandonnĂ©e hivernale

    Tous les Ă©lĂ©ments ont la mĂȘme classe. Comment puis-je rĂ©soudre ça?

  20. Salut Ben,

    Wow, c'est un article super intĂ©ressant
. Je ne suis pas non plus un assistant Google Sheets, mais mĂȘme un dĂ©butant comme moi peut voir Ă  quel point quelque chose comme ça pourrait devenir puissant.

    Si je veux vĂ©rifier l'Ă©tat de l'URL/du lien (similaire Ă  ce post
 https://medium.com/@the.benhawy/how-to-use-google-spreadsheets-to-check-for-broken-links-1bb0b35c8525 ) pour des centaines d'URL Ă  la fois, le site Web n'interdirait-il pas mon IP ?

    Je me demande simplement si j'utilise ces codes/formules "fetchURL" ou "IMPORTXML" sur ma feuille de calcul Google, est-ce que je n'aurai pas de problĂšmes avec le site que je gratte ? Google Sheets utilise-t-il l'adresse IP de mon ordinateur portable pour effectuer ces commandes de rĂ©cupĂ©ration d'URL ou puis-je exĂ©cuter en toute sĂ©curitĂ© des centaines de ces vĂ©rifications Ă  la fois ?

    J'ai des centaines de liens pointant vers le mĂȘme site sur ma feuille en ce moment, donc si je crĂ©e la formule et que je la fais glisser vers le bas de ma feuille, j'ai peur que mon adresse IP soit bannie !

    Merci pour votre temps et votre attention avec ma question NOOB et encore une fois, excellent travail sur ce post.

  21. Ben,

    Ceci est une excellente ressource! Merci. Je me demande si vous pouvez me dire si les donnĂ©es de ce site Web - http://www.bet365.com (en particulier, dites les donnĂ©es de la NBA : https://www.bet365.com/?lng=1&cb=10326513237#/AC /B18/C20448857/D48/E1/F36/P ^48/Q^1/I) – peut ĂȘtre importĂ© dans Google Sheets ? J'ai eu du succĂšs avec d'autres sites mais je n'arrive pas Ă  importer celui-ci. Je suppose que c'est impossible Ă  gratter, mais pouvez-vous confirmer?

    Merci!
    Chris

  22. salut, merci de partager un article aussi utile. mais peut importer des formules peut ĂȘtre utilisĂ© dans un cas d'utilisation dans lequel l'utilisateur remplit le formulaire Google, concernant ses donnĂ©es personnelles et aprĂšs avoir rempli les dĂ©tails, il paiera pour ses affaires via paytm, et parallĂšlement tous les dĂ©tails ont Ă©tĂ© stockĂ©s dans google feuille, mais une fois le paiement effectuĂ© sur paytm, puis dans google feuille cette colonne est mise Ă  jour automatiquement avec un statut de « paiement reçu Â», qui a effectuĂ© le paiement.
    est-ce possible avec la mise au rebut Web. s'il vous plaĂźt laissez-moi savoir
    j'espĂšre que je suis en mesure d'expliquer le cas d'utilisation.

    1. Salut Naem,

      Essayez cette formule pour rĂ©cupĂ©rer toutes les donnĂ©es de classement Amazon :

      =index(importhtml($A$2,"list",10),9,1)

      Cela utilise ImportHtml pour extraire la liste de la page Amazon qui contient les données de classement, puis utilise un wrapper Index pour extraire la 9e ligne du tableau, qui contient les données de classement.

      Pour obtenir un numĂ©ro de classement individuel, Ă©tendez-le Ă  ceci :

      =value(regexextract(index(split(index(importhtml($A$2,"list",10),9,1),"#"),1,2),"[0-9,]+"))

      Cela divise le résultat par le "#" pour obtenir les différents classements, Index pour obtenir la partie pertinente du tableau, puis Regexextract pour saisir les nombres et Value pour les convertir de chaßnes en valeurs.

      J'espĂšre que cela pourra aider!

      Ben

  23. Merci Ben, trĂšs bon article et je m'en suis servi mais je suis aussi frustrĂ© par l'erreur "Chargement". Ce n'est mĂȘme pas cohĂ©rent. Avez-vous une idĂ©e de comment le contourner, peut-ĂȘtre?

    1. Merci Onder. Oui, ces formules peuvent ĂȘtre capricieuses, mais je ne suis pas sĂ»r que vous puissiez y faire quoi que ce soit. Une fois que vous les avez utilisĂ©es pour rassembler vos donnĂ©es, je vous suggĂšre de les convertir en valeurs statiques, afin de ne pas perdre les donnĂ©es si la formule cesse de fonctionner.

  24. Comment importer un prix spécifique d'un site Web vers Google Sheets
    Ex :
    le site Web est "https://www.amazon.in/gp/product/B06W55K9N6/ref=ox_sc_act_title_4?ie=UTF8&psc=1&smid=A14CZOWI0VEHLG"
    l'Ă©tiquette de prix est de 5899 et son
    xpath est //*[@id="priceblock_ourprice"]

    mais quand j'utilise la formule
    =IMPORTXML( https://www.amazon.in/gp/product/B06W55K9N6/ref=ox_sc_act_title_3?ie=UTF8&psc=1&smid=A14CZOWI0VEHLG , //*[@id="priceblock_ourprice"])

    me donnant #ERROR !

  25. Salut Ben! Merci pour cet article Ă©clairant. Je me demandais si cette formule de grattoir Web fonctionnerait avec des sites Web comme SimilarWeb, oĂč je souhaite extraire la valeur entiĂšre de la quantitĂ© de trafic qu'un site Web spĂ©cifique reçoit, comme indiquĂ© dans les rĂ©sultats de SimilarWeb ? Merci!

  26. Bonjour ben

    Vous vous demandez si cette mĂ©thode ou une mĂ©thode similaire fonctionne pour extraire des donnĂ©es spĂ©cifiques de documents pdf. J'ai besoin d'un systĂšme similaire pour saisir les donnĂ©es de ma feuille Google dans les donnĂ©es d'un site Web, cliquer sur un lien spĂ©cifique sur deux pages consĂ©cutives, puis effacer les donnĂ©es d'un pdf.

    Le site Web est http://nycprop.nyc.gov/nycproperty/nynav/jsp/selectbbl.jsp

    Par exemple
    Arrondissement : 1
    Bloc : 40
    Lot : 3

    Page 1 - Voir la facture trimestrielle de taxe sur les biens (QTPB)
    Page suivante - Cliquez pour voir l'
    adresse postale QPTB Scrub Ă  partir du pdf

  27. Salut je

    Ceci est incroyable! a rĂ©solu tant de problĂšmes pour moi!
    Les donnĂ©es sont-elles automatiquement actualisĂ©es au fur et Ă  mesure de leur mise Ă  jour sur la page d'oĂč elles proviennent ou y a-t-il du travail supplĂ©mentaire Ă  faire pour les mettre Ă  jour rĂ©guliĂšrement ?

    Acclamations

  28. Salut Ben,

    Ce fut une trÚs bonne expérience de lire et de regarder votre matériel de formation et de soutien.

    1. J'ai une requĂȘte en utilisant IMPORTXML, comment pouvons-nous remplacer un point de donnĂ©es vide ou manquant dans une liste de donnĂ©es entiĂšre par une valeur ou "NA" ?

    2. Comment pouvons-nous extraire l'image SRC ou le lien de l'image dans la feuille de calcul Ă  l'aide de IMPORTXML

    Merci d'avance!
    Navdeep

  29. Salut moi,

    Je veux importer une table Ă  partir du Web. Je peux le faire en utilisant la formule importhtml. Mais il ne se met pas Ă  jour automatiquement, mĂȘme en dĂ©finissant un dĂ©clencheur avec GAS. Pouvez-vous m'aider Ă  mettre Ă  jour le tableau automatiquement une fois qu'il est mis Ă  jour sur le Web ?

    Merci

  30. Bonjour Ben, j'espĂšre que vous pourrez m'aider Ă  obtenir les donnĂ©es Ă  droite dans ma feuille de calcul Google : https://www.dukascopy.jp/plugins/fxMarketWatch/?swfx_index

    J'ai essayĂ© ce qui suit qui n'a pas fonctionnĂ© : =ImportXML(“https://www.dukascopy.jp/plugins/fxMarketWatch/?swfx_index”,”//div[@class='F-qb-Gb']”)

    Qu'est-ce que j'ai fait de mal ou est-ce impossible Ă  importer ?

    Merci, Olivier

  31. Salut Ben,

    J'ai du mal à obtenir des données du site Web ManoMano dans une feuille Google.

    J'ai une liste de rĂ©fĂ©rences ME que je peux facilement combiner avec la requĂȘte de recherche pour me donner une url de travail comme : https://www.manomano.fr/recherche/ME4326301

    En utilisant Regexreplace et importxml, je peux obtenir le titre mais je cherche à identifier à la fois la catégorie (répertoriée comme fil d'Ariane dans le chemin XML) et le nom du vendeur (qui a //*[@id="js-product-content" ]/div[1]/div[2]/div[3]/div/div/p/a comme chemin xml).

    Je n'arrive pas non plus Ă  extraire dans une feuille Google.

  32. Salut Ben, quelle bonne solution, merci! J'ai une question : comment puis-je rĂ©cupĂ©rer le prix de cette source html ? 132,95
    €

  33. Hé, j'ai eu un bon jeu et j'ai réussi à extraire le titre sur cette page

    https://www.banggood.com/UMIDIGI-One-Max-6_3-Inch-Global-Bands-4150mAh-NFC-4GB-RAM-128GB-ROM-Helio-P23-4G-Smartphone-p-1393215.html?utmid=6224&ID=533906&cur_warehouse=HK

    J'essaie d'extraire l'URL de l'image, cependant, aucune des tentatives que j'ai essayĂ©es n'a abouti. Des pensĂ©es? Aussi, merci beaucoup pour ce guide, il a Ă©tĂ© extrĂȘmement utile!

  34. Informations trĂšs prĂ©cieuses ! Merci d'avoir mis ensemble. Quel est votre conseil pour scraper un site lorsque la page est partiellement ou totalement gĂ©nĂ©rĂ©e par javascript ? Y a-t-il un recours ?

  35. Salut ben, ce post est l'un des merveilleux de mon expérience.
    J'essaie de gratter une table vers une feuille Google Ă  partir de
    https://www.indiainfoline.com/markets/derivatives/long-buildup
    xpath query is //table[@class='table table_mkt fs12e mb0â€Č]

    Je voulais gratter le tableau des contrats Ă  terme sur actions expiration du mois en cours

    Cela ne me donne que des titres et non des données réelles

    Pouvez-vous s'il vous plaĂźt examiner cela?

    Merci d'avance

  36. Bonjour ben,

    J'ai essayĂ© d'importer le titre d'une feuille Google dans une autre. Le code source HTML montre File 101218 , donc j'ai utilisĂ© ceci :
    =IMPORTXML(I$1,"//span[@class='docs-title-input-label-inner']")
    mais il a produit 'Erreur - le contenu importé est vide'

    J'ai cliquĂ© avec le bouton droit de la souris dans la vue html de devtools et j'ai vu qu'il y avait un Ă©lĂ©ment de menu Copier> Xpath. J'ai essayĂ© et cela a donnĂ© "//*[@id='docs-title-widget']/div/span", que j'ai transformĂ© en formule
    =IMPORTXML(I$1,"//*[@id ='docs-title-widget']/div/span”), en corrigeant les guillemets doubles en simples.

    Je ne sais pas pourquoi cela est diffĂ©rent de la premiĂšre version, mais cela a Ă©galement produit le message "Erreur - le contenu importĂ© est vide". En gardant Ă  l'esprit le code HTML initial que j'ai collĂ© ci-dessus, savez-vous ce qui ne va pas ici, Ben ?

  37. Désolé, le code HTML collé était ce
    span class = "docs-title-input-label-inner"> fichier 101218 </span

    J'ai supprimé quelques crochets afin qu'il ne soit pas gùché par la validation du formulaire

  38. Si j'utilise IMPORTXML pour le grattage Web, comment puis-je comptabiliser les valeurs vides ou manquantes dans une certaine classe SPAN ? Fondamentalement, je souhaite que cette valeur s'affiche sous forme de cellule vide dans ma feuille de calcul plutĂŽt que de simplement passer Ă  la valeur suivante sur le site Web.

  39. Merci. Cela fonctionne sur papier, mais ne fonctionnera pas pour de nombreux sites dans la pratique. Exemple : =importxml("https://www.amazon.com/dp/B000ND74XA", "//title") donne "Robot Check".

  40. HĂ© Ben,
    je ne parviens pas à importer les données de Mode Analytics dans une feuille de calcul en utilisant votre formule importHTML (url, query, index) afin que vous puissiez me dire comment résoudre ce problÚme.

  41. pouvez-vous expliquer comment extraire l'URL de certaines images Ă  partir d'une recherche google basĂ©e sur un mot-clĂ© ? J'ai une feuille de calcul avec des titres de produits et je souhaite mettre 1 ou 2 URL d'images pour chaque produit dans les cellules Ă  cĂŽtĂ© des cellules de titre. Les titres des produits seraient les mots-clĂ©s.

  42. Bonjour Ben,
    Votre article sur le webscraping et les exemples sont trĂšs utiles. Vous ĂȘtes sans aucun doute la personne vers qui je peux compter pour extraire des donnĂ©es des pages Web ci-dessous.
    URL : https://www.bseindia.com/corporates/ann.html
    Dans le menu dĂ©roulant de la catĂ©gorie, je choisis "Mise Ă  jour de l'entreprise". Lorsque j'inspecte l'Ă©lĂ©ment, je ne trouve pas « Mise Ă  jour de l'entreprise Â». Je voudrais faire ce qui suit
    1. Grattez toutes les URL de toutes les entreprises sous "Mise à jour de l'entreprise" pour la journée.
    2. Grattez toutes les URL d'une liste d'entreprises dans ma feuille Google sous "Mise Ă  jour de l'entreprise" pour la journĂ©e. En ce qui concerne cette deuxiĂšme requĂȘte, disons que j'ai les codes d'entreprise ci-dessous 540691, 535755, 500410, 512599, 542066, 532921, 533096, 539254, 540025. (Les codes d'entreprise sont similaires aux symboles utilisĂ©s par NASDAQ comme AAPL pour Apple Inc). Je pourrais allonger la liste.
    S'il vous plaĂźt laissez-moi savoir comment casser cela.
    Merci
    Tundul

  43. Salut Ben!

    Vous vous demandiez si vous saviez quel agent utilisateur GoogleDocs utilise lors de l'exĂ©cution du scrape ? Je reçois une erreur de rĂ©cupĂ©ration, mais le contenu est disponible sous forme de rendu cĂŽtĂ© serveur, donc je suppose qu'il pourrait y avoir une sorte de restriction IP ou useragent. J'aimerais vĂ©rifier cela, mais je ne sais pas si cet agent utilisateur :
    Mozilla/5.0 (compatible ; GoogleDocs ; apps-spreadsheets ; http://docs.google.com )

    est en effet le seul que Google Sheets utilise ? Une idĂ©e? Merci

  44. Bonjour Ă  tous

    Est-ce que quelqu'un sait comment je renvoie une liste des URL sur une page donnĂ©e. J'ai trouvĂ© comment obtenir une liste des URL, mais elles ne donnent que le texte de l'URL, par exemple le libellĂ© d'un bouton CTA et non l'URL elle-mĂȘme.

    Voici le code que j'utilise pour ce site :
    https://www.pizzaexpress.com/wardour-street/book

    L'URL ci-dessus se trouve dans la cellule A2 (renvoyant RĂ©server maintenant pour le 36e lien de la page)
    =INDEX(importxml(A2, "//a"),36)

    Renvoie Réserver maintenant correctement, mais j'ai également besoin que le lien soit utilisé pour Réserver maintenant.

    Merci!

  45. HĂ©,

    Petite question, le tableau que je cherche Ă  importer comporte plusieurs pages. Comment puis-je obtenir toutes les donnĂ©es dans une feuille Google sans qu'elles ne soient coupĂ©es aux 50 premiĂšres lignes?

    Merci

  46. Salut Ben,

    Mon fichier est un téléchargement de fichier NARA (National Archives) accessible au public, formaté et étendu avec des formules, etc.

    Quelques formules "index/match" dans la colonne C et la colonne AB recherchent l'Ă©tat qui a attribuĂ© chaque SSN et l'Ă©tat de la ville correspondant au code postal de la personne au moment du dĂ©cĂšs. Colonne C, l'Ă©tat d'attribution est facile - remplit 100 % du temps. Cependant, la colonne AB accĂšde au tableau de la feuille 2 "Master 5-Digit
" qui comprend plus de 33 000 codes postaux mais en exclut en fait un certain nombre. Jusqu'Ă  10 % des recherches ne renvoient aucune correspondance. Alors, comment automatiser ?

    Je pensais que importxml devrait fonctionner mais comme vous pouvez le voir, je reçois des bĂȘtises. Je ne trouve pas d'exemple qui illustre ce cas d'utilisation : oĂč la page Web spĂ©cifique est dynamique en fonction de la valeur Ă  5 chiffres de la colonne AB. Cela semble super simple conceptuellement. Y a-t-il un moyen que vous pensiez faire pour simplifier la syntaxe par rapport Ă  la façon dont les Googleurs y pensent et l'expliquent ainsi dans les exemples disponibles en ligne ?

    J'ai passé des heures sur Youtube et j'ai essayé de travailler sur la syntaxe pour gagner du temps pour rechercher manuellement chaque enregistrement qui n'arrive pas.

    J'apprécie toute aide que vous pouvez fournir ou ressource que vous pouvez me diriger.

    Merci
    Stacey

  47. Existe-t-il un moyen d'obtenir des donnĂ©es d'un site Web auquel j'ai accĂšs et qui est protĂ©gĂ© par un mot de passe ? par exemple mes donnĂ©es sur Spreaker.com

    1. Pas avec ces formules, malheureusement. Vous devrez vous connecter Ă  l'API du site Web (en supposant qu'ils en ont une) et authentifier votre application. Il existe des outils tiers qui se connectent Ă  certains sites Web (par exemple, supermetrics) ou vous pouvez le coder vous-mĂȘme avec le script d'applications (voir cet article pour obtenir de l'aide pour dĂ©marrer avec apis : https://www.benlcollins.com/apps-script/api -tutoriel-pour-debutants/ )

  48. Salut Ben,

    Super article et partage. Je suis trĂšs nouveau sur ce sujet et j'aimerais supprimer le cours de l'action et d'autres informations sur les sites suivants :

    https://www.gurufocus.com/stock/V/summary
    https://www.morningstar.com/stocks/xnys/v/quote
    https://sg.finance.yahoo.com/quote/V
    https://www2.sgx.com/securities/equities/CRPU
    https://www.propertyinvestsg.com/singapore-reit-data/
    https://sreit.fifthperson.com/

    J'ai essayĂ© de suivre votre exemple mais j'ai donnĂ© des erreurs. Les formules peuvent-elles ĂȘtre utilisĂ©es pour ces sites ? Serait-il possible que vous me donniez quelques exemples de ces sites pour commencer ?

    Merci.

  49. Salut Ben,

    Merci d'avoir partagĂ©. C'est trĂšs utile.

    A)
    Pour les sites suivants, je peux rĂ©cupĂ©rer l'intĂ©gralitĂ© du tableau en utilisant ImportHTML() :
    https://www.propertyinvestsg.com/singapore-reit-data/
    https://sreit.fifthperson.com/

    Existe-t-il un moyen d'obtenir uniquement le prix en fonction d'un stock spĂ©cifique ?

    B)
    Pour le site ci-dessous :
    https://sg.finance.yahoo.com/quote/V

    Je suis en mesure d'obtenir toute la chaĂźne, c'est-Ă -dire
    V - Visa Inc. NYSE - NYSE Delayed Price. Devise en USD 189,39+0,23 (+0,12%)À la clĂŽture : 16h00 HNE

    Comment obtenir uniquement le cours de l'action ?

    C)
    Malheureusement, je ne parviens pas Ă  obtenir de rĂ©sultat (c'est-Ă -dire #N/A) pour les sites suivants utilisant ImportXML() :
    https://www.gurufocus.com/stock/V/summary
    https://www.morningstar. com/stocks/xnys/v/quote
    https://www2.sgx.com/securities/equities/CRPU

    La plupart des prix des actions et des informations proviennent de ces sites. J'apprĂ©cie vos conseils sur la façon dont je peux rĂ©cupĂ©rer le cours de l'action ainsi que d'autres informations, par exemple P / E, Quick Ratio, etc. Ă  partir de ces sites.

    Dans l'attente de votre réponse.

    Merci.

  50. Salut Ben,

    Pour le site suivant :
    https://sg.finance.yahoo.com/quote/V

    Je suis enfin en mesure d'obtenir le cours de l'action en utilisant la formule :
    IMPORTXML(Concat(“https://sg.finance.yahoo.com/quote/”,”V”),”//span[@data-reactid=' 14']”)

    Cependant, lorsque j'ai essayé de modifier le deuxiÚme paramÚtre de la fonction Concat en tant que variable et de l'appliquer à une liste de 340 actions, le chargement de toutes les valeurs prend beaucoup de temps et beaucoup s'affichent comme "chargement".

    Existe-t-il un moyen plus efficace de rĂ©cupĂ©rer les prix ?

    Merci.

  51. Salut Ben!

    Est-il possible de rĂ©cupĂ©rer les donnĂ©es de trafic et d'autres donnĂ©es de similarweb.com ? J'ai essayĂ© ceci mais cela n'a pas fonctionnĂ© (j'ai vĂ©rifiĂ© qu'il pointe vers la bonne cellule).

    https://www.similarweb.com/website/radarcupon.es

    =IMPORTXML(B4,"//span[@class='engagementInfo-valueNumberjs-countValue']")

    Merci pour ton aide!

    Il semble qu'ils utilisent la mĂȘme classe pour diffĂ©rentes valeurs, ce qui pourrait ĂȘtre le problĂšme ? Je serais trĂšs reconnaissant si vous pouviez me donner un exemple de la formule Ă  utiliser pour cela.

    1. Salut le lever du soleil,

      Je ne suis pas Ben mais je suppose que je peux aussi vous aider.

      =importxml(B4 ;"//span[@class='engagementInfo-valueNumber js-countValue']")

      Veuillez noter le caractĂšre d'espacement entre « 
valueNumber » et « js-
 ».

      Cordialement
      Jorn

  52. Salut Ben,

    J'ai essayĂ© d'importer un tableau d'ESPN pour les statistiques des joueurs PGA. L'URL est - https://www.espn.com/golf/leaderboard/_/tournamentId/401155427
    et lors de l'utilisation de importhtml, cela me donne les donnĂ©es du classement. Le tableau que je veux provient du 2e onglet de la page - Statistiques du joueur, mais l'URL ne change pas lorsque je clique dessus, je continue donc Ă  obtenir les donnĂ©es du classement. Y at-il un travail autour? Merci

  53. Salut Ben,

    Je ne suis pas sĂ»r que ce soit la mĂȘme formule, mais j'essaie d'extraire le nom de l'entreprise d'un domaine d'entreprise
 des idĂ©es ?

    par exemple, si j'ai le domaine thinkstream.com.au dans une colonne, j'aimerais que le nom de la société ThinkStream apparaisse dans une deuxiÚme colonne.

    Merci d'avance!

  54. Salut,

    Est-il possible de crĂ©er une feuille de calcul qui inclut les donnĂ©es d'une seule page, ainsi que les donnĂ©es des liens de cette page ?

    Par exemple, cet ensemble de donnĂ©es montre toutes les personnes incarcĂ©rĂ©es dans la prison du comtĂ© d'Alachua. Le nom de chaque personne renvoie Ă  plus d'informations Ă  leur sujet. Est-il possible de crĂ©er un tableau avec le nom de chaque personne, ainsi que des donnĂ©es provenant de la page de chaque personne ?
    http://oldweb.circuit8.org/cgi-bin/jaildetail.cgi?bookno=ASO20JBN001149

    Par exemple, nom, caution totale, date de réservation, etc.

    Merci!!

  55. Salut Ben,

    Je me demandais s'il Ă©tait possible de rĂ©cupĂ©rer les valeurs dans une liste dĂ©roulante ?

    Merci!

  56. "Super article. Je vĂ©rifiais constamment ce blog et je suis inspirĂ©!
    Des informations extrĂȘmement utiles, en particulier la section ultime 🙂 Je traite beaucoup de telles informations.

    Je cherchais cette information particuliĂšre depuis longtemps.

    Merci et bonne chance."

  57. Salut Ben!

    EXCELLENT ARTICLE!
    J'essaie de récupérer les informations de trafic de Similarweb à partir d'une liste de sites Web.
    J'ai du mal Ă  trouver l'identifiant des donnĂ©es, mĂȘme si je peux le voir clairement sur le site Web.

    Pouvez-vous m'aider avec la formule, s'il vous plaĂźt ?

    Merci d'avance
    Bernard

  58. Cela a fonctionnĂ© comme un charme pour moi! Je devais juste expĂ©rimenter, comme vous l'avez mentionnĂ©, avec le numĂ©ro de table dans la fonction importhtml, et cela a parfaitement intĂ©grĂ© les donnĂ©es. Exceptionnel! Oh les choses qui nous rendent heureux 😉

  59. Salut les gars! Super guide !

    Je cherche Ă  obtenir les valeurs d'osu! Des pages de profil comme celle-ci : « https://osu.ppy.sh/users/5529199/fruits » . J'essaie principalement d'obtenir le classement mondial, le classement des pays et le nombre sous "PP" sur les pages prĂšs du graphique linĂ©aire.

    J'ai essayĂ© de faire fonctionner la formule importxml pour ces 3 valeurs, mais la plupart des choses que j'essaie renvoient toutes N/A en disant qu'il ne peut pas trouver les valeurs, etc. En regardant les Ă©lĂ©ments, il semble que les nombres soient enterrĂ©s sous beaucoup de couches div, mais toujours pas de chance, mĂȘme en copiant le Xpath Ă  partir du site.

    Quelqu'un a des idĂ©es sur la façon dont je peux obtenir ces chiffres? Comme j'essaie de crĂ©er une feuille de calcul pour un tournoi que nous organisons et que ces chiffres sont mis Ă  jour rĂ©guliĂšrement, la saisie manuelle n'est donc pas vraiment une option.

    Merci pour votre dent 🙂

  60. Bonjour Ben, j'essaie d'extraire l'Ă©lĂ©ment de date d'expĂ©dition sur la page Amazon : https://www.amazon.co.uk/dp/B00J8I72PQ , mais lorsque j'essaie d'inspecter l'Ă©lĂ©ment, je ne vois pas le texte Ă  dĂ©clenchez-le pour afficher la date de livraison, ci-dessous le code que je reçois.

    Merci d'avance,

    À M

    Livraison gratuite

    22 septembre – 21 octobre

    pour les membres Prime

    DĂ©tails

  61. Bonjour, j'essaie d'extraire les prix du site Aliexpress, est-ce possible ? je ne pouvais pas le faire! Quelqu'un peut-il m'aider?

  62. Il n'y a pas de solution au problĂšme de suppression des visites mensuelles de SimilarWeb ?
    :/
    Un peu la chose la plus difficile Ă  mettre au rebut..

  63. Salut,

    Je me demandais s'il existe une formule à utiliser pour obtenir des données d'une autre feuille et filtrer la date en utilisant la date dans la validation des données

  64. Ben,

    J'essaie d'extraire le tableau des "statistiques diverses" de https://www.basketball-reference.com/leagues/NBA_2021.html . J'ai pu extraire des tables jusqu'au n ° 4, toute valeur de table que j'utilise aprĂšs cela ne me fournit aucune information. Je suis allĂ© de l'avant et j'ai tentĂ© jusqu'au n ° 50 en espĂ©rant que c'Ă©tait un accident Ă©trange, mais je l'ai fait sans aucun succĂšs. J'ai essayĂ© de parcourir le code dans l'espoir de trouver la table # et j'ai Ă©chouĂ© lĂ  aussi
.

    si vous trouvez un succĂšs dans ce domaine, ce serait formidable !

    Merci

  65. Salut! merci pour les informations trĂšs utiles, j'essaie de capturer l'autre page Web, et j'ai trouvĂ© difficile les "donnĂ©es dynamiques", qui changent avec le temps, comme le rĂ©sultat de cette formule,
    =importxml("https://www .myethshop.com/", "//*[@id='now_timestamp']")
    affichĂ© uniquement "-", pourquoi ?
    J'espÚre que vous pourriez m'aider à résoudre, merci

  66. Salut Ben!
    Super post a beaucoup appris.
    Je suis un projet en Inde oĂč nous organisons des vidĂ©os en ligne pour les enfants qui ne sont actuellement pas scolarisĂ©s en raison de la pandĂ©mie. Nous avons une liste de vidĂ©os youtube dĂ©jĂ  organisĂ©es - ce que nous voulons, c'est obtenir les noms de tous les propriĂ©taires de vidĂ©os youtube / noms de chaĂźnes. Est-ce que ce sera possible avec ça ?
    https://www.youtube.com/watch?v=dzOP7jliAKM â€“ une de ces vidĂ©os par exemple

  67. Le problĂšme auquel je suis confrontĂ© est si la ligne a td class="bocss-table__td bocss-table__td–data" oĂč le nombre est suivi d'un .

Commentaires

Posts les plus consultés de ce blog

Glossaire du Marketing Digital

Comment trouver des produits tendance AliExpress pour votre magasin

Optimiser vos URLs : 11 bons conseils pour améliorer votre référencement

Marketing Digital : le guide complet pour un chef d'entreprise

🌟 Comment faire du dropshipping avec CHAT GPT *° |[ Full dossierv 2024 ] đŸ’„

Recherche de mots-clés : TOP 10 des outils gratuits

Meilleurs outils de rĂ©fĂ©rencement 🛠 organisĂ©e par Saijo George

Mixed In Key 10 Crack + Code d'activation [Dernier] 2022 - VST Homes

Les 14 meilleurs liens du dark web en 2022 (+ Comment naviguer sur des sites en .onion)

Se fixer des objectifs : Pourquoi et comment réussir ?