Comment utiliser la capacité d'analyse de fichiers de ChatGPT (et ce qu'elle peut faire pour vous) | ZDNET
Comment utiliser la capacité d'analyse de fichiers de ChatGPT (et ce qu'elle peut faire pour vous)
OpenAI a dévoilé il y a une semaine une nouvelle fonctionnalité pour ChatGPT appelée « mémoire », qui stocke les éléments auxquels vous demandez explicitement au programme d'avoir accès, pour une utilisation ultérieure.
Outre la mémoire, il est bon de rappeler que ChatGPT peut également utiliser les capacités de téléchargement de fichiers existantes pour analyser du texte et des images. Il vous suffit de glisser et de déposer un fichier dans la fenêtre de discussion, tel qu'un PDF ou un JPEG, d'ajouter une invite si vous le souhaitez, et ChatGPT commencera à produire du texte en fonction de ce que vous avez téléchargé.
Aussi : Comment utiliser ChatGPT
Cette fonctionnalité est disponible pour tous les utilisateurs payants de la version « Plus » à 20 $ par mois . La version Plus a la capacité supplémentaire d'utiliser la dernière version de ChatGPT, la version 4, au lieu de la version 3.5, et la qualité de sortie peut être sensiblement meilleure. Plus permet également l'utilisation de DALL-E , le programme de génération d'images.
Les utilisations les plus évidentes du téléchargement de fichiers sont le résumé, la présentation et des types de recherche sémantique plus avancés au-delà de la simple recherche par mot clé. Le téléchargement de fichiers est simple : il suffit de faire glisser.
La fonction de téléchargement de fichiers brille lorsqu'on lui présente un long document et qu'on lui demande de faire quelque chose comme isoler thématiquement des types particuliers de contenu. Il s’agit d’une forme de recherche sémantique, c’est-à-dire qui ne repose pas strictement sur un mot-clé individuel.
Par exemple, j'ai mis en ligne un rapport de 4 500 mots sur les semi-conducteurs spécialisés connus sous le nom de carbure de silicium. Le carbure de silicium est largement utilisé dans Tesla et d'autres véhicules électriques pour créer ce qu'on appelle l'onduleur de traction. Mais ses applications sont moins évidentes. J'ai demandé à ChatGPT : « Dans ce rapport sur le carbure de silicium, y a-t-il des références à des cas d'utilisation non automobiles ?
Aussi : Les meilleurs chatbots IA
ChatGPT a répondu avec un excellent résumé de six cas d'utilisation identifiés dans le rapport et ne concernant pas les voitures. C'est plus puissant que de devoir utiliser des mots-clés individuels. J'ai envisagé d'utiliser ChatGPT comme source de référence pour faire un premier essai avec des documents longs.
Le résumé textuel est utile pour les longues transcriptions d’entretiens. J'ai téléchargé une transcription de 6 800 mots et obtenu un résumé utilisable des sujets les plus importants qui pourrait être le début d'un aperçu d'un entretien basé sur la transcription.
Cependant, de tels résumés ne remplacent pas l’édition et la mise en forme d’une histoire. Ce type de compression des données nécessite d'identifier les thèmes, de les reformuler de manière utile et, plus important encore, de décider quels éléments laisser de côté. Ces choses, en particulier ce qu'il faut laisser de côté, dépassent actuellement ce que ChatGPT peut faire, bien que des types d'invites plus particuliers puissent aider.
L'analyse de fichiers de ChatGPT peut gérer les fichiers image mais pas encore la vidéo. Lorsque diverses images sont téléchargées, le programme fait un travail satisfaisant en identifiant le contenu et même en ajoutant une copie descriptive. Cela peut être utile pour des choses comme le sous-titrage.
Aussi : Les meilleurs générateurs d’images IA
ChatGPT a identifié la ligne d'horizon de la ville de New York, l'Empire State Building, et a commenté le mélange de styles anciens et nouveaux.
Une scène de rue dans le centre de Manhattan a également évoqué une légende descriptive utile de la machine.
J'ai pu soumettre une œuvre d'art basée sur une image du domaine public d'Alan Turing, que le programme a identifié, et annotée de commentaires sur l'intention de l'image.
ChatGPT a proposé une description appropriée, quoique fade, de la photo de ZDNET des dirigeants d'OpenAI, Sam Altman et Mira Murati, tirée d' un article sur les deux datant de novembre , sans réellement identifier les individus.
La capacité de l'IA à analyser des images et des vidéos évolue rapidement. Google d'Alphabet a récemment présenté son dernier grand modèle de langage , Gemini 1.5. Le programme est capable de se concentrer sur le moment, dans une transcription de 440 pages de la mission Apollo sur la lune, où Neil Armstrong fait « un petit pas » sur la surface de la lune. Il a également pu repérer les horodatages dans un film muet de Buster Keaton. Ces types de capacités dépassent encore la précision du téléchargement de fichiers de ChatGPT.
Aussi : Qu’est-ce que les Gémeaux ? Tout ce que vous devez savoir sur le nouveau modèle d'IA de Google
Il est clair que l'analyse de documents fusionnera à un moment donné avec la fonction de mémoire dans ChatGPT. Taper des souvenirs à la main à l'invite n'est pas nécessairement aussi efficace que de fournir un document complet contenant tout ce que l'on souhaite appliquer à ChatGPT, comme des références et des informations de base. Dans un an, l’utilisation de la mémoire et l’analyse seront probablement l’une des principales façons dont ChatGPT aura évolué depuis son incarnation actuelle.
Commentaires
Enregistrer un commentaire
🖐 Hello,
N'hésitez pas à commenter ou vous exprimer si vous avez des trucs à dire . . .👉