GeniiVision est une nouvelle fonctionnalité de notre outil SaaS conçue pour automatiser le support client à l'aide de modèles linguistiques avancés. Auparavant, Genii ne pouvait traiter que le texte extrait de documents d'entrée, tels que des PDF, des documents Word et des URL, ce qui limitait sa capacité à gérer des formats riches tels que des images, des tableaux et des graphiques. GeniiVision remédie à cette limitation en permettant l'ingestion et l'interprétation de contenus riches dans les documents, améliorant ainsi la précision de l'outil et élargissant ses cas d'utilisation.

Pourquoi avons-nous développé GeniiVision ?

Auparavant, Genii n'extrayait que le texte des documents, ignorant les informations précieuses contenues dans les images, les tableaux et les graphiques. Cette limitation nécessitait un reformatage manuel des documents pour les rendre utilisables par Genii, ce qui réduisait l'efficacité et faisait perdre des informations contextuelles essentielles. GeniiVision a été développé pour :

Exploiter pleinement les informations contenues dans les documents, y compris le contenu riche.
Augmenter la précision et l'étendue des réponses en interprétant les images, les tableaux et les graphiques.
Ouvrir de nouveaux cas d'utilisation qui n'étaient auparavant pas possibles en raison de la nécessité de reformater manuellement les documents.

Comment fonctionne GeniiVision

Lorsque GeniiVision est activé, le système traite les documents page par page, identifiant et isolant les formats riches tels que les tableaux, les images et les graphiques. Voici comment cela fonctionne :

Identification : le système identifie d'abord le contenu enrichi dans le document, tel que les tableaux, les images (par exemple, les captures d'écran) et les graphiques.
Isolement et traitement : le contenu riche identifié est isolé et envoyé à un modèle multimodal avec une invite personnalisée adaptée au cas d'utilisation spécifique.
Légende et interprétation : le modèle multimodal décrit ou reconstruit le contenu sous forme de texte, le rendant lisible et utilisable pour Genii.
Intégration : le contenu interprété est automatiquement intégré à la base de connaissances de Genii.
Utilisation : lorsque les utilisateurs interrogent ce contenu, il se comporte comme n'importe quel autre document dans Genii. Le tableau de bord affiche les paragraphes contextuels extraits via GeniiVision, permettant aux utilisateurs d'évaluer les performances et la pertinence du modèle.

Meilleures pratiques et limites

Meilleures pratiques

Format des documents : utilisez le format PDF pour obtenir les meilleurs résultats, car GeniiVision est optimisé pour les PDF.