rag_search est la pierre angulaire de la récupération d’information au sein de la plateforme UBIK. Il permet aux agents d’effectuer des recherches en Génération Augmentée par Récupération (RAG) à travers vos documents téléchargés.
Contrairement à une recherche par mot-clé standard, cet outil utilise la compréhension sémantique pour trouver les “morceaux” (chunks) de texte les plus pertinents de votre base de connaissances et utilise un Grand Modèle de Langage (LLM) pour synthétiser une réponse précise basée sur ces faits.
Quand Utiliser Cet Outil
Utilisezrag_search lorsque vous avez besoin de :
- Répondre à des questions spécifiques basées sur vos données privées (par ex., “Quelle est la politique de congés ?”).
- Trouver des faits précis enfouis dans de grands documents.
- Vérifier des informations par rapport à une source fiable.
- Récupérer du contexte pour soutenir une conversation.
Cet outil est optimisé pour la précision de récupération et la génération ancrée. Il n’est pas destiné au traitement de documents entiers ou à la génération de résumés longs (utilisez
information_analysis pour cela).Paramètres d’Entrée
L’outil accepte les paramètres suivants :| Paramètre | Type | Requis | Description |
|---|---|---|---|
query | string | Oui | La question en langage naturel ou la requête de recherche. Soyez aussi précis que possible pour de meilleurs résultats. |
document_ids | array<uuid> | Non | Une liste d’UUIDs de documents spécifiques dans lesquels chercher. Si omis, la recherche s’exécute sur tous les documents accessibles à l’utilisateur/session. |
Portée & Permissions
L’outilrag_search respecte automatiquement le contexte de sécurité de l’exécution :
- Accès Utilisateur : Recherche les documents appartenant à l’utilisateur ou partagés avec lui via des espaces de travail.
- Contexte de Session : Si exécuté au sein d’une session de chat, il inclut les documents attachés à cette session spécifique.
- ID Externe : Pour les applications multi-tenants, il applique strictement les frontières
external_user_id, garantissant que les utilisateurs ne voient jamais les données d’autres sous-utilisateurs.
Structure de Sortie
L’outil renvoie un objet structuré contenant la réponse, les preuves utilisées pour la générer et des métadonnées sur l’exécution.| Champ | Description |
|---|---|
response | La réponse en langage naturel. Peut inclure un bloc “Réflexion” (processus de pensée), du formatage Markdown et des citations en ligne pointant vers des morceaux spécifiques. |
contexts | Une liste des morceaux de texte récupérés passés au LLM. Inclut chunk_id, document_id et text_preview. |
sources_used | Une liste d’indices (rangs) correspondant aux contexts qui ont été explicitement utilisés pour former la réponse. |
model | Le LLM spécifique utilisé pour la génération. |
execution_id | L’identifiant unique pour cette exécution d’outil. |
Exemple d’Utilisation
1. Recherche Large
Recherche à travers toutes les connaissances disponibles. Entrée :2. Recherche Ciblée
Recherche uniquement au sein d’un manuel technique spécifique. Entrée :Capacités Multimodales
Le pipelinerag_search est entièrement compatible avec le multimodal. Si vous avez indexé des documents contenant des images (comme des PDF avec des graphiques ou des diapositives), la recherche peut récupérer le contexte visuel pertinent.
- Récupération Texte-vers-Image : Votre requête textuelle peut correspondre à des descriptions d’images.
- Compréhension d’Image : Le modèle de génération peut “voir” les images récupérées pour répondre à des questions sur des graphiques, des diagrammes ou des photos.
Activation RequiseLe RAG multimodal n’est pas activé par défaut. Pour activer cette fonctionnalité pour votre espace de travail, veuillez contacter l’équipe UBIK à contact@ubik-agent.com.

