Outils Disponibles
1. Recherche RAG (rag_search)
L’outil Recherche RAG est le mécanisme principal pour récupérer des informations à partir de vos documents téléchargés. Il utilise la Génération Augmentée par Récupération (RAG) pour trouver le contexte le plus pertinent pour la requête d’un utilisateur et génère une réponse basée uniquement sur cette information vérifiée.
Capacités Clés :
- Recherche Sémantique : Comprend le sens derrière les requêtes, pas seulement la correspondance par mots-clés.
- Citation des Sources : Fournit des citations pour chaque information utilisée, assurant confiance et traçabilité.
- Portée Documentaire : Peut être restreint à la recherche dans des documents spécifiques ou dans des espaces de travail entiers.
- Récupération à Grande Échelle : Trouve efficacement des informations pertinentes parmi de grands volumes de documents locaux rapidement.
- Compatibilité Multimodale : Prend entièrement en charge les données multimodales, permettant la récupération à travers le texte et les images. Voir l’Approfondissement du Pipeline RAG pour plus d’informations.
2. Recherche Web (web_search)
L’outil Recherche Web connecte votre agent à l’internet en direct. Contrairement au RAG, qui recherche dans vos documents internes, cet outil récupère des informations en temps réel sur le web, reclasse les résultats par pertinence et synthétise une réponse complète avec des citations.
Capacités Clés :
- Information en Temps Réel : Accédez aux dernières nouvelles, cours de bourse ou événements survenus après la date limite d’entraînement du modèle.
- Reranking par IA : Utilise des modèles de reranking avancés pour trier les résultats de recherche par pertinence sémantique, assurant que la meilleure information est utilisée.
- Scraping de Contenu : Visite automatiquement les meilleurs résultats pour extraire le contenu complet de la page pour une analyse plus approfondie, pas seulement des extraits.
- Citation des Sources : Comme le RAG, il cite les pages web spécifiques utilisées pour générer la réponse.
3. Analyse d’Information (information_analysis)
L’outil Analyse d’Information est conçu pour la recherche approfondie et la synthèse. Contrairement à la recherche simple, qui répond à une question spécifique, cet outil peut traiter de grands volumes de texte à travers plusieurs documents pour identifier des tendances, résumer des points clés et synthétiser de nouvelles perspectives.
Capacités Clés :
- Synthèse Multi-Documents : Agrège des informations provenant de diverses sources en une analyse cohérente.
- Résumé Récursif : Capable de traiter de très grands documents en les décomposant et en les résumant récursivement.
- Piloté par l’Intention : Adapte l’analyse en fonction de l’intention spécifique de l’utilisateur ou de l’objectif de recherche.
- Traitement Complet des Documents : Traite les documents ou ensembles de documents dans leur intégralité, contournant efficacement les contraintes de longueur de contexte des LLM.
4. Rédaction Structurée (structured_writing)
L’outil Rédaction Structurée permet la génération de contenu long et cohérent. Il va au-delà des simples réponses de chat pour créer des documents structurés comme des rapports, des articles de blog ou des livres blancs.
Capacités Clés :
- Génération Basée sur un Plan : Suit une structure ou un plan prédéfini pour assurer un flux logique.
- Conscience du Contexte : Maintient le contexte à travers les différentes sections du document pour assurer la cohérence du ton et des faits.
- Raffinement Itératif : Peut rédiger, réviser et affiner des sections pour répondre à des exigences spécifiques de longueur ou de style.
5. Génération d’Images (image_generation)
L’outil Génération d’Images permet aux agents de créer des actifs visuels à la volée. Il exploite des modèles génératifs avancés pour transformer des descriptions textuelles en images de haute qualité.
Capacités Clés :
- Texte-vers-Image : Génère des images à partir de prompts textuels détaillés.
- Image-vers-Image : Peut accepter des images sources en entrée pour guider la génération, assurant que le résultat correspond à un style ou une composition spécifique.
- Contrôle du Style : Peut s’adapter à divers styles artistiques, du photoréaliste à l’abstrait.
- Aides Visuelles : Utile pour créer des diagrammes, des illustrations ou des couvertures pour accompagner le texte généré.
6. Exécution de Code (code_execution)
L’outil Exécution de Code fournit à l’agent un environnement Python isolé (sandbox). Cela permet à l’agent d’écrire et d’exécuter du code pour résoudre des problèmes difficiles pour les modèles de langage seuls, tels que des mathématiques complexes ou le traitement de données.
Capacités Clés :
- Analyse de Données : Peut charger des CSV ou d’autres fichiers de données pour effectuer une analyse statistique en utilisant des bibliothèques comme
pandasetnumpy. - Visualisation : Génère des graphiques et des diagrammes en utilisant
matplotlibouseaborn. - Calcul Précis : Effectue des calculs mathématiques exacts là où les LLM pourraient halluciner.
- Sécurité Isolée : S’exécute dans un environnement sécurisé et isolé pour garantir la sûreté.
7. Tâche de Sous-agent (subagent_task)
L’outil Tâche de Sous-agent permet à l’agent principal de déléguer des tâches complexes à plusieurs étapes à des sous-agents spécialisés. C’est crucial pour gérer de grands flux de travail sans perdre le contexte ou atteindre les limites de contexte.
Capacités Clés :
- Délégation de Tâches : Crée une nouvelle instance d’agent dédiée à une sous-tâche spécifique.
- Isolation du Contexte : Garde le contexte de l’agent principal propre en déchargeant le travail détaillé sur le sous-agent.
8. Outils de Compétences d’Agent (activate_skill, read_execute_skill_file)
Les Outils de skills d’Agent fournissent un moyen pour les agents de récupérer et d’exécuter des procédures réutilisables ou “skills” au moment de l’exécution. Cela permet aux agents de s’appuyer sur des guides pour gérer des tâches répétitives ou spécialisées plus efficacement. Ces skills sont chargés uniquement dans le cadre d’une interaction pertinente, ce qui évite de surcharger la fenêtre de contexte du modèle.
Capacités Clés :
- Activation de Compétence (
activate_skill) : Les agents peuvent charger les instructions complètes d’une compétence spécialisée lorsque la demande d’un utilisateur correspond à la description de la compétence. - Exécution de Scripts et Lecture de Fichiers (
read_execute_skill_file) : Les agents peuvent lire des fichiers statiques attachés à un skill, ou exécuter directement des scripts Python (.py) contenus dans le répertoire virtuel du skill. - Contrôle d’Accès Granulaire : Les compétences respectent des permissions d’accès strictes. Elles peuvent être privées, partagées avec des entreprises spécifiques, accorder un accès explicite en lecture/écriture à certains utilisateurs, être liées à des assistants spécifiques, ou rendues publiques.
activate_skill pour lire les instructions, puis read_execute_skill_file pour exécuter les scripts de déploiement en toute sécurité. Voir la Documentation des Outils de Compétences d’Agent pour plus de détails.
Étendre les Capacités
Bien que ces outils natifs fournissent une base puissante, la plateforme UBIK est conçue pour l’extensibilité. Vous n’êtes pas limité aux outils listés ci-dessus. Vous pouvez étendre les capacités de votre agent de deux manières :Intégration API
Créez de nouveaux outils en connectant vos propres API à la plateforme, permettant aux agents d’interagir avec vos services externes ou bases de données internes. Le support du Model Context Protocol (MCP) est également prévu pour les futures versions.
Constructeur d'Outils
Utilisez le Constructeur d’Outils dédié au sein de l’application UBIK pour composer visuellement des outils existants en de nouveaux flux de travail plus complexes sans écrire de code.

