Ingestion de documents (fichiers ou URLs)

import requests

url = "https://app.ubik-agent.com/api/v1/documents"

files = { "files.0.items": ("example-file", open("example-file", "rb")) }
payload = {
    "files": "<string>",
    "urls": "<string>",
    "workspace_ids": "<string>",
    "api_metadata": "<string>",
    "scraping_mode": "Simple Scraping",
    "crawl_depth": "2",
    "same_domain_only": "true",
    "limit": "10",
    "delay": "1",
    "youtube_download_format": "audio"
}
headers = {"X-API-KEY": "<api-key>"}

response = requests.post(url, data=payload, files=files, headers=headers)

print(response.text)

const form = new FormData();
form.append('files', '<string>');
form.append('urls', '<string>');
form.append('workspace_ids', '<string>');
form.append('api_metadata', '<string>');
form.append('scraping_mode', 'Simple Scraping');
form.append('crawl_depth', '2');
form.append('same_domain_only', 'true');
form.append('limit', '10');
form.append('delay', '1');
form.append('youtube_download_format', 'audio');
form.append('files.0.items', '{
  "fileName": "example-file"
}');

const options = {method: 'POST', headers: {'X-API-KEY': '<api-key>'}};

options.body = form;

fetch('https://app.ubik-agent.com/api/v1/documents', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

curl --request POST \
  --url https://app.ubik-agent.com/api/v1/documents \
  --header 'Content-Type: multipart/form-data' \
  --header 'X-API-KEY: <api-key>' \
  --form 'files=<string>' \
  --form 'urls=<string>' \
  --form 'workspace_ids=<string>' \
  --form 'api_metadata=<string>' \
  --form 'scraping_mode=Simple Scraping' \
  --form crawl_depth=2 \
  --form same_domain_only=true \
  --form limit=10 \
  --form delay=1 \
  --form youtube_download_format=audio \
  --form files.0.items='@example-file'

[
  {
    "id": "3c90c3cc-0d44-4b50-8888-8dd25736052a",
    "name": "<string>",
    "status": "<string>",
    "created_at": "2023-11-07T05:31:56Z",
    "updated_at": "2023-11-07T05:31:56Z",
    "file_type": "<string>",
    "processing_pipeline": "<string>",
    "error_message": "<string>",
    "api_metadata": {},
    "file_name": "<string>",
    "markdown_content": "<string>"
  }
]

{
  "detail": "Either 'files' or 'urls' must be provided."
}

{
  "detail": [
    {
      "loc": [
        "<string>"
      ],
      "msg": "<string>",
      "type": "<string>"
    }
  ]
}

Ingestion de documents (fichiers ou URLs)

Route unifiée pour ingérer des documents depuis diverses sources.

Cette route gère le téléversement de fichiers et le scraping d’URLs en une seule requête (multipart/form-data).

Pour importer des fichiers, utilisez le champ ‘files’.
Pour scraper des URLs, utilisez le champ ‘urls’ (liste séparée par des virgules).
Associez les documents à des espaces de travail via ‘workspace_ids’.

Note: Les types de fichiers pris en charge dépendent des capacités actives du serveur (par exemple, les fichiers audio/vidéo nécessitent que la transcription soit activée).

POST

documents

Ingestion de documents (fichiers ou URLs)

import requests

url = "https://app.ubik-agent.com/api/v1/documents"

files = { "files.0.items": ("example-file", open("example-file", "rb")) }
payload = {
    "files": "<string>",
    "urls": "<string>",
    "workspace_ids": "<string>",
    "api_metadata": "<string>",
    "scraping_mode": "Simple Scraping",
    "crawl_depth": "2",
    "same_domain_only": "true",
    "limit": "10",
    "delay": "1",
    "youtube_download_format": "audio"
}
headers = {"X-API-KEY": "<api-key>"}

response = requests.post(url, data=payload, files=files, headers=headers)

print(response.text)

const form = new FormData();
form.append('files', '<string>');
form.append('urls', '<string>');
form.append('workspace_ids', '<string>');
form.append('api_metadata', '<string>');
form.append('scraping_mode', 'Simple Scraping');
form.append('crawl_depth', '2');
form.append('same_domain_only', 'true');
form.append('limit', '10');
form.append('delay', '1');
form.append('youtube_download_format', 'audio');
form.append('files.0.items', '{
  "fileName": "example-file"
}');

const options = {method: 'POST', headers: {'X-API-KEY': '<api-key>'}};

options.body = form;

fetch('https://app.ubik-agent.com/api/v1/documents', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

curl --request POST \
  --url https://app.ubik-agent.com/api/v1/documents \
  --header 'Content-Type: multipart/form-data' \
  --header 'X-API-KEY: <api-key>' \
  --form 'files=<string>' \
  --form 'urls=<string>' \
  --form 'workspace_ids=<string>' \
  --form 'api_metadata=<string>' \
  --form 'scraping_mode=Simple Scraping' \
  --form crawl_depth=2 \
  --form same_domain_only=true \
  --form limit=10 \
  --form delay=1 \
  --form youtube_download_format=audio \
  --form files.0.items='@example-file'

[
  {
    "id": "3c90c3cc-0d44-4b50-8888-8dd25736052a",
    "name": "<string>",
    "status": "<string>",
    "created_at": "2023-11-07T05:31:56Z",
    "updated_at": "2023-11-07T05:31:56Z",
    "file_type": "<string>",
    "processing_pipeline": "<string>",
    "error_message": "<string>",
    "api_metadata": {},
    "file_name": "<string>",
    "markdown_content": "<string>"
  }
]

{
  "detail": "Either 'files' or 'urls' must be provided."
}

{
  "detail": [
    {
      "loc": [
        "<string>"
      ],
      "msg": "<string>",
      "type": "<string>"
    }
  ]
}

Autorisations

X-API-KEY

string

header

requis

En-têtes

X-End-User-ID

string | null

Corps

multipart/form-data

files

file[] | null

Une liste de fichiers à importer.

urls

string | null

Une liste d'URLs à scraper, séparées par des virgules.

workspace_ids

string | null

Une liste d'IDs d'espaces de travail où ajouter les documents, séparées par des virgules.

api_metadata

string | null

Métadonnées API personnalisées (chaîne JSON).

scraping_mode

string

défaut:Simple Scraping

Mode de scraping ('Simple Scraping' ou 'Crawling').

crawl_depth

integer

défaut:2

La profondeur maximale pour le crawling des liens.

same_domain_only

boolean

défaut:true

Indique s'il faut uniquement crawler les liens du même domaine.

limit

integer

défaut:10

Le nombre maximum de pages à crawler.

delay

number

défaut:1

Le délai en secondes entre les requêtes.

youtube_download_format

string

défaut:audio

Le format de téléchargement pour les vidéos YouTube ('audio' ou 'video').

Réponse

Successful Response

string<uuid>

requis

L'identifiant unique du document.

name

string

requis

Le nom d'affichage du document.

status

string

requis

Le statut de traitement actuel du document.

created_at

string<date-time>

requis

L'horodatage de la création du document.

updated_at

string<date-time>

requis

L'horodatage de la dernière mise à jour du document.

file_type

string | null

Le type MIME du fichier du document.

processing_pipeline

string | null

Le nom du pipeline de traitement utilisé pour ce document.

error_message

string | null

Si le traitement a échoué, ce champ contiendra le message d'erreur.

api_metadata

Api Metadata · object | null

Métadonnées API personnalisées résolues pour l'utilisateur actuel. Utile pour récupérer des références externes stockées (par exemple {'internal_app_ref': 'REF-123'}). Note : Cette valeur est résolue en fonction de l'external_user_id de la requête. Un document partagé globalement mais aussi limité à un utilisateur spécifique peut renvoyer des métadonnées différentes selon qui demande.

file_name

string | null

Le nom de fichier original du document.

markdown_content

string | null

Le contenu complet du document converti au format Markdown.

Lister les documents

Détails d'un document