Skip to content

Banc d'essai de l'IA

La page du Banc d'essai de l'IA est utilisée pour exécuter des tests d'IA contrôlés par rapport à un contexte utilisateur sélectionné (usurpation d'identité), puis inspecter les traces d'exécution de l'agent et les réponses.

Route admin :

  • https://admin.acusolo.net/admin/ai/test-bench

Route de chat web associée :

  • https://web.acusolo.net/ai-chat

Aperçu de la page

Page du banc d'essai de l'IA

La page dispose de deux volets principaux :

  1. Volet de saisie (gauche) : choisissez l'utilisateur + la langue + le message, puis lancez l'agent.
  2. Volet des événements de l'agent (droite) : affiche la trace d'exécution, les événements d'outils, la réponse assemblée et le statut d'achèvement.

Volet de saisie

Champs

  • Impersonate user : choisissez l'identité de l'utilisateur cible (contexte email + id).
  • Langue : définissez la langue du prompt.
  • Message : texte du prompt de test.

Action

  • Exécuter l'agent : exécute le pipeline d'IA comme si l'utilisateur sélectionné avait envoyé ce message.

Volet des événements de l'agent

Page du banc d'essai de l'IA avec détails des événements

Cette section affiche les diagnostics d'exécution, par exemple :

  • blocs d'événements d'outils (ex. : SEARCH_PROGRAMS)
  • programmes candidats renvoyés par la recherche
  • texte de la réponse finale assemblée
  • indicateur de fin (Done) et durée totale
  • identifiant de conversation (conv) pour la traçabilité

Cela facilite la validation de :

  • la compréhension du prompt,
  • le comportement de récupération/outils,
  • et la qualité de la réponse finale avant l'utilisation en production.

Effet de l'usurpation d'identité dans l'application web

Les exécutions du banc d'essai sont visibles dans l'historique de chat IA de l'utilisateur ciblé, car l'exécution est rattachée à ce contexte utilisateur.

Historique de chat de l'application web montrant les résultats du banc d'essai

Comportement observable typique :

  • le fil de discussion apparaît sous l'historique de l'assistant (exemple de libellé comme AGENT_TEST)
  • les cartes de suggestions/messages générés sont visibles dans le flux de chat de cet utilisateur
  • utile pour valider l'expérience de l'utilisateur final du côté admin

Guide d'utilisation

  • Utilisez des comptes de test dédiés lorsque cela est possible.
  • Gardez les prompts traçables (intention claire par exécution de test).
  • Recroisez les sorties avec :