Updates Agent Lightning integration documentation to reflect operational status: - Status changed from "Preliminary findings (small-scale)" to "Operational (CPU baseline established)" - Integration date updated to November 2025 - All translations updated (EN/DE/FR) - Real LLM integration implemented with Mistral-7B (4-bit quantized) - CPU stress testing validated with 1300%+ CPU utilization - Documented CPU performance bottleneck and GPU migration plan Technical changes: - Modified stress_test_vllm.py to use transformers library instead of vLLM API - Implemented 4-bit quantization (BitsAndBytes) to fit model in available RAM - Added CPU_BASELINE_FINDINGS.md documenting operational metrics - Validated governance architecture under RL optimization Research integrity maintained: Clear distinction between validated claims (operational CPU baseline) and future work (GPU acceleration, scale testing). 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
136 lines
No EOL
11 KiB
JSON
136 lines
No EOL
11 KiB
JSON
{
|
|
"hero": {
|
|
"title": "Intégration de l'agent Lightning",
|
|
"subtitle": "Gouvernance + Performance : Les limites de sécurité peuvent-elles être maintenues grâce à l'optimisation de l'apprentissage par renforcement ?",
|
|
"status": "Statut :",
|
|
"status_value": "Opérationnel (référence CPU établie)",
|
|
"integration_date": "Date d'intégration :",
|
|
"integration_date_value": "Novembre 2025"
|
|
},
|
|
"what_is": {
|
|
"heading": "Qu'est-ce que l'agent Lightning ?",
|
|
"intro": "<strong>Agent Lightning</strong> est le cadre open-source de Microsoft pour l'utilisation de l'<strong>apprentissage par renforcement (RL)</strong> afin d'optimiser les performances des agents d'intelligence artificielle. Au lieu de messages statiques, les agents apprennent et s'améliorent grâce à une formation continue sur la base d'un retour d'information réel.",
|
|
"traditional_heading": "Agents d'IA traditionnels",
|
|
"traditional_1": "Correction des invites/instructions",
|
|
"traditional_2": "Pas d'apprentissage à partir des erreurs",
|
|
"traditional_3": "Réglage manuel nécessaire",
|
|
"traditional_4": "Les performances plafonnent rapidement",
|
|
"al_heading": "Agent Lightning",
|
|
"al_1": "Apprend continuellement à partir du retour d'information",
|
|
"al_2": "Amélioration grâce à l'optimisation de la LR",
|
|
"al_3": "La stratégie s'ajuste automatiquement",
|
|
"al_4": "Les performances s'améliorent avec le temps",
|
|
"problem": "<strong>Le problème :</strong> Lorsque les agents apprennent de manière autonome, comment maintenir les limites de la gouvernance ? Les politiques traditionnelles échouent car les agents peuvent les contourner de manière optimale."
|
|
},
|
|
"architecture": {
|
|
"heading": "Solution Tractatus : Architecture à deux niveaux",
|
|
"intro": "Nous séparons la gouvernance de l'optimisation en les faisant fonctionner comme des <strong>couches architecturales indépendantes</strong>. Agent Lightning optimise les performances <em>dans le cadre des</em> contraintes de gouvernance, et non autour d'elles.",
|
|
"layer1_heading": "Couche de gouvernance (Tractatus)",
|
|
"layer1_1": "Valide chaque action proposée",
|
|
"layer1_2": "Bloque les violations de contraintes",
|
|
"layer1_3": "Faire respecter les limites des valeurs",
|
|
"layer1_4": "Indépendant de l'optimisation",
|
|
"layer1_5": "Application de l'architecture",
|
|
"layer2_heading": "Couche performance (Agent Lightning)",
|
|
"layer2_1": "Optimisation basée sur la logique logique (RL)",
|
|
"layer2_2": "Apprend à partir du retour d'information",
|
|
"layer2_3": "Améliore l'exécution des tâches",
|
|
"layer2_4": "Agir dans le respect des contraintes",
|
|
"layer2_5": "Formation continue",
|
|
"principle_title": "🔑 Principe clé de conception",
|
|
"principle_text": "Les contrôles de gouvernance sont effectués <strong>avant l'</strong> optimisation de l'AL et <strong>validés en continu</strong> pendant les boucles d'entraînement. La séparation architecturale empêche l'optimisation de dégrader les limites de sécurité."
|
|
},
|
|
"results": {
|
|
"heading": "Démonstration 2 : Résultats préliminaires",
|
|
"warning": "<strong>⚠️ Statut de validation :</strong> Ces résultats proviennent d'<strong>un agent, de 5 cycles d'entraînement, d'un environnement simulé</strong>. Ils n'ont PAS été validés à l'échelle. Des tests d'extensibilité sont nécessaires avant de tirer des conclusions sur la viabilité de la production.",
|
|
"table_metric": "Métrique",
|
|
"table_ungoverned": "Non gouverné",
|
|
"table_governed": "Gouverné",
|
|
"table_difference": "Différence",
|
|
"metric_performance": "Performance (engagement)",
|
|
"metric_governance": "Couverture de la gouvernance",
|
|
"metric_violations": "Violation des contraintes",
|
|
"metric_violations_diff": "-5 (tous bloqués)",
|
|
"metric_strategy": "Stratégie",
|
|
"metric_strategy_ungov": "Clickbait",
|
|
"metric_strategy_gov": "Informatif",
|
|
"metric_strategy_diff": "Aligné sur les valeurs",
|
|
"metric_stability": "Stabilité de la formation",
|
|
"metric_stability_ungov": "Variable",
|
|
"metric_stability_gov": "Cohérent",
|
|
"metric_stability_diff": "Plus prévisible",
|
|
"card1_value": "-5%",
|
|
"card1_label": "Coût de la performance pour la gouvernance",
|
|
"card2_value": "100%",
|
|
"card2_label": "Maintien de la couverture de la gouvernance",
|
|
"card3_value": "0",
|
|
"card3_label": "Violations de contraintes (toutes bloquées)",
|
|
"interpretation_title": "Ce que cela signifie",
|
|
"interpretation_text": "À petite échelle (1 agent, 5 tours), la gouvernance architecturale semble compatible avec l'optimisation RL. Le coût de performance de 5 % a permis d'acheter 100 % d'adhésion aux contraintes et d'alignement des valeurs. <strong>La question cruciale est la suivante : cela vaut-il à grande échelle ?</strong>"
|
|
},
|
|
"gaps": {
|
|
"heading": "Cinq lacunes critiques dans la recherche",
|
|
"intro": "Voici les questions ouvertes que nous étudions activement. Si vous souhaitez collaborer avec nous, n'hésitez pas à nous contacter.",
|
|
"gap1_title": "1. Évolutivité des frais généraux de gouvernance",
|
|
"gap1_question": "<strong>Question :</strong> Le coût de performance de ~5% reste-t-il constant lorsque l'on passe de 1 agent → 10 agents → 1000 agents ?",
|
|
"gap1_data": "<strong>Données actuelles :</strong> 5% de coût observé à 1 agent, 5 rounds",
|
|
"gap1_why": "<strong>Pourquoi c'est important :</strong> Si les frais généraux sont linéaires, le coût de la gouvernance devient prohibitif à grande échelle. S'ils sont constants, la gouvernance est pratiquement viable pour les systèmes de production.",
|
|
"gap1_need": "Besoin de recherche : Test avec 10 → 100 → 1000 agents à l'échelle de production",
|
|
"gap2_title": "2. Persistance de la frontière à long terme",
|
|
"gap2_question": "<strong>Question :</strong> Les contraintes de gouvernance restent-elles efficaces après des centaines/milliers de cycles de formation à la RL ?",
|
|
"gap2_data": "<strong>Données actuelles :</strong> 100% d'adhésion aux contraintes sur 5 cycles",
|
|
"gap2_why": "<strong>Pourquoi c'est important :</strong> L'effacement des instructions est un problème connu. Si les limites se dégradent au fil du temps, la gouvernance échoue silencieusement, ce qui peut s'avérer catastrophique en production.",
|
|
"gap2_need": "Besoin de recherche : Études à long terme (plus de 1 000 séries) sur le suivi de la dérive des contraintes",
|
|
"gap3_title": "3. Résistance aux adversaires",
|
|
"gap3_question": "<strong>Question :</strong> Les agents peuvent-ils apprendre à optimiser les contraintes de gouvernance ?",
|
|
"gap3_data": "<strong>Données actuelles :</strong> Aucun test contradictoire n'a été effectué",
|
|
"gap3_why": "<strong>Pourquoi c'est important :</strong> Si les agents peuvent apprendre à contourner les limites grâce à des stratégies d'optimisation astucieuses, la gouvernance architecturale est illusoire. Il s'agit d'un mode d'échec critique.",
|
|
"gap3_need": "Besoin de recherche : Tests de stress avec des agents explicitement incités à contourner la gouvernance",
|
|
"gap4_title": "4. Combler les lacunes en matière de performances",
|
|
"gap4_question": "<strong>Question :</strong> L'écart de performance de 5 % se résorbe-t-il avec davantage de formation ou s'agit-il d'un compromis persistant ?",
|
|
"gap4_data": "<strong>Données actuelles :</strong> Lacune observée au 5e tour, pas de données au-delà",
|
|
"gap4_why": "<strong>Pourquoi c'est important :</strong> Si l'écart persiste, nous devons quantifier clairement le rapport coût-bénéfice. S'il se résorbe, la gouvernance pourrait être \"gratuite\" à long terme, ce qui modifierait radicalement les calculs d'adoption.",
|
|
"gap4_need": "Besoin de recherche : Entraînement prolongé (plus de 100 rounds) pour voir si les agents gouvernés convergent vers des performances non gouvernées",
|
|
"gap5_title": "5. Coordination multi-agents dans le cadre de la gouvernance",
|
|
"gap5_question": "<strong>Question :</strong> Comment la gouvernance architecturale affecte-t-elle la coordination émergente dans les systèmes multi-agents ?",
|
|
"gap5_data": "<strong>Données actuelles :</strong> Essai en monothérapie uniquement",
|
|
"gap5_why": "<strong>Pourquoi c'est important :</strong> Les systèmes agentiques du monde réel sont multi-agents (service clientèle, logistique, équipes de recherche). La gouvernance qui fonctionne pour un seul agent peut échouer lorsque les agents doivent se coordonner. Les comportements émergents sont imprévisibles.",
|
|
"gap5_need": "Besoin de recherche : Tester des environnements multi-agents collaboratifs et compétitifs avec une gouvernance architecturale"
|
|
},
|
|
"demo": {
|
|
"heading": "démonstration en direct : Cette page EST l'intégration",
|
|
"intro": "Le bouton de rétroaction de cette page (en bas à droite) illustre l'intégration Tractatus + Agent Lightning en production. Lorsque vous soumettez un retour d'information, il est pris en compte :",
|
|
"step1_title": "Contrôle de la gouvernance",
|
|
"step1_desc": "Tractatus valide : Détection des IPI, limites des sentiments, exigences de conformité",
|
|
"step2_title": "Optimisation de l'AL",
|
|
"step2_desc": "L'agent Lightning apprend des modèles : quel est le retour d'information le plus utile, comment améliorer les réponses ?",
|
|
"step3_title": "Validation continue",
|
|
"step3_desc": "Chaque action est revalidée. Si la gouvernance détecte une dérive, l'action est automatiquement bloquée",
|
|
"meta_title": "🔬 Opportunité de métarecherche",
|
|
"meta_desc": "Il ne s'agit pas d'une simple démonstration, mais d'un déploiement de recherche en direct. Vos commentaires nous aident à comprendre les frais généraux de gouvernance à grande échelle. Chaque soumission est enregistrée (de manière anonyme) à des fins d'analyse."
|
|
},
|
|
"community": {
|
|
"heading": "Rejoignez la communauté et obtenez le code",
|
|
"tractatus_heading": "Tractatus Discord",
|
|
"tractatus_subtitle": "Discussions sur la gouvernance",
|
|
"tractatus_desc": "Contraintes architecturales, lacunes de la recherche, conformité, préservation de l'organisme humain, délibérations multipartites.",
|
|
"tractatus_cta": "Rejoindre le serveur Tractatus →",
|
|
"al_heading": "Agent Lightning Discord",
|
|
"al_subtitle": "Aide technique à la mise en œuvre",
|
|
"al_desc": "Optimisation RL, soutien à l'intégration, optimisation des performances, questions techniques de mise en œuvre.",
|
|
"al_cta": "Rejoindre le serveur Agent Lightning →",
|
|
"code_heading": "📦 Voir le code d'intégration",
|
|
"code_desc": "Intégration complète comprenant des démonstrations, des modules de gouvernance Python et le code de l'agent Lightning. Licence Apache 2.0 sur GitHub.",
|
|
"code_cta": "Voir sur GitHub (Apache 2.0) →"
|
|
},
|
|
"cta": {
|
|
"heading": "Collaborer sur des questions de recherche ouvertes",
|
|
"intro": "Nous recherchons des chercheurs, des responsables de la mise en œuvre et des organisations intéressés par les tests d'évolutivité, les études de résistance à l'adversité et les expériences de gouvernance multi-agents.",
|
|
"feature1": "Code d'intégration et modules de gouvernance",
|
|
"feature2": "Documentation technique",
|
|
"feature3": "Cadre de collaboration en matière de recherche",
|
|
"feature4": "Accès au journal d'audit (anonymisé)",
|
|
"button_collab": "Contact pour la collaboration →",
|
|
"button_research": "Voir le contexte de la recherche →"
|
|
}
|
|
} |