mardi 11 mars 2025

Architecture des Agents IA

 

Architecture des Agents IA

Architecture des Agents IA

1. Les Trois Piliers Clés

PilierDescriptionCouleur
Synthèse des connaissancesCapacité à collecter, intégrer et générer des connaissances depuis diverses sourcesOrange
ModèlesModèles de langage alimentant les capacités (NLP, vision, raisonnement)Vert
Mise à l'échelleAdaptabilité aux différentes tâches et environnementsBleu

2. Composants Périphériques

ComposantDescriptionIcône
RaisonnementAnalyse logique, conclusions et résolution de problèmes💡
ProgrammationLecture, écriture et correction de code⌨️
PerformanceVitesse et précision dans l'exécution des tâches📊
RéférencesMesures quantitatives d'évaluation des capacités📈
RobustesseGestion des erreurs et fiabilité du système🛡️
ProgrammableCapacité à être modifié pour des cas spécifiques👨‍💻
TélémétrieSurveillance et collecte des données opérationnelles📡
EfficacitéOptimisation des ressources et minimisation du gaspillage⚙️
CoûtAspects économiques du développement et maintenance💰

3. Interconnexions Principales

  • La Synthèse des connaissances alimente le Raisonnement et la Programmation
  • Les Modèles et la Mise à l'échelle interagissent avec la Performance et l'Efficacité
  • La Robustesse et la Télémétrie assurent la fiabilité et l'observabilité du système




Il y a quelques jours, je suis tombé sur les réflexions de Raj Koneru sur l’avenir de l’agence, il a utilisé le terme « continuum agentique ». Cette phrase a profondément résonné en moi, faisant écho à ma propre réflexion sur l’agence et la montée d’un « spectre agentique ». 

Le blog ci-dessous est une capture brute de mes idées, dictées directement dans mon MacBook - pas de polissage, pas de retouche ChatGPT.... J’espère qu’il touchera une corde sensible chez vous aussi.


https://kore.ai/beyond-ai-agents-the-rise-of-agentic-x-and-the-future-of-intelligent-automation/?utm_medium=OrganicSocial&utm_source=LinkedIn&utm_campaign=CobusPostFeed&utm_term=TechBlog23022025


https://blog.kore.ai/cobus-greyling/the-shifting-vocabulary-of-ai?utm_medium=OrganicSocial&utm_source=Medium&utm_campaign=CobusPostFeed&utm_term=MyHomePage17122024


dimanche 23 février 2025

Les six tendances fondamentales de l'IA pour 2025.

Les 6 tendances de l'IA pour 2025 et plus. 

Évolution des paradigmes et transformation organisationnelle, recommandations stratégiques, contexte géopolitique.

  1. L'IA agentique (Agentic AI) : Une promesse à nuancer L'IA agentique, qui permet d'effectuer des tâches de manière autonome, est considérée comme la tendance majeure de 2025. Bien que 37% des leaders IT pensent déjà l'utiliser et que 68% prévoient de l'adopter dans les six prochains mois, les auteurs recommandent la prudence. Ils prévoient que son déploiement initial se limitera à des tâches internes structurées et de faible enjeu financier, comme la gestion des mots de passe ou des congés, nécessitant toujours une supervision humaine.
  2. La mesure des résultats de l'IA générative Malgré l'enthousiasme général (58% des dirigeants rapportent des gains exponentiels de productivité), les auteurs soulignent le manque crucial de mesures concrètes. Les rares études existantes, comme celle de Goldman Sachs, montrent des améliorations plus modestes (environ 20% pour les développeurs). Les auteurs recommandent la mise en place d'expériences contrôlées pour évaluer précisément l'impact de l'IA générative sur la productivité et la qualité du travail.
  3. La réalité de la culture axée sur les données L'article révèle un retour à la réalité concernant la transformation digitale des organisations. Les chiffres d'adoption d'une culture basée sur les données sont passés de 43% à 33%, suggérant que l'IA générative seule ne suffit pas à transformer la culture d'entreprise. En effet, 92% des répondants identifient les défis culturels et la gestion du changement comme les principaux obstacles à cette transformation.
  4. Le retour en force des données non structurées L'IA générative a ravivé l'intérêt pour les données non structurées (texte, images, vidéos), qui représentent jusqu'à 97% des données dans certaines entreprises. Les organisations doivent désormais investir dans la gestion et l'organisation de ces données, notamment via des approches comme le RAG (Retrieval-Augmented Generation), tout en maintenant une importante intervention humaine pour la curation des données.
  5. La gouvernance des données et de l'IA La question du leadership en matière de données et d'IA reste complexe. Bien que 85% des organisations aient nommé un Chief Data Officer et 33% un Chief AI Officer, moins de la moitié considèrent ces fonctions comme bien établies. Les auteurs débattent de la structure optimale : certains préconisent un rattachement direct à la direction générale, d'autres suggèrent une consolidation des rôles techniques sous une direction unique pour plus d'efficacité.
  6. La cybersécurité des IA : cœur de la fragilité des process :  
    1. Surface d'attaque élargie avec la multiplication des agents autonomes
    2. Vulnérabilités spécifiques aux systèmes multi-agents (manipulation, détournement)
    3. Sécurisation des environnements sandbox mentionnés dans le chapitre 3
    4. Protection des données utilisées pour l'entraînement et l'opération des agents
    5. Nécessité de frameworks pour l'audit de sécurité des agents autonomes

Évolution des paradigmes et transformation organisationnelle

Le plan détaillé expose:

  1. Transition des LLM vers des systèmes intelligents distribués
  2. Émergence des agents autonomes comme nouvelle unité de travail
  3. Gouvernance complexe entre autonomie et supervision humaine
  4. Impact profond sur les structures organisationnelles et la gestion des talents
  5. Nouveaux rôles comme "Agent Manager" et traitement des agents comme "employés digitaux"

Recommandations stratégiques

Pour une organisation anticipant cette évolution:

  1. Développer une matrice d'évaluation des risques spécifiques aux systèmes multi-agents
  2. Intégrer des mécanismes de surveillance et d'audit dès la conception des systèmes
  3. Établir un cadre de gouvernance robuste pour les décisions autonomes
  4. Investir dans la formation des équipes au nouveau paradigme agent-centrique
  5. Prévoir des mécanismes de repli et d'arrêt d'urgence pour les agents autonomes

Cette évolution représente un changement paradigmatique majeur où la frontière entre assistant et agent autonome devient progressivement plus floue, avec des implications significatives pour la sécurité, la gouvernance et la structure organisationnelle des entreprises.

Contexte géopolitique

Le diagramme Mermaid cartographie l'écosystème mondial de l'IA, révélant:

  1. Dominance américaine avec OpenAI, Anthropic et DeepMind
  2. Pôle chinois centré sur les géants BAT et une infrastructure nationale
  3. Approche européenne axée sur l'éthique (GAIA-X) et la réglementation
  4. Positionnement stratégique du Royaume-Uni (recherche), du Canada et de l'Inde

Ce contexte illustre la complexité des enjeux géostratégiques et les différentes approches régionales.

Cette analyse montre que l'année 2025 sera marquée par une approche plus réaliste et pragmatique de l'IA, mettant l'accent sur la mesure des résultats, la gestion du changement culturel et l'organisation efficace des données et des équipes.

Source l'article de Thomas H. Davenport et Randy Bean.

Five Trends in AI and Data Science for 2025

https://sloanreview.mit.edu/article/five-trends-in-ai-and-data-science-for-2025/

Comparaison des Forces en IA par Région / monde.

RégionForcesModèlesInfrastructureRechercheSpécialisation
États-UnisLeaders technologiques, Cloud, InnovationGPT-4, Claude, PaLMDominanteTrès forteIA Générale, LLMs
ChineScale, Données, ApplicationsErnie, GLM, WuDaoAutonomeForteIA appliquée, Vision
EuropeRégulation, ÉthiqueBLOOM, Aleph AlphaEn développementForteIA Responsable
IndeTalents, Scale, CoûtsBhashiniÉmergenteCroissanteNLP multilingue
Royaume-UniRecherche, InnovationAlphaFoldMoyenneTrès forteIA Scientifique
CanadaRecherche fondamentaleLambdaNetMoyenneTrès forteIA Théorique
Pays ArabesInvestissements, ApplicationsArabicGPTEn développementÉmergenteFintech, Énergie

Synthèse des connaissances  :

Perspective géopolitique :

Les États-Unis dominent via les grandes bases de données et archives scientifiques (PubMed, arXiv)
La Chine développe rapidement ses propres bases de connaissances isolées
L'Europe mise sur l'open science et le partage des données FAIR
L'Inde se positionne comme hub de traitement et d'analyse de données

Modèles :

Dynamique des acteurs :

USA : OpenAI, Anthropic, Google DeepMind dominent l'innovation
Chine : DeepSeek, Masus, Baidu, Alibaba, Tencent développent des alternatives nationales
Europe : Focus sur des modèles spécialisés et éthiques
Canada : Pioneer dans l'IA via Montreal/Toronto/Edmonton
UK : DeepMind et forte recherche académique
Pays du Golfe : Investissements massifs dans les infrastructures

Mise à l'échelle :

Répartition des forces :

USA : AWS, Google Cloud, Microsoft Azure en position dominante
Chine : Infrastructure cloud nationale robuste et indépendante
Europe : Tentative de souveraineté numérique (GAIA-X)
Inde : Expertise en déploiement à grande échelle et coûts optimisés


Éléments périphériques critiques :

Performance et Robustesse :

USA/UK : Standards de référence (NIST)
Chine : Développement de benchmarks alternatifs
Europe : Focus sur la certification et standards éthiques

Programmation et Télémétrie :

USA : GitHub/Microsoft dominent les outils
Chine : Écosystème parallèle (Gitee)
Inde : Hub majeur de développement et d'intégration

Coût et Efficacité :

Impact sur la compétitivité régionale
Avantage des économies d'échelle américaines et chinoises
Défi majeur pour l'Europe et autres acteurs

Recommandations stratégiques :

Renforcer les collaborations transversales :

Alliances technologiques (USA-Europe-Inde)
Partage des ressources de calcul
Standards communs d'évaluation


Développer des spécialisations régionales :

Europe : IA éthique et régulée
Inde : Solutions à grande échelle optimisées
Canada : IA fondamentale et recherche
Pays du Golfe : Applications financières et énergétiques


Garantir l'autonomie stratégique :

Infrastructures cloud souveraines
Bases de données indépendantes
Capacités de formation des modèles


Prioriser la formation et les talents :

Programmes internationaux d'échange
Centres d'excellence régionaux
Rétention des experts clés


Cette analyse révèle une compétition intense mais aussi des opportunités de collaboration internationale pour développer une IA robuste et bénéfique globalement.

2025 Tendances de l'IA : Les innovations à surveiller cette année

https://www.ultralytics.com/fr/blog/2025-ai-trends-the-innovations-to-look-out-for-this-year


L'IA à toutes les sauces : les 5 grandes tendances technologiques à suivre en 2025 - WE DEMAIN

https://www.wedemain.fr/decouvrir/lia-a-toutes-les-sauces-les-5-grandes-tendances-technologiques-a-suivre-en-2025/


https://lecercle.guild4ai.ai/c/espace-agent/manus-e678d490-1e2c-4d0c-bc32-45dd4c0edad3


Erol GIRAUDY





samedi 15 février 2025

How to Get Your Data Ready for AI Agents (Docs, PDFs, Websites)

How to Get Your Data Ready for AI Agents (Docs, PDFs, Websites).


Want to get started as a freelancer? Let me help: 

Additional Resources
📚 Just getting started? Learn the fundamentals of AI: https://www.skool.com/data-alchemy
🚀 Already building AI apps? Get our production framework: https://launchpad.datalumina.com/?utm...
💼 Need help with a project? Work with me: 

🔗 GitHub Repository

🛠️ My VS Code / Cursor Setup
   • The Ultimate VS Code Setup for Data &...  

⏱️ Timestamps
0:45 Building an Extraction Pipeline
2:15 Document Conversion Basics
6:12 HTML Extraction Techniques
9:10 Chunking Data for AI
14:22 Storing in Vector Databases
19:51 Searching the Vector Database
22:16 Creating an Interactive Application



📌 Description
In this Docling tutorial, you will learn to extract and structure data from various documents, utilizing techniques such as parsing, chunking, and embedding. A walkthrough of Docling and a practical demonstration illustrate these processes.


The video also explores integrating vector databases for efficient data storage and enhancing AI responses through embedding models. Finally, a simple interactive chat application is demonstrated, showcasing the completed knowledge extraction pipeline and optimization strategies.

👋🏻 About Me
Hi! I'm Dave, AI Engineer and founder of Datalumina®. On this channel, I share practical tutorials that teach developers how to build production-ready AI systems that actually work in the real world. Beyond these tutorials, I also help people start successful freelancing careers. Check out the links above to learn more!


Architecture

L’architecture de Docling est décrite dans le schéma ci-dessus.

Pour chaque format de document, le convertisseur de documents sait quel backend spécifique au format utiliser pour l’analyse du document et quel pipeline utiliser pour orchestrer l’exécution, ainsi que toutes les options pertinentes.  https://ds4sd.github.io/docling/concepts/architecture/ 

Dans ce tutoriel Docling, vous apprendrez à extraire et à structurer des données à partir de divers documents, en utilisant des techniques telles que l’analyse, le découpage et l’intégration. Une présentation de Docling et une démonstration pratique illustrent ces processus.

Pour LLAMA 

Lecteur de documentation.

LlamaIndex est le cadre de référence pour la création d’agents LLM sur vos données.

%pip install -q --progress-bar off --no-warn-conflicts llama-index-core llama-index-readers-docling llama-index-node-parser-docling llama-index-embeddings-huggingface llama-index-llms-huggingface-api llama-index-readers-file python-dotenv

Docling Reader utilise Docling pour permettre l’extraction rapide et facile de PDF, DOCX, HTML et d’autres types de documents, au format Docling sérialisé en Markdown ou JSON, pour une utilisation dans les pipelines LlamaIndex pour RAG / QA, etc.


LlamaIndex (GPT Index) est un cadre de données pour votre application LLM. Construire avec LlamaIndex implique généralement de travailler avec le noyau de LlamaIndex et un ensemble choisi d’intégrations (ou plugins). 

Il y a deux façons de commencer à construire avec LlamaIndex dans Python:

Entrée : lama-index. Un package Python de démarrage qui inclut le noyau de LlamaIndex ainsi qu’une sélection d’intégrations.

Personnalisé : llama-index-core. Installez le noyau de LlamaIndex et ajoutez les packages d’intégration LlamaIndex de votre choix sur LlamaHub qui sont requis pour votre application. 

Il y a plus de 300 intégrations LlamaIndex qui fonctionnent de manière transparente avec le noyau, ce qui vous permet de construire avec votre Fournisseurs de LLM, d’intégration et de magasins de vecteurs.

La bibliothèque Python LlamaIndex est dont les noms sont tels que les instructions d’importation qui include implique que le paquet de base est utilisé. 

En revanche, ces sans impliquer qu’un package d’intégration est utilisé.



Lecteur de documentation LLAMA 

Docling extrait PDF, DOCX, HTML et d’autres formats de documents dans une représentation riche (y compris la mise en page, les tableaux, etc.), qu’il peut exporter au format Markdown ou JSON.

Docling Reader et Docling Node Parser présentés dans ce carnet intègrent de manière transparente Docling dans LlamaIndex, vous permettant de :

utiliser différents types de documents dans vos applications LLM avec facilité et rapidité, et
tirez parti du format riche de Docling pour une base avancée et native du document.




Getting Started | LlamaCloud Documentation




Erol GIRAUDY

Projet de mise en préproduction du tableau de bord de cotations :

Projet de mise en préproduction du T2BI-IA cotations : Résumé de la solution complète pour les rapports détaillés La fonctionnalité d'an...