Affichage des articles dont le libellé est Gemini. Afficher tous les articles
Affichage des articles dont le libellé est Gemini. Afficher tous les articles

mardi 4 février 2025

L' AI pour la Généalogie avec UGAIA (G·AI - G·IA) la G·IA.

 La révolution de la généalogie grâce à l’intelligence artificielle et ses outils.


Utilisation du RAG dans Deepseek dans un llm ollama.

L' AI pour la Généalogie avec UGAIA (G·AI - G·IA)

https://uga-ia.blogspot.com/

Voici un résumé du livre sur la généalogie assistée par l'intelligence artificielle :

Ce livre de explore comment l'intelligence artificielle et les outils numériques transforment et facilitent les recherches généalogiques. L'auteur raconte son parcours personnel pour retracer sa généalogie complexe liée à la famille impériale ottomane. 

Il présente les différents outils et solutions qu'il a utilisés comme Zotero, Tropy, OneNote, OneDrive, Trello, Geneanet, Rodovid, etc. Ces outils permettent de mieux organiser, partager et visualiser les données généalogiques. 

L'intelligence artificielle apporte des avancées majeures, notamment pour la reconnaissance de textes manuscrits dans les archives. Des projets comme ANR e-NDP, Socface ou HIMANIS exploitent l'IA pour indexer et transcrire automatiquement de larges corpus historiques.

Il y a des exemples concrets d'utilisation de Copilot, ChatGPT, Claude, Gemini, Mistral,  Perplexity .... pour extraire des informations généalogiques à partir de documents comme des nécrologies ou des annonces de mariage.

Au final, l'alliance entre l'expertise humaine et les technologies d'IA ouvre de nouvelles perspectives passionnantes pour les généalogistes amateurs et professionnels. Elle permet d'accéder à des sources jusqu'ici inexploitées et de mener des recherches d'une ampleur inédite. C'est ce que l'auteur appelle la "généalogie 4.0".

Dans cet ouvrage il y est expliqué comment déchiffrer des documents anciens et, notamment des fiches d'état civiles avec l'aide de l'intelligence artificielle... Ainsi que la rédaction de fiches...

Mon livre

Je vais créer un KIT G·IA avec des outils, PPT et démos (voir mon blog) et l'usage des API, des LLM avec le RAG...



Mon livre sur la G·IA :








DeepSeek


<think de DeepSeek>

Alright, the user has provided a query where they’ve requested an in-depth explanation of something called "Users Group Artificial Intelligence Andorra (U.G.A.I.A.)". First, I need to understand what UGAIA is based on the previous conversation and documents.

In the history, I already explained that UGAIA GAI is a genealogy platform using AI to analyze DNA data from AFEP. The user now seems to be asking about "UGAIA" as per their query, which refers to Users Group Artificial Intelligence Andorra (U.G.A.I.A.). Since this isn't mentioned before, I’ll have to infer what it could be based on similar names or common structures.

U.G.A.I.A. likely stands for something in Andorra related to artificial intelligence, possibly a users' group or organization focused on AI-related activities. To provide a useful explanation, I need to break down the key elements: who/what is UGAIA, its purpose, what it involves (AI & software), its goals, any specific focus areas like technology application in Andorra, and its potential impact.

I should clarify terms if they’re unfamiliar, like "associazione" which means association. I’ll explain that it's a group focused on AI, mention their role and the technologies involved, discuss their objectives such as promoting AI knowledge or collaboration, describe what AI entails for users (development, application), reference Andorra’s context, talk about challenges in the field, and outline its possible effects.

I need to ensure the response is comprehensive but not too technical. I’ll break it down into clear sections: What? Who/What? Why? How? For whom? Challenges? Impacts? To make sure all user concerns are addressed, covering any potential questions a reader might have.

</think>


Réponse de DeepSeek : 

L'Users Group Artificial Intelligence Andorra (U.G.A.I.A.) semble être une association ou un groupe de travail à but pédagogique et/or institutionnel, portée par des utilisateurs et/ou passionnés de l'intelligence artificielle (IA) dans le contexte local Andorrain. Bien que ce ne soit pas explicitement mentionné, on peut.inférer de son nom et du domaine qu'il pourrait s'agir d'une organization qui :

1. **Est associée à l'utilise de la technologie de l'intelligence artificielle (IA)** : L' « UG “ dans "UGAIA" Peut faire référence à une association ou un groupe dévoué à l'entrev畔tice et/ou l'application de la technologie dans une certaine spécialité ou contexte local.

2. **Fonctionnerait comme un point de rencontre :** L'“AI” est clairement une abréVIation de "Intelligence Artificielle" , un domaine scientifique et technique en pleine expansion. Une association nommée "UGAIA" pourrait s'inscrire dans ce cadre, et plus spécifiquement, se concentrer sur la technologie IA.

3. **S'orienterait vers des buts éducatifs ou pédagogiques :** Si l'“UG.A.I.A.” n'est pas mentionnée dans les liens fournis (sinon je serais dans une situation où j'ai accès à plus de détails), on pourrait imaginer qu'elle soit un type de groupe de travail où des utilisateurs, des étudiants ou des professionnels s'entretiennent et se partagent des connaissances sur l'utilisation pratique de la technologie IA.

4. **Permettrait d'organiser des ateliers ou des conférences :** En ce qui concerne les associations locales, un UG.A.I.A. pourrait organiser des meetups, des ateliers techniques, ou des conférences sur l'IA et son application à Andorra.

5. **Fois pour quels que soient :** L'association pourrait cible des utilisateurs curieux или des professionnels dans le domaine de l'informatique ou de la recherche.

En termes de technologie et de compétences, la IA inclut une large gamme de technologies :

- **L'apprentissage automatique**

- **La data science**

- **Les modèles prédictifs**

- **Les tâches créatives**

- etc.


Bien que je ne possède pas d'informations complètes sur "U.G.A.I.A.", l'hypothèse la plus logique est qu'elle est un groupe de travail local Andorrain autour de l'éducation et de l'application de la technologie de l'intelligence artificielle. Son but pourrait être de promouvoir un meilleur understanding de cette technologie parmi une cohorte spécifée, ou d'adapter ses outils et technologies à des besoins particuliers dans le territoire Andorrain.

Enfin, il est évident que dans un contexte local comme Andorra , il pourrait être difficile de trouver de telles associations car ce pays est géométriquement réparti et souffre de rares situations comparables où l'IA pourrait être appliquée. Par exemple, les montagnes et les paysages ANDORAIERS sont bien distincts par rapport à une France ou EU  , ce qui rend la recherche d'un contexte local spécifique plus délicat.


La question était :

Fournissez une explication détaillée du texte suivant, en décomposant ses concepts clés, ses implications et son contexte :

Texte : Users Group Artificial Intelligence Andorra (U.G.A.I.A.)

{UGAIA}


Votre explication doit :

Clarifier tous les termes ou idées complexes

Fournir des informations contextuelles pertinentes

Discuter de l'importance ou des implications du contenu

Répondre à toutes les questions qu'un lecteur pourrait se poser

Utiliser des exemples ou des analogies pour illustrer les points lorsque cela est approprié

L'objectif est de fournir une explication complète qui permettrait à quelqu'un ayant peu de connaissances préalables de comprendre pleinement le texte.



---

Erol GIRAUDY 

www.erolgiraudy.eu et www.ugaia.eu



jeudi 26 septembre 2024

Gemini : pensez à la double vérification de vos réponses

Gemini : pensez à la double vérification :

PIERRE EROL GIRAUDY 






mardi 9 juillet 2024

Analyse du document "AI Language Model Comparison Cheatsheet" avec l'IA

Analyse du document "AI Language Model Comparison Cheatsheet" avec l'IA CLAUDE :

Je dois préciser que je suis parti d'un document au format PDF, l'IA CLAUDE m'a fourni ces résultats à la suite à d'un prompte, voici le document en question :

SCAN+OCR.

Et le prompte :  ceci implique le scan du document et son OCR, c'est fait automatiquement par l'IA.

Voici AI Language Model Comparison Cheatsheet, m'analyser ce document m'en faire un résumer, et me comparer les solutions entre elles, puis faire un graphique de type histogramme et finalement réaliser un résumer avec des commentaires sur les choix possibles, le tout en français.
Me faire une analyse plus technique et la commenter avec des arguments comparatifs entre ces usages de ces solutions.

Résumé du document traduit en français : 

Ce document compare différents grands modèles de langage (LLM) d'IA, notamment GPT-4, Claude 3 Opus, Gemini Pro, Mistral Large, Falcon LLM, 70B LLaMA 3, ERNIE 3.0 Titan et Grok-1. Il fournit des informations sur leur classement Elo, la taille de leur fenêtre contextuelle, leur date de sortie, leur niveau de censure, les interfaces disponibles, leur facilité d'utilisation, leurs cas d'usage recommandés et leur prix.

CLAUDE 3.5 OPUS en mode projet.

CLAUDE 3.5 OPUS en mode projet.


Histogramme, voir le code en fin de cette page.

https://claude.site/artifacts/5d38b952-c144-42c6-ade1-5b10050ffcba

Code de l'histogramme fourni par CLAUDE.

Rendu du rapport dans l'IA CLAUDE, il est ci-après :

Comparaison des solutions :

• GPT-4 et Claude 3 Opus ont les meilleurs classements Elo (1252 et 1255) et des fenêtres contextuelles de taille moyenne. Ils sont modérément censurés et coûtent 20$.

• Gemini Pro a un bon classement (1204), une grande fenêtre contextuelle et est intégré à Google. Il coûte également 20$.

• ERNIE 3.0 Titan est très prometteur avec un classement de 1220 mais a une forte censure.

• 70B LLaMA 3 a un bon rapport efficacité/taille avec un classement de 1210 pour seulement 8 pages de contexte. Il est open source et gratuit.

• Mistral Large et Falcon LLM sont plus basiques, avec des classements de 1157 et 1028. Ils sont gratuits et adaptés à des usages légers.

• Grok-1 est amusant pour des réponses humoristiques et des tweets, à prix abordable (8$).

Histogramme comparant les modèles de langage d'IA :


Résumé et commentaires : 

GPT-4 et Claude 3 Opus semblent être les choix les plus performants et polyvalents, si le budget le permet. Gemini Pro est aussi une excellente option, surtout pour une intégration avec les outils Google.

Pour une utilisation open source gratuite, 70B LLaMA 3 offre un excellent compromis performance/coût. ERNIE 3.0 Titan est très prometteur mais sa forte censure peut être un frein.

Pour des besoins plus légers ou ludiques, Mistral Large, Falcon LLM et Grok-1 peuvent convenir, avec l'avantage d'être gratuits ou peu chers.

Le choix final dépendra des besoins spécifiques (tâches, budget, intégrations nécessaires, contraintes éthiques) de chaque utilisateur. Mais ce comparatif permet d'y voir plus clair parmi les nombreuses solutions de LLM disponibles et d'orienter la décision.

------------------- 

Voici une analyse plus technique des différents modèles de langage présentés, avec des arguments comparatifs sur leurs usages :

Performance et taille des modèles :

GPT-4 et Claude 3 Opus ont les meilleures performances (Elo de 1252 et 1255) avec une taille raisonnable (24-150 pages de contexte). Ils sont adaptés à des tâches générales exigeantes.

ERNIE 3.0 Titan et Gemini Pro suivent de près (Elo 1220 et 1204), Gemini Pro ayant une fenêtre de contexte plus large (750 pages), ce qui le rend intéressant pour traiter de longs documents.

LLaMA 3 a un excellent ratio performance/taille (Elo 1210 pour seulement 8 pages de contexte), ce qui en fait un choix efficace pour de l'inférence rapide.

Spécialisations et intégrations :

• Claude 3 se distingue pour la rédaction créative et le traitement de longs fichiers. Son API permet une intégration facile.

• Gemini Pro, avec son intégration native à Google, est idéal pour une utilisation dans cet écosystème. Ses capacités de résumé en font un bon outil pour synthétiser l'information.

• Mistral Large propose des réponses sur mesure et modérées, utile pour des applications contrôlées.

• Grok-1 est orienté vers la génération de contenu amusant et de tweets, une niche intéressante.

Considérations éthiques :

La plupart des modèles ont une modération "Moderate", ce qui permet de les utiliser dans de nombreux cas.

Cependant, ERNIE 3.0 a une censure élevée ("High"), ce qui peut limiter son usage pour certaines applications nécessitant de la liberté d'expression.

À l'inverse, le niveau "Low" de Mistral, LLaMA 3 et Grok-1 les rend moins adaptés pour du contenu public non filtré.

Accessibilité et coût :

1. LLaMA 3 et Falcon LLM sont open source et gratuits, un avantage pour la recherche et les projets à faible budget.

2. GPT-4, Claude 3 et Gemini Pro ont un coût modéré (20$) qui reste abordable pour un usage professionnel, au vu de leurs performances.

3. Mistral Large et Falcon LLM, bien que limités, ont l'avantage d'être gratuits pour des tests et usages basiques.

4. Grok-1 est économique (8$) pour son usage spécialisé en contenu humoristique.

En résumé, le choix d'un modèle dépendra des priorités :

• Pour la performance pure : GPT-4, Claude 3, ERNIE 3.0

• Pour traiter de longs documents : Gemini Pro, Claude 3

• Pour une intégration Google : Gemini Pro

• Pour une inférence économe en ressources : LLaMA 3

• Pour des usages spécifiques : Mistral Large (modération), Grok-1 (humour)

• Pour de l'open source gratuit : LLaMA 3, Falcon LLM

Une combinaison de plusieurs modèles, en fonction des tâches, peut être optimale. Par exemple :

1. GPT-4/Claude 3 pour les tâches critiques nécessitant une haute performance

2. Gemini Pro pour le traitement de longs documents dans l'écosystème Google

3. LLaMA 3 pour une inférence rapide et peu coûteuse

4. Grok-1 pour générer du contenu engageant sur les réseaux sociaux

Cette approche permet de tirer parti des forces de chaque modèle de manière complémentaire.

Histogramme comparant le coût d'utilisation des modèles de langage d'IA :

Le graphique montre que :

• GPT-4, Claude 3 et Gemini Pro ont le coût d'utilisation le plus élevé à 20$. Cela reflète leurs performances de pointe et leurs larges capacités.

• Grok-1 a un coût intermédiaire de 8$. C'est un bon rapport qualité-prix pour son usage spécialisé en génération de contenu humoristique et de tweets.

• Mistral Large, Falcon LLM, LLaMA 3 et ERNIE 3.0 ont un coût d'utilisation nul (gratuit). C'est un avantage significatif pour les projets à faible budget, la recherche académique et l'expérimentation. 

○ Parmi ces modèles gratuits, LLaMA 3 se distingue par son excellent ratio performance/coût. Son faible coût d'inférence le rend très intéressant pour un déploiement à grande échelle.

○ Mistral Large et Falcon LLM, bien que plus limités en performance, permettent de tester et prototyper gratuitement des applications basées sur les modèles de langage.

En termes de rapport performance/coût :

• LLaMA 3 est le gagnant incontesté, offrant d'excellentes performances gratuitement.

• GPT-4, Claude 3 et Gemini Pro offrent les meilleures performances absolues, à un coût raisonnable pour un usage professionnel.

• Grok-1 est un bon compromis pour sa spécialisation.


Voici une synthèse du document "AI Language Model Comparison Cheatsheet" avec une analyse comparative des différents modèles de langage, un histogramme et des recommandations sur les choix possibles.

Résumé du document :

La fiche de comparaison présente les caractéristiques clés de 8 grands modèles de langage d'IA : GPT-4, Claude 3, Gemini Pro, Mistral Large, Falcon LLM, LLaMA 3, ERNIE 3.0 et Grok-1. Elle inclut leur classement Elo, la taille de leur fenêtre contextuelle, leur date de sortie, leur niveau de censure, les interfaces disponibles, leur facilité d'utilisation, leurs meilleurs usages et leur prix.

Comparaison des modèles :

- Performance : GPT-4 et Claude 3 ont les meilleurs scores Elo (1252 et 1255), suivis de près par ERNIE 3.0 (1220) et Gemini Pro (1204). LLaMA 3 a un excellent ratio performance/taille (1210 pour 8 pages de contexte).

- Fenêtre contextuelle : Gemini Pro et Claude 3 gèrent de longs contextes (750 pages), idéal pour traiter des documents complets. Les autres ont des fenêtres plus réduites (7.5 à 150 pages).

- Spécialisations : Claude 3 excelle en rédaction créative, Gemini Pro en intégration Google et synthèse, Mistral Large en réponses modérées, Grok-1 en contenu humoristique.

- Facilité d'utilisation : La plupart sont notés "Moderate", sauf Mistral Large, LLaMA 3 et Grok-1 qui sont "Low" (plus techniques).

- Prix : GPT-4, Claude 3 et Gemini Pro coûtent 20$. Grok-1 est à 8$. Les autres sont gratuits, dont LLaMA 3 et Falcon LLM qui sont open source.

Résumé et recommandations :

Pour des usages généraux exigeants, GPT-4 et Claude 3 sont les meilleurs choix si le budget le permet. LLaMA 3 offre un excellent compromis performance/coût en open source.

Pour traiter de longs documents, Gemini Pro et Claude 3 sont idéaux, Gemini Pro brillant aussi pour l'intégration Google et la synthèse d'information.

Pour des cas d'usage spécifiques, Mistral Large convient aux réponses modérées, Grok-1 au contenu humoristique et réseaux sociaux.

Les modèles gratuits (LLaMA 3, Falcon LLM) sont parfaits pour tester, prototyper et déployer à grande échelle. ERNIE 3.0 est prometteur mais sa forte censure peut être limitante.

En pratique, combiner plusieurs modèles est souvent optimal : les plus performants pour les tâches critiques, les gratuits pour le prétraitement et les usages secondaires. Le choix dépendra des besoins précis (performance, budget, spécialisations, déploiement, éthique).

Cette analyse comparative permet de s'y retrouver dans la jungle des grands modèles de langage et de choisir la meilleure stack en fonction de ses priorités projet et métier. N'hésitez pas à expérimenter pour trouver la combinaison qui vous conviendra le mieux !


Sources :

Google Gemini: A Comprehensive Benchmark Comparison with GPT-3.5, Mistral, and Llama – AI StartUps Product Information, Reviews, Latest Updates (cheatsheet.md)



LLM Leaderboard - Compare GPT-4o, Llama 3, Mistral, Gemini & other models | Artificial Analysis


LLM Leaderboard - Compare GPT-4o, Llama 3, Mistral, Gemini & other models | Artificial Analysis


Blog - AI Heroes


LAB GENEALOGIE - Public - www.erolgiraudy.eu/ 

P. Erol GIRAUDY sur la Généalogie de mes familles Giraudy et Ottomane de Turquie et du Comté de Nice.



Code histogramme :

<svg viewBox="0 0 800 600" xmlns="http://www.w3.org/2000/svg">
  <g transform="translate(100,550)">
    <g class="x axis" transform="translate(0,0)">
      <line x1="0" y1="0" x2="700" y2="0" stroke="black"/>
      <g transform="translate(30, 20)"><text>GPT-4</text></g>
      <g transform="translate(110, 20)"><text>Claude 3</text></g>
      <g transform="translate(200, 20)"><text>Gemini Pro</text></g>
      <g transform="translate(310, 20)"><text>Mistral Large</text></g>
      <g transform="translate(420, 20)"><text>Falcon LLM</text></g>  
      <g transform="translate(510, 20)"><text>LLaMA 3</text></g>
      <g transform="translate(600, 20)"><text>ERNIE 3.0</text></g>
      <g transform="translate(690, 20)"><text>Grok-1</text></g>
    </g>
    <g class="y axis">
      <line x1="0" y1="0" x2="0" y2="-400" stroke="black"/>
      <g transform="translate(-40, -40)"><text>1000</text></g>
      <g transform="translate(-40, -140)"><text>1100</text></g>
      <g transform="translate(-40, -240)"><text>1200</text></g>  
      <g transform="translate(-40, -340)"><text>1300</text></g>
    </g>
    <g fill="steelblue">
      <rect x="20" width="60" y="-252" height="252" />
      <rect x="100" width="60" y="-255" height="255" />  
      <rect x="180" width="60" y="-204" height="204" />
      <rect x="260" width="60" y="-157" height="157" />
      <rect x="340" width="60" y="-28" height="28" /> 
      <rect x="420" width="60" y="-210" height="210" />
      <rect x="500" width="60" y="-220" height="220" />
      <rect x="580" width="60" y="-235" height="235" /> 
    </g>
  </g>
</svg>


PIERRE EROL GIRAUDY 









How to Get Your Data Ready for AI Agents (Docs, PDFs, Websites)

How to Get Your Data Ready for AI Agents (Docs, PDFs, Websites). Want to get started as a freelancer? Let me help:  Data Freel...