mercredi 12 mars 2025

QwQ is the reasoning model of the Qwen series.

 QwQ is the reasoning model of the Qwen series.

tools32b

852.5K5 days ago

Readme

QwQ is the reasoning model of the Qwen series. Compared with conventional instruction-tuned models, QwQ, which is capable of thinking and reasoning, can achieve significantly enhanced performance in downstream tasks, especially hard problems. QwQ-32B is the medium-sized reasoning model, which is capable of achieving competitive performance against state-of-the-art reasoning models, e.g., DeepSeek-R1, o1-mini.

Future Work

This marks Qwen’s initial step in scaling Reinforcement Learning (RL) to enhance reasoning capabilities. Through this journey, we have not only witnessed the immense potential of scaled RL but also recognized the untapped possibilities within pretrained language models. As we work towards developing the next generation of Qwen, we are confident that combining stronger foundation models with RL powered by scaled computational resources will propel us closer to achieving Artificial General Intelligence (AGI). Additionally, we are actively exploring the integration of agents with RL to enable long-horizon reasoning, aiming to unlock greater intelligence with inference time scaling.

Reference

QwQ-32B est open-weight en Hugging Face et ModelScope sous la licence Apache 2.0 et est accessible via Qwen Chat.


Travaux futurs

"Il s’agit de la première étape de Qwen dans la mise à l’échelle de l’apprentissage par renforcement (RL) pour améliorer les capacités de raisonnement. Tout au long de ce parcours, nous avons non seulement été témoins de l’immense potentiel de l’apprentissage par renforcement à l’échelle, mais nous avons également reconnu les possibilités inexploitées des modèles de langage pré-entraînés. Alors que nous travaillons au développement de la prochaine génération de Qwen, nous sommes convaincus que la combinaison de modèles de base plus solides avec l’apprentissage par renforcement alimenté par des ressources de calcul à grande échelle nous rapprochera de la réalisation de l’intelligence artificielle générale (AGI). De plus, nous explorons activement l’intégration des agents avec l’apprentissage par renforcement pour permettre un raisonnement à long terme, dans le but d’obtenir une plus grande intelligence grâce à la mise à l’échelle temporelle de l’inférence."

Qwen :  

https://qwenlm.github.io/

https://chat.qwen.ai/

QwQ 32B Demo - a Hugging Face Space by Qwen

https://huggingface.co/spaces/Qwen/QwQ-32B-Demo


Je suis Qwen, un assistant IA conçu pour vous aider! Je suis développé par Alibaba Cloud et je peux répondre à des questions, fournir des informations, vous aider avec des tâches et bien plus. N'hésitez pas à me poser des questions ou à demander de l'aide! 😊

Okay, the user asked "qui êtes vous ?" which is French for "Who are you?" I need to respond in French since they used that language.
First, I should introduce myself as a helpful AI assistant. Mention my name, Qwen, and who developed me, Alibaba Cloud. Keep it friendly and straightforward.
Also, I should highlight my capabilities briefly—answering questions, providing info, assisting with tasks. Maybe add that I can help with various topics.
Make sure the response is concise but covers the main points. Avoid any technical jargon. Keep the tone polite and approachable.
Check for any grammar mistakes in French. Use proper sentence structure. Maybe end with an offer to help further.

--- 
Erol GIRAUDY 

mardi 11 mars 2025

Architecture des Agents IA

 

Architecture des Agents IA

Architecture des Agents IA

1. Les Trois Piliers Clés

PilierDescriptionCouleur
Synthèse des connaissancesCapacité à collecter, intégrer et générer des connaissances depuis diverses sourcesOrange
ModèlesModèles de langage alimentant les capacités (NLP, vision, raisonnement)Vert
Mise à l'échelleAdaptabilité aux différentes tâches et environnementsBleu

2. Composants Périphériques

ComposantDescriptionIcône
RaisonnementAnalyse logique, conclusions et résolution de problèmes💡
ProgrammationLecture, écriture et correction de code⌨️
PerformanceVitesse et précision dans l'exécution des tâches📊
RéférencesMesures quantitatives d'évaluation des capacités📈
RobustesseGestion des erreurs et fiabilité du système🛡️
ProgrammableCapacité à être modifié pour des cas spécifiques👨‍💻
TélémétrieSurveillance et collecte des données opérationnelles📡
EfficacitéOptimisation des ressources et minimisation du gaspillage⚙️
CoûtAspects économiques du développement et maintenance💰

3. Interconnexions Principales

  • La Synthèse des connaissances alimente le Raisonnement et la Programmation
  • Les Modèles et la Mise à l'échelle interagissent avec la Performance et l'Efficacité
  • La Robustesse et la Télémétrie assurent la fiabilité et l'observabilité du système




Il y a quelques jours, je suis tombé sur les réflexions de Raj Koneru sur l’avenir de l’agence, il a utilisé le terme « continuum agentique ». Cette phrase a profondément résonné en moi, faisant écho à ma propre réflexion sur l’agence et la montée d’un « spectre agentique ». 

Le blog ci-dessous est une capture brute de mes idées, dictées directement dans mon MacBook - pas de polissage, pas de retouche ChatGPT.... J’espère qu’il touchera une corde sensible chez vous aussi.


https://kore.ai/beyond-ai-agents-the-rise-of-agentic-x-and-the-future-of-intelligent-automation/?utm_medium=OrganicSocial&utm_source=LinkedIn&utm_campaign=CobusPostFeed&utm_term=TechBlog23022025


https://blog.kore.ai/cobus-greyling/the-shifting-vocabulary-of-ai?utm_medium=OrganicSocial&utm_source=Medium&utm_campaign=CobusPostFeed&utm_term=MyHomePage17122024


QwQ is the reasoning model of the Qwen series.

  QwQ is the reasoning model of the Qwen series. tools 32b 852.5K  Pulls Updated  5 days ago 32b 8 Tags Updated 5 days ago cc1091b0e276 · 20...