Alibaba präsentiert Qwen3-Coder mit Unterstützung für KI-Agenten, die unabhängige Entscheidungen treffen können

Aktualisiert: 23.07.2025, 13:35

Das Qwen-Team hat offiziell Qwen3-Coder vorgestellt, seinen leistungsstärksten Code-Generator bis heute, der den "Agenten"-Ansatz unterstützt. Der Hauptstar der Reihe ist Qwen3-Coder-480B-A35B-Instruct. Dies ist ein hybrides Mixture-of-Experts-Modell mit 480 Milliarden Parametern (35 Milliarden gleichzeitig aktiv), das nativ mit einem Kontext von bis zu 256.000 Tokens und mit Extrapolation von bis zu 1 Million Tokens arbeiten kann. In Tests zeigt es Rekordergebnisse unter Open-Source-Modellen in Agentic Coding, Agentic Browser-Use und Agentic Tool-Use-Aufgaben - auf dem Niveau von Claude Sonnet 4.

Was ist agentisches Coding?

Qwen3-Coder wurde nicht nur entwickelt, um Code zu generieren, sondern auch um als "Agent" zu arbeiten, der planen, Werkzeuge nutzen, Feedback erhalten und Entscheidungen treffen kann. In realen Aufgaben (z. B. SWE-Bench) interagiert es in mehreren Schritten mit der Umgebung, was komplexes Long-Horizon-RL-Lernen erfordert. Zu diesem Zweck hat das Qwen-Team ein skalierbares System von 20.000 parallelen Umgebungen auf der Grundlage von Alibaba Cloud aufgebaut.

Funktionen von Qwen3-Coder

Trainiert auf 7,5 Billionen Tokens, von denen 70 % Code sind
Unterstützt riesigen Kontext von bis zu 1 Million Tokens (mit YaRN)
Verwendet verstärkendes Lernen (Code RL) bei realen Aufgaben zur Verbesserung der Codeausführung
Integration mit Entwicklertools wie Qwen Code (CLI), Claude Code und sogar dem OpenAI SDK
Fähigkeit, sowohl über die API als auch in der lokalen Umgebung zu arbeiten

Werkzeuge und APIs

Das Qwen Code CLI-Tool basierend auf Gemini Code steht mit dem Modell zur Verfügung. Es ermöglicht Ihnen, Qwen3-Coder einfach in Ihren eigenen Projekten zu verwenden, mit Unterstützung für benutzerdefinierte Eingabeaufforderungen und Funktionen. Es bietet auch die Arbeit über Claude Code und den direkten API-Zugriff über Alibaba Cloud Model Studio.

Wofür ist es gedacht?

Qwen3-Coder wird als universeller Coding-Agent positioniert - von der Erstellung von Webseiten bis hin zu komplexen mehrstufigen Entwicklungsaufgaben. Das Qwen-Team plant, weitere Modellgrößen herauszubringen, um die Bereitstellungskosten zu senken, und untersucht Möglichkeiten zur Selbstverbesserung des Agenten.

Über Qwen

Qwen ist eine Reihe von großangelegten Sprachmodellen und Agentenlösungen aus dem Qwen-Team von Alibaba, die darauf ausgelegt sind, Text, Code, Datenanalysen und mehrstufige Szenarien unter Verwendung von Werkzeugen zu generieren. Die neueste Version, Qwen3-Coder, basiert auf einer Mixture-of-Experts-Architektur mit 480 Milliarden Parametern (35 Milliarden aktiv), unterstützt nativ bis zu 256.000 Kontext-Tokens und bis zu 1 Million mit Extrapolation, und zeigt Ergebnisse auf dem Niveau geschlossener Modelle wie Claude Sonnet 4 in SWE-Bench, Agentic Coding, Browser-Use und Tool-Use-Aufgaben. Das Modell integriert sich mit dem OpenAI SDK, CLI-Tools (Qwen Code, Claude Code), Alibaba Cloud API und unterstützt die Ökosysteme von GitHub und Hugging Face, wobei verstärkendes Lernen bei realen Codierungsaufgaben eingesetzt wird, um Genauigkeit und Effizienz zu verbessern.

Quelle: qwenlm.github.io/blog/qwen3-coder/

Fügen Sie Gagadget zu Ihrem Google News-Feed hinzu