Xiaomi hat ein ultraschnelles Sprachmodell entwickelt und es OpenSource gemacht

Von: Viktor Tsyrfa | heute, 10:08

Xiaomi hat ein Sprachmodul namens MiDashengLM-7B entwickelt. Durch die Verwendung von neuronalen Netzen anstelle von festen Algorithmen erreichte das Unternehmen die schnellste Sprachrecognition in 22 synthetischen Tests. Dies ermöglicht den Aufbau von Benutzerplattformen, die nahezu ohne Verzögerung arbeiten. Das Modell kann in Smartphones, Smart-Home-Systemen, Autos usw. verwendet werden.

MiDashengLM-7B analysiert Audio in Echtzeit und trennt Umgebungsgeräusche oder Musik. Xiaomi setzt dieses Sprachmodell bereits aktiv in seinen Produkten ein, zum Beispiel analysiert das Auto YU7 ständig den Klang und kann das Geräusch von Kratzern oder brechendem Glas erkennen, was es ermöglicht, den Alarm auch dann auszulösen, wenn es keinen Aufprall gibt, der vom Bewegungssensor erkannt werden würde.

Xiaomi hat den Quellcode für die fortschrittliche Stimme unter der Apache-Lizenz 2.0 veröffentlicht sowie detaillierte Dokumentation zur Schulung und Implementierung der Technologie. Das Modell kann als Grundlage für Entwickler und akademische Forscher dienen, die Open-Voice-Systeme ohne Abhängigkeit von geschlossenen Ökosystemen schaffen möchten.

Chinesische Unternehmen sind nicht dafür bekannt, an Open-Source-Projekten zu arbeiten. Durch die Öffnung des Sprachmodells zieht Xiaomi mehr Entwickler an, was diesem Produkt hilft, auf Augenhöhe mit Analogien großer Technologiekonzerne zu konkurrieren. Die Erfahrung hat gezeigt, dass große und komplexe Softwareprodukte, wie ein Betriebssystem oder ein Browser, schneller entwickelt werden und wettbewerbsfähiger sind, wenn sie von einer offenen Gemeinschaft von Programmierern und nicht von einem einzelnen Unternehmen entwickelt werden.