Minimax AI Unternehmensübersicht
MiniMax AI entwickelt KI-Technologien für die groß angelegte Modellierung, Infrastrukturentwickler und Lösungen für die Anwendung von Inhalten. MiniMax ist der jüngste Vorstoß des von Alibaba und Tencent unterstützten Einhorn-Startups in den Bereich der generativen KI. Das Unternehmen wurde 2021 gegründet und hat seinen Hauptsitz in Shanghai, China, und widmet sich der Entwicklung von AGI-Maschinensystemen (General Artificial Intelligence). Eines seiner Hauptprodukte ist ein Text-Videogenerator das für Aufsehen gesorgt hat, weil es hyperrealistische Aufnahmen von Menschen, einschließlich genauer Handbewegungen, erzeugen kann.
Minimax AI Produkte
Videoerzeugung Modell: video-01
Video-01 ist AI-Modell das aus Textanweisungen hochauflösende Videos mit einer Auflösung von 1.280 x 720 Pixeln bei 25 Bildern pro Sekunde erzeugen kann. Die Videos sind derzeit auf sechs Sekunden begrenzt. Video-01 bietet verschiedene Stile, darunter Anime-, CGI- und Videospielgrafiken. Das Modell zeigt relativ wenige Bildfehler oder Artefakte und scheint sogar in der Lage zu sein, Text in Videos darzustellen. MiniMax video-01 ist ein gutes Modell, das ungefähr gleichwertig ist mit Luma Labs Traum-Maschine aber nicht so gut wie Runway Gen-3
Musik Generation Modell: Musik-01
Music-01 ist ein Text-zu-Musik-Ai-Modell mit folgenden Hauptmerkmalen:
- Hochgradig anthropomorphe Musikerzeugung: Dieses Modell erzeugt komplexe und emotionale Musikkompositionen, die sich ideal für verschiedene kreative Szenarien eignen und ein hohes Maß an Flexibilität und Innovation bei der Musikproduktion bieten.
- Unterstützung mehrerer Musikstile: Das Modell beherrscht eine breite Palette von Musikstilen - von traditionellen Instrumenten bis zu moderner elektronischer Musik und von chinesischer Klassik bis zu westlichem Pop.
Text Groß Modell: abab 6.5s
Die abab 7 unterstützt das effiziente Training großer Datensätze, was die Praxistauglichkeit und die Reaktionsgeschwindigkeit erheblich verbessert und gleichzeitig die Trainings- und Argumentationskosten für große Modelle drastisch reduziert. Im Vergleich zur traditionellen Transformer-Architektur senkt diese neue Architektur die Kosten um über 90% bei einer Sequenzlänge von 128K, mit noch größeren Vorteilen, wenn die Sequenzlänge zunimmt.
Stimme großes Modell: speech-01
Eine Vielzahl von hochwertigen hyper-anthropomorphen Tönen, Stimmerzeugungsfunktionen der nächsten Generation.