AI-Unternehmen

Minimax AI - Unternehmen für AI-Videos in China

22. September 20240 Kommentar2.1k

Minimax AI Unternehmensübersicht

MiniMax AI entwickelt KI-Technologien für die groß angelegte Modellierung, Infrastrukturentwickler und Lösungen für die Anwendung von Inhalten. MiniMax ist der jüngste Vorstoß des von Alibaba und Tencent unterstützten Einhorn-Startups in den Bereich der generativen KI. Das Unternehmen wurde 2021 gegründet und hat seinen Hauptsitz in Shanghai, China, und widmet sich der Entwicklung von AGI-Maschinensystemen (General Artificial Intelligence). Eines seiner Hauptprodukte ist ein Text-Videogenerator das für Aufsehen gesorgt hat, weil es hyperrealistische Aufnahmen von Menschen, einschließlich genauer Handbewegungen, erzeugen kann.

Minimax AI Produkte

Videoerzeugung Modell: video-01

Video-01 ist AI-Modell das aus Textanweisungen hochauflösende Videos mit einer Auflösung von 1.280 x 720 Pixeln bei 25 Bildern pro Sekunde erzeugen kann. Die Videos sind derzeit auf sechs Sekunden begrenzt. Video-01 bietet verschiedene Stile, darunter Anime-, CGI- und Videospielgrafiken. Das Modell zeigt relativ wenige Bildfehler oder Artefakte und scheint sogar in der Lage zu sein, Text in Videos darzustellen. MiniMax video-01 ist ein gutes Modell, das ungefähr gleichwertig ist mit Luma Labs Traum-Maschine aber nicht so gut wie Runway Gen-3

Musik Generation Modell: Musik-01

Music-01 ist ein Text-zu-Musik-Ai-Modell mit folgenden Hauptmerkmalen:

Hochgradig anthropomorphe Musikerzeugung: Dieses Modell erzeugt komplexe und emotionale Musikkompositionen, die sich ideal für verschiedene kreative Szenarien eignen und ein hohes Maß an Flexibilität und Innovation bei der Musikproduktion bieten.
Unterstützung mehrerer Musikstile: Das Modell beherrscht eine breite Palette von Musikstilen - von traditionellen Instrumenten bis zu moderner elektronischer Musik und von chinesischer Klassik bis zu westlichem Pop.

Text Groß Modell: abab 6.5s

Die abab 7 unterstützt das effiziente Training großer Datensätze, was die Praxistauglichkeit und die Reaktionsgeschwindigkeit erheblich verbessert und gleichzeitig die Trainings- und Argumentationskosten für große Modelle drastisch reduziert. Im Vergleich zur traditionellen Transformer-Architektur senkt diese neue Architektur die Kosten um über 90% bei einer Sequenzlänge von 128K, mit noch größeren Vorteilen, wenn die Sequenzlänge zunimmt.