Zurück zur Übersicht
OpenAI hat drei neue Modelle für Echtzeit-Sprache, Übersetzung und Transkription in seine API aufgenommen. Der Ausbau richtet sich an Entwickler von Sprachassistenten, Voice-Interfaces und Live-Übersetzung.
OpenAI hat seine API um drei neue Audio-Modelle erweitert: GPT-Realtime-2, GPT-Realtime-Translate und GPT-Realtime-Whisper.
GPT-Realtime-2 ist für Echtzeit-Sprachanwendungen mit stärkerem Reasoning ausgelegt. GPT-Realtime-Translate dient der Live-Übersetzung, GPT-Realtime-Whisper der Streaming-Transkription. OpenAI positioniert das Update damit klar für Anwendungen, die Sprache in Echtzeit verstehen, übersetzen und beantworten müssen.
Weiterlesen
Die Einordnung im Magic Quadrant stärkt Codex als Infrastruktur für Softwareteams. OpenAI verweist auf Millionen Nutzer und mehrere große Unternehmenskunden.
OpenAI zufolge hat ein internes Reasoning-Modell den Unit-Distance-Fall einer klassischen Vermutung der diskreten Geometrie widerlegt. Laut dem Unternehmen haben externe Mathematiker den Beweis geprüft. Sollte sich der Befund halten, wäre das ein Hinweis darauf, dass KI in der Forschung mehr kann als nur Zuarbeit.
NVIDIA will dafür schrittweise bis zu 100 Milliarden Dollar in OpenAI investieren, gekoppelt an die Auslieferung der Systeme. Der Deal zeigt, dass im KI-Wettlauf inzwischen Strom, Rechenzentren und Lieferketten genauso wichtig sind wie Modelle.
Die neue Struktur soll Unternehmen beim Aufbau und Einsatz von KI-Systemen unterstützen. Der Schritt zeigt, dass sich der Wettbewerb im Markt zunehmend über Umsetzung und Vertrieb an Firmenkunden entscheidet.
Codex ist seit dem 14. Mai 2026 in der ChatGPT-Mobile-App als Preview verfügbar. Nutzer können damit unterwegs an laufenden Aufgaben weiterarbeiten, statt dafür an den Desktop gebunden zu sein.