🤖 AI Nachrichten: OpenAI's GPT 4.5 Leak, Google's Gemini Launch und mehr!
Künstliche Intelligenz (KI) wächst in einem beispiellosen Tempo und die neuesten Nachrichten auf diesem Gebiet sind keine Ausnahme. In diesem Artikel werden wir über den kürzlichen Leak von OpenAI über ihr kommendes GPT 4.5-Modell, Googles neuen Gemini-Launch und andere aufregende Entwicklungen in der Welt der KI berichten.
Inhaltsverzeichnis
- GPT 4.5 Leak von OpenAI
- Googles Gemini Launch
- Mid Journey V6 News
- Microsofts F-2 Small Large Language Model
- Pika 1.0: Die Zukunft der KI-Videoerstellung
GPT 4.5 Leak von OpenAI
Kürzlich wurde ein Leak von OpenAI veröffentlicht, der aufregende Details über ihr kommendes GPT 4.5-Modell enthüllt hat. Laut dem Leak wird GPT 4.5 das fortschrittlichste Modell sein, mit multimodalen Fähigkeiten in Sprache, Audio, Vision, Video und 3D. Es wird auch komplexe Argumentation und Cross-Modal-Verständnis bieten.
Obwohl der Leak vielversprechend aussieht, ist es wichtig, ihn mit Vorsicht zu genießen, da es keine offizielle Bestätigung dafür gibt. Außerdem ist der Preis des Modells ziemlich hoch, wobei das Basis-Chat-Modell von GPT 4.5 6 Cent pro 1.000 Tokens für Ein- und Ausgabe kostet. Das 64k-Context-Window-Modell ist noch teurer und kostet 12 Cent pro 1.000 Tokens für die Eingabe und 36 Cent pro 1.000 Tokens für die Ausgabe.
Googles Gemini Launch
Google hat kürzlich ihre Gemini-API gestartet, die extrem wettbewerbsfähig gegen OpenAIs Preisgestaltung ist. Mit 60 API-Abfragen pro Minute kostenlos nutzt Google ihr Geld, um Verluste zu machen und mehr Marktanteile zu gewinnen. Der einzige Haken ist, dass alles, was Sie über die API eingeben und ausgeben, an Google zurückgesendet wird, um ihre KI im Laufe der Zeit zu verbessern.
Google hat auch ihren AI-Musikgenerator aktualisiert, der es jedem ermöglicht, die Musik zu beschreiben und einen Track zu erstellen. Die Musik-Effekte sind komplett kostenlos und können in jedem Browser verwendet werden.
Mid Journey V6 News
Mid Journey V6, das sehr erwartet wird, sollte nächste Woche veröffentlicht werden. Die Mid Journey-Website bekommt auch Ordner und Sammlungen und eine native iOS-App ist in Arbeit. Mid Journey V6 muss mindestens auf Dolly 3-Niveau sein, um wettbewerbsfähig zu sein.
Microsofts F-2 Small Large Language Model
Microsoft hat ihr F-2 Small Large Language Model vorgestellt, das nur 2,7 Milliarden Parameter hat, aber mit dem Llama 2-Modell konkurriert, das etwa 27-mal so groß ist. Dieses winzige Modell konkurriert sogar mit Mistol 7B.
Pika 1.0: Die Zukunft der KI-Videoerstellung
Pika 1.0 ist die beste Text-to-Video-Generierung KI, die wir bisher gesehen haben. Es befindet sich derzeit in einer kleinen Beta, aber es ist die beeindruckendste KI-Videoerstellung, die wir bisher gesehen haben. Pika Labs 1.0 ist auf dem Weg und wird erstaunlich sein.
Schlussfolgerung
Die Zukunft der KI sieht heller aus als je zuvor, mit neuen Modellen und Fähigkeiten, die jeden Tag entwickelt werden. Vom GPT 4.5-Leak von OpenAI bis zum Gemini-Launch von Google gibt es viel zu freuen in der Welt der KI. Achten Sie auf weitere Entwicklungen in den kommenden Monaten.
Vor- und Nachteile
Vorteile:
- Aufregende neue Entwicklungen in der KI, einschließlich GPT 4.5 und Pika 1.0
- Googles Gemini Launch bietet wettbewerbsfähige Preise für KI-Entwickler
- Microsofts F-2 Small Large Language Model ist beeindruckend für seine Größe
Nachteile:
- Der Preis von GPT 4.5 ist ziemlich hoch
- Die Gemini-API erfordert, dass Ein- und Ausgabe zur Verbesserung an Google zurückgesendet werden
- Mid Journey V6 muss mindestens auf Dolly 3-Niveau sein, um wettbewerbsfähig zu sein
Highlights
- Der GPT 4.5-Leak von OpenAI enthüllt aufregende neue Fähigkeiten in multimodaler KI
- Googles Gemini Launch bietet wettbewerbsfähige Preise für KI-Entwickler
- Pika 1.0 ist die beeindruckendste KI-Videoerstellung, die wir bisher gesehen haben
- Microsofts F-2 Small Large Language Model ist beeindruckend für seine Größe
FAQ
F: Was ist GPT 4.5?
A: GPT 4.5 ist ein kommendes KI-Modell von OpenAI mit multimodalen Fähigkeiten in Sprache, Audio, Vision, Video und 3D.
F: Was ist Googles Gemini Launch?
A: Googles Gemini-API bietet wettbewerbsfähige Preise für KI-Entwickler mit 60 API-Abfragen pro Minute kostenlos.
F: Was ist Pika 1.0?
A: Pika 1.0 ist die beste Text-to-Video-Generierung KI, die wir bisher gesehen haben, mit beeindruckenden Fähigkeiten zur Generierung fotorealistischer Videos aus Text-Prompts.
Ressourcen:
- OpenAI: https://openai.com/
- Google Gemini: https://cloud.google.com/gemini
- Mid Journey: https://www.midjourney.com/
- Microsoft F-2: https://www.microsoft.com/en-us/research/blog/f-2-a-small-large-language-model-for-efficient-training-and-inference/