Bildbearbeitung KI

Von | 8. Februar 2024

MGIE ist Open Source
Apple nennt das als Open Source freigegebene Modell „MGIE“, kurz für „MLLM-Guided Image Editing“ – wobei MLLM wiederum die Abkürzung von „Multimodal Large Language Model“ ist. Zur Erforschung kooperierte man mit der University of California zu Santa Barbara und präsentierte die Resultate erstmals auf der International Conference on Learning Representations. Um die gewünschten Ergebnisse zu erzielen, wird die Nutzereingabe intern zunächst in eine präzisere Aufforderung übersetzt. Das Beispiel aus dem Paper lautet, den Prompt „färbe den Himmel blauer“ in „erhöhe die Sättigung der Himmelsbereiche um 20 Prozent“ zu verwandeln – und diesen dann weiterzuverwenden.

Wer einen näheren Blick auf das Projekt werfen möchte, findet den Code auf GitHub. Eine privat gehostete Online-Demo gibt es ebenfalls, allerdings ist die Seite derart stark frequentiert, dass man recht lang auf Zugriff warten muss. Das gesamte Paper steht ebenfalls öffentlich zur Verfügung, darin werden auf 24 Seiten die wichtigsten Aspekte der Technologie beschrieben.

Quelle: Heise https://www.mactechnews.de/news/article/Apple-verkuendet-KI-Durchbruch-Bilder-per-Texteingabe-manipulieren-und-bearbeiten-184255.html

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.