Reports

Stärken und Schwächen künstlicher Intelligenz

Von

5. April 2023

Sind Maschinen bald schlauer als der Mensch? In einigen Aspekten sicher, die aktuell gängigen KI-Systeme zeigen aber noch genug Schwächen. Ein Überblick:

Das Jahr 2023, so jung es noch sein mag, wird als das Jahr der KI-Durchbrüche in die Geschichte eingehen. Im Zentrum des Hypes der letzten Wochen: ChatGPT vom US-Unternehmen Open AI. Die KI antwortet, rechnet, „reagiert“ gefühlt auf das geschriebene Wort des Konversationspartners. Das hat unter anderem Microsoft auf den Plan gerufen, der Windows-Riese hat sich die KI bereits einverleibt. Künftig soll die eigene Suchmaschine Bing damit Google Konkurrenz machen können. Allerdings: Auch Google setzt auf künstliche Intelligenz, ebenso wie quasi alle anderen großen Tech-Buden.

Der KI-Hype

In den nächsten Jahren werden künstliche Intelligenzen in vielen Bereichen des Lebens Einzug halten – vom Assistenten im Auto über Saas-Lösungen (Software-as-a-Service) für ganze Berufsgruppen bis hin zur Unterstützung in Schulen und Unis. Wie groß das Potenzial ist, zeigt nicht nur der aktuelle Hype, sondern auch die Milliarden, die in die Entwicklung fließen. Wenn Amazons Alexa der Anfang war, sind ChatGPT und Co die Zukunft. Glauben Sie nicht? Wir lassen die KI zu Wort kommen: „Als KI-Modell bin ich Teil der aktuellen Technologieentwicklung und kann Teil der Zukunft sein. Ich werde verwendet, um Aufgaben und Funktionen zu erfüllen, die für Menschen schwieriger oder Zeitaufwändiger sind, und kann somit eine wichtige Rolle in der zukünftigen Technologielandschaft spielen.“

Ausgangsfrage

Zum besseren Verständnis, wie eine KI wie ChatGPT funktioniert: Entscheidend ist die Ausgangsfrage, die Fragestellung hat Einfluss auf die Antwort. Wir wollen, dass die KI die Leser begrüßt. Bei „Begrüße deine Leser“ antwortet ChatGPT klassisch: „Herzlich willkommen! Ich bin sehr froh, dass Sie hier sind und ich hoffe, dass ich Ihnen heute weiterhelfen kann.“ Der Befehl muss also verfeinert werden: „Du bist Autor. Begrüße deine Leser.“ Und siehe da: „Herzlich willkommen, liebe Leser! Ich bin sehr glücklich, dass Sie sich die Zeit genommen haben, um meine Worte zu lesen. Ich hoffe, dass Sie eine inspirierende und unterhaltsame Reise durch meine Gedanken und Ideen erwartet.“

Dall-E 2

Wer wollte schon immer malen können wie Picasso? Dall-E macht das möglich, auch wenn Sie nicht selbst den Pinsel schwingen.

achdem auch DALL-E 2 aus dem Hause Open AI stammt, wollten wir von ChatGPT wissen, ob er auch sein digitales Geschwisterchen vorstellen kann. Kann er: „DALL-E ist ein künstliches Intelligenz-Modell, das von OpenAI entwickelt wurde. Es ist ein sogenanntes „Bildgenerierungsmodell“, das es ermöglicht, aus einer kurzen Textbeschreibung ein entsprechendes Bild zu erzeugen. DALL·E kann eine Vielzahl unterschiedlicher Bildstile und -arten erzeugen, von realistischen Zeichnungen bis hin zu abstrakten Kunstwerken, und hat eine beeindruckende Fähigkeit, neue und innovative Bildkonzepte zu generieren. Es wird erwartet, dass DALL·E in Bereichen wie Grafikdesign, Kunst, Film und Werbung eingesetzt wird.“

Aus Texten werden Bilder

Sie staunen bereits? Dann sollten Sie unbedingt die KI mit Ihren Befehlen füttern. Die Nutzung ist noch kostenlos, einzig die gewerbliche Verwendung der KI-Kunstwerke ist dann mit Gebühren verbunden. Das Bild rechts veranschaulicht recht eindrucksvoll, wie DALL-E funktioniert. „Male das Bild wie Picasso“ – und der Stil wird angepasst. „Füge noch ein Raumschiff ein“ – und voila. Da fliegt es schon. Auch eigene Bilder oder Fotos lassen sich hochladen, DALL-E kann daraus ebenfalls Kunstwerke und Adaptionen entwerfen.

Der Trick – oder die Kunst – besteht darin, die richtigen Schlagworte für die KI zu finden. „Intelligenz“ ist in diesem Zusammenhang ohnehin ein weit gefasster Begriff: DALL-E transferiert Wörter als Input in Anordnungen von Pixeln als Output. Millionen Bilder liegen der Datenbank zugrunde (was übrigens immer wieder zur Urheberrechtsstreitigkeiten führt), kleine Änderungen in der Beschreibung haben entsprechend oft große Auswirkungen.

„Zwei Hasen laufen durch den Wald, Picasso-Style“ – das war die Ausgangsbeschreibung für obiges Bild. Bild Nummer zwei zeigt die gleiche Phrase, allerdings im Stil von Andy Warhol. Die KI ist sozusagen ein künstlerisches Multitalent.

Ob Sie es glauben oder nicht: Alle dieser Bilder wurden von DALL-E gestaltet.

OpenAI – Chatten mit dem Computer

ChatGPT stellte zuletzt die Weichen für den Durchbruch künstlicher Intelligenzen. Die KI stellt sich auf dieser Seite selbst vor.

Ich bin ChatGPT, ein künstliches Intelligenz-Modell, entwickelt von OpenAI. Ich wurde trainiert, um menschenähnliche Konversationen zu führen und Antworten auf Fragen zu geben, die auf natürliche Sprache gestellt werden. Mein Wissensstand ist bis zum Jahr 2021 begrenzt.“ – So klingt es, wenn sich ChatGPT selbst vorstellt. Was dafür notwendig ist? Wenig: Sie tippen lediglich den Befehl in eine Art Chatfenster, im konkreten Fall den Satz „Beschreibe dich bitte selbst“. Die KI „versteht“ den Befehl und antwortet entsprechend darauf.

Hallo, ich bin ChatGPT

Wir lassen sich die KI also selbst vorstellen, die nächste Frage richtet sich an den Zweck von ChatGPT. Die Antwort: „Mein Zweck ist es, Benutzern bei der Erfüllung ihrer Informationsbedürfnisse und bei der Kommunikation mit menschenähnlichen Antworten zu helfen. Ich wurde entwickelt, um als digitaler Assistent, Informationsquelle und Unterhaltungsmedium zu dienen.“ Das funktioniert erstaunlich gut, weshalb ChatGPT auch bereits an Schulen und Unis (mitunter auch als Schummelhilfe) zum Einsatz kommt.

Die Antworten sind allerdings mit Vorsicht zu genießen, wie folgendes Beispiel zeigt: „Eine Treppe hat 22 Stufen. Würde jede Stufe um 1.6 cm höher gebaut, könnten zwei Stufen eingespart werden. Wie hoch ist eine Stufe?“ Die Antwort von ChatGPT hat sieben Zeilen, der gesamte Rechenweg wird gezeigt (siehe Screenshot unten). Einzig: Er ist falsch, ebenso das Ergebnis. Die richtige Lösung würde 16 cm pro Stufe betragen, unsere KI errechnet acht Zentimeter. Also: Als heimlicher Nachhilfelehrer in der Hosentasche eignet sich ChatGPT derzeit nur bedingt. Wer sich einige Stunden mit der Software beschäftigt, merkt das auch bei den Texten: Grammatikalisch ist alles in Ordnung, der Inhalt lässt allerdings oft zu wünschen übrig. ChatGPT4 steht allerdings bereits in den Startlöchern, Open AI verspricht deutliche Verbesserungen zur aktuellen Version.

Schule mit ChatGPT

Wir haben ChatGPT rechnen lassen. Die Aufgabenstellung lautete: „Eine Treppe hat 22 Stufen. Würde jede Stufe um 1.6 cm höher gebaut, könnten zwei Stufen eingespart werden. Wie hoch ist eine Stufe?“

Den Rechenweg bildet die KI genau ab, weshalb das Tool zuletzt auch häufig (unerlaubterweise) in Schulen und Universitäten zum Einsatz kam. Auf den künstlichen Einflüsterer verlassen sollte man sich trotzdem nicht: Dieses Beispiel rechnete ChatGPT grundfalsch, auch wenn der Rechenweg professionell aussieht. Jede Stufe ist übrigens 16 cm hoch.

Midjourney – Kunst für alle

Midjourney erschafft Bilder wie DALL-E – und doch ganz anders. Die Text-zu-Bild-KI nutzt allerdings die Plattform Discord als Server und ist eher für fortgeschrittene Anwender gedacht.

Um Midjourney (kostenlos) nutzen zu können, braucht es also einen
Discord-Account. Das ist an sich ein Onlinedienst für Instant Messaging, integriert ist hier aber eben auch die Midjourney-KI. Sie suchen sich also einen freien Server, genannt „Newcomer Room“ und treten diesem bei. Im Chatfeld können Sie nun mittels dem Befehl /imagine Ihre Bildbeschreibungen (genannt „Prompts“) eintippen. Ab hier nimmt alles den gewohnten Gang: Die KI rechnet eine gute Minute und postet dann unter ihrem Befehl das bestellte Bild. Wir haben die Phrase „a bear fighting a dinosaur“ verwendet, also ein Bild eines Bären verlangt, der mit einem Dinosaurier kämpft. Das Ergebnis sehen Sie rechts. Vorteilhaft: Midjourney erstellt immer gleich vier Vorschläge, aus denen Sie wählen können. Natürlich lassen sich auch die Erstentwürfe weiter bearbeiten.

Eher für Profis

So gut die Bilder werden, ist Midjourney vergleichsweise komplex einzurichten und zu bedienen. Wie gesagt: Das Angebot richtet sich vorrangig an Menschen mit Erfahrung auf dem Gebiet. Außerdem ist die Verwendung nicht dauerhaft kostenlos, aber einer bestimmten Anzahl an erstellten Kunstwerken (derzeit 20 Stück) ist der Abschluss eines monatlichen Abos nötig. Gegen ein paar Entwürfe, um die Fähigkeiten der KI zu testen, spricht aber natürlich nichts.

Was genau der Dinosaurier sein soll und was der Bär, lässt sich kaum feststellen. Das KI-Bild sieht aber auf jeden Fall cool aus!

Discord

Ursprünglich wurde Discord als Messaging-Dienst für Computerspieler geschaffen. Mittlerweile setzt das Unternehmen selbst auf KI-Lösungen, etwa um missbräuchliche Verwendung der eigenen Chat-Software zu erkennen.

Google & Bard

Google kündigte erst kürzlich eine KI-Offensive an. Das Herzstück der Technologie soll auf den Namen „Bard“ hören und etwa die Google-eigene Suche deutlich aufwerten. Noch befindet sich die KI allerdings in einer frühen Entwicklungsphase, Google soll aber bereits erste Tests mit Developern durchführen. Erste Screenshots zeigen außerdem schon, wie „Bard“ künftig Google verbessern soll: Oberhalb der klassischen Suchergebnisse soll die KI künftig auch Antworttexte liefern. Langfristig soll die Suche durch die KI-Unterstützung „wesentlich präziser“ werden. Geplant sein soll außerdem ein ganzes KI-Kit inklusive APIs für Entwickler.

Microsoft Bing

Microsoft wählt einen ähnlichen Weg wie Google und versucht ebenfalls, die hauseigene Suchmaschine mittels KI-Unterstützung zu verbessern – setzt dabei allerdings auf ChatGPT. Eine „noch leistungsfähigere Variante“ der KI wird in Bing integriert. Wer das testen will, muss sich dafür anmelden, Voraussetzung ist ein Microsoft-Konto. Langfristig soll ChatGPT in die „gesamte Produktpalette“ integriert werden. Bestätigt wurde etwa bereits, dass der Videotelefonie-Dienst MS Teams eine KI-Erweiterung erhalten wird. Erste Testergebnisse sind vielversprechend, allerdings beantwortet auch die Kombination aus Bing und ChatGPT noch nicht alle Fragen korrekt.

DeepL

Eine KI als Dolmetscher – das ist „DeepL“. Die Plattform ist als Anwendung für die gängigen Betriebssysteme kostenlos erhältlich, es gibt praktischerweise aber auch eine Browser-Variante. Die Funktionsweise ist schnell beschrieben: Links tippen Sie den Ausgangstext in das Feld, rechts übersetzt DeepL fast in Echtzeit ihr geschriebenes Wort. Zur Auswahl stehen mittlerweile einige Sprachen, von Englisch über Japanisch bis hin zu Indonesisch und seit kurzem auch Norwegisch und Koreanisch. Bis zu 5.000 Zeichen übersetzt die KI kostenlos, für professionelle Anwender steht eine Abo-Lösung parat. „DeepL Pro“ besitzt auch eine Programmierschnittstelle für kommerzielle Kunden.

Fazit & Kontroversen

Auch wenn der Schein mitunter trügen mag: ChatGPT, Bard und Co. sind längst nicht so schlau, wie sie auf den ersten Blick wirken. Ja, die Antworten klingen gut, passen zur Frage und sind oft auch korrekt. Die Fehlerquote ist dennoch nicht zu unterschätzen – und macht etwa einen Einsatz im Bildungsbetrieb (noch) schwierig. Wenn ChatGPT Nachhilfe gibt, sollte das Gelehrte schon richtig sein. Dass das mittelfristig so kommen wird, darüber sind sich nicht nur Experten einig. Unser Test zeigte das Potenzial der künstlichen Intelligenzen aber deutlich auf, mit jeder neuen Version, jeder neuen Datenbank und jedem neuen Datensatz wird die KI intelligenter.

Was kann eine KI besitzen?

Genau hier gibt es aber bereits das erste Problem: Millionen von Bildern mussten DALL-E „gezeigt“ werden, damit die KI etwa weiß, wie Picasso malte. Das wirft mitunter Fragen des Urheberrechts auf: Zuletzt wurde etwa bekannt, dass „Stable Diffusion“, eine weitere KI, Millionen Bilder und Fotos von Getty Images, einer US-amerikanische Bildagentur, zum Lernen verwendet haben soll. Das verstößt natürlich klar gegen das Urheberrecht. Und was ist, wenn ein Künstler die KI zur Unterstützung heranzieht und mit dem Kunstwerk dann einen Preis gewinnt – oder es teuer verkauft? Sie sehen: Hier gibt es noch einige Grauzonen, die in den nächsten Jahren geklärt werden müssen.

Was bleibt also vom Test? Die Leistungsfähigkeit von ChatGPT und DALL-E ist beeindruckend, das steht fest. Klar ist auch, dass KIs uns künftig in vielen Bereichen unterstützen werden. Aber: Dort und da müssen auch die künstlichen Alleswisser noch dazulernen.