Die passenden Prompts finden – keine leichte Aufgabe

Jeder Nutzer von KI weiß, dass es auf die sogenannte Eingabeaufforderung, den Prompt, ankommt. Besser spricht man von Prompting, denn mit einer einzigen Eingabe ist es in den seltensten Fällen getan. Das gilt nicht nur für KI-Sprachmodelle wie ChatGPT. Inzwischen hat sich das Leistungsspektrum der Tools stark erweitert: Mit KI kann man nicht nur gesprochene und geschriebene Texte in den verschiedensten Sprachen gestalten. Es ist ohne weiteres möglich, mit Hilfe textbasierter Prompts ganz unterschiedliche bildliche Darstellungen zu generieren: Fotos, Gemälde, Cartoons, verschiedene Arten von Graphiken und vieles mehr. Die Tools sind bei entsprechendem Prompting außerdem in der Lage, Videos und Audio-Dateien zu erstellen. Dabei hängt alles von den Eingabeaufforderungen ab.

Dies zeigt Ethan Mollick in seinem neuesten Blogpost (One Useful Thing; Okt. 2024): Der Output hängt wesentlich vom Schreibstil der Nutzerin oder des Nutzers ab: Gibt man ein: „The best type of pet is a …“ erhält man die Antwort „dog“. Ersetzt man im Prompt das Wort „type“ durch „kind“, also „The best kind of pet is a …“, generiert ChatGPT „subjective question”. Mollick weist u. a. darauf hin, dass verschiedene User auch auf einen wortwörtlich identischen Prompt unterschiedliche Generierungen erhalten können. Zwar haben die Tools kein Gedächtnis, d. h. sie „behalten“ Einzelheiten nur innerhalb desselben Chats. Aber in irgendeiner Form gibt es ein „in-context learning“, d. h. sie lernen bei jeder Aufgabe innerhalb eines Chats dazu. Selbst Experten sind nicht in der Lage zu erklären, wie dieses Lernen zustande kommt.

In jedem Fall ist es hilfreich, sich einen Überblick über die Trainingsdaten des jeweiligen KI-Systems zu verschaffen. Je näher der Prompt an den Trainingsdaten ist, umso wahrscheinlicher ist ein gutes Ergebnis. An der Spitze der 20 wichtigsten Bücher, mit denen ChatGPT und andere KI-Sprachsysteme trainiert werden, steht Alice in Wonderland. Gebe ich eine Passage aus diesem Buch ein, entspricht die folgende Generierung weitestgehend dem Originaltext. Niederschmetternd ist der Output, wenn ich einen Textabschnitt aus dem Werk eines kaum bekannten Science-Fiction Autors mit einem speziellen Schreibstil eingebe. Zusammenfassend kann man Folgendes festhalten:

Je weiter man sich vom „Wahrscheinlichkeitsbereich“ – Mollick spricht von „probability space“ – entfernt, umso eher bekommt Generierungen, die sich von denen anderer Nutzerinnen und Nutzer unterscheiden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert