Wie funktioniert Prompten für AI richtig?
Prompten ist in aller Munde und nicht wenige hadern, da sich die gewünschten Ergebnisse nicht einstellen wollen. Im folgenden Beitrag werde ich in die vier Elemente des Promptens einführen und diese jeweils mit einer Vielzahl von Anwendungsmöglichkeite
Wie funktioniert Prompten für AI richtig?
Prompten sollte wohl mittlerweile auch für die meisten kein ganz so neuer Begriff mehr sein. Hätte ich das noch im November 2022 gefragt, hätten mir darauf wohl nicht viele Personen antworten können, doch dies hat sich schlagartig geändert.
Prompten ist in aller Munde und nicht wenige hadern, da sich die gewünschten Ergebnisse nicht einstellen wollen. Damit ist nun Schluss.
Im folgenden Beitrag werde ich in die vier Elemente des Promptens einführen und diese jeweils mit einer Vielzahl von Anwendungsmöglichkeiten präsentieren. Ziel ist es, die Grundlagen des Prompten zu verstehen und die Methoden kennenzulernen.
Und weil das ziemlich viel zu merken ist, habe ich noch am Ende des Beitrags ein Cheat Sheet zum Donwload für euch vorbereitet. (Ungeduldige bitte ans Ende scrollen.)
In dem Artikel nutze ich wieder die Begriffe AI, LLM und auch AI-Model recht synonym. Diese Begriffe bedeuten streng genommen nicht das Gleiche, aber ich verwende sie im Kontext gleich.
Was ist Prompten?
Mit Prompten ist letztlich nicht mehr gemeint, als einem AI-Model eine Anweisung zu geben, um eine Aufgabe auszuführen. Das unterscheidet sich auf den ersten Blick wenig von meinem Befehl an Alexa oder Siri, doch bei genauerem Hinschauen liegen hier Welten dazwischen. Der Prompt kann eine einfache Frage sein wie: “Was ist die Hauptstadt von Schweden?” oder eine komplexe Kombination aus Fragen, Anweisungen, Beispielen und Formatvorgaben umfassen.
Wenn ihr mehr zur Funktionsweise von AI-Models wissen wollt, dann schaut euch gerne meinen Artikel hierzu an. Ein Verständnis der Grundlagen kann nicht schlecht sein. ????
Exkurs: Was sind eigentlich Generative AI?
Gepromptet wird bei Generative AI. Das sind solche AI-Modelle, welche etwas erstellen können, wie z. B. Texte, Bilder, Videos oder Grafiken. Das Gegenstück dazu sind die Discriminative AI, welche Daten verarbeiten und analysieren, wie z. B. Gesichter erkennen oder auch Fahrzeuge steuern.
Wie und was man prompten kann, hängt auch von der Art des Ergebnisses einer AI ab. Mein Beitrag bezieht sich im Kern auf das Prompten für Language Models, also dort, wo Texte herauskommen. ???? Ein paar Hinweise und nützliche Links für andere Generative AI-Arten finden sich aber auch in dem Beitrag, wie bspw. für Midjourney (erstellt Bilder und Fotos).
Wie schwer ist Prompten?
Prompten kann eine wirklich komplexe Angelegenheit werden, weshalb es auch schon jetzt “prompt engineering” genannt wird. Ich hielt diesen Begriff am Anfang ein wenig für Aufschneiderei, aber habe mich mit Selbstversuchen und Recherchen dann eines Besseren belehren lassen. Es gibt viele Menschen, welche tagtäglich Ideen und Tricks finden, wie man das bestmögliche Ergebnis aus einem Generative AI-Model herausbekommt.
Man kann bei manch komplexen Prompts sogar schon behaupten, dass sich eine neue Art der Programmiersprache hieraus entwicklen kann. Wobei ich davon ausgehe, dass diese dann nicht mehr nur in rein menschlicher Sprache stattfinden wird, um Wörter und Prompts einzusparen. Bereits jetzt gibt es Methoden, die Prompts erheblich einzukürzen, welche zulasten der Verständlichkeit geht.
Grundlegendes zum Prompten…
Wie ich bereits in meinem anderen Artikel über AI schrieb, müssen wir uns beim Prompten ganz bewusst machen, dass zwar eine AI erhebliche Fähigkeiten hat, aber nicht in der Lage ist, uns zu lesen oder zu wissen, was wir wollen. Wobei ich davon ausgehe, dass dies eigentlich keiner will.
Versetzen wir uns in die Lage und gehen davon aus, dass die AI ein Mensch ist und wir uns wünschen, dass dieser Mensch eine Aufgabe erfüllt. Dann würden wir so viele Details zu unseren Anweisungen mitgeben, dass aus dem umgebenden Kontext klar wird, was wir uns wünschen. Einer Arbeitskollegin, mit der ich seit zehn Jahren zusammenarbeite, muss ich sicherlich nicht sonderlich viel erklären. Weise ich hingegen eine mir unbekannte Person an, bspw. meine Wohnung neu einzurichten, würde ich diese nicht nur mit einem Satz Erklärung anfangen lassen, auch wenn diese qualifiziert ist.
Gleiches muss man sich bei der AI bewusst machen. Diese kennt nicht den Kontext, kennt nicht uns und erst recht nicht unser Ziel. Daher sind wir gezwungen, eben diese Informationen mitzugeben, damit wir das Ergebnis bekommen, welches wir uns wünschen.
Testen, Wiederholen und gute Prompts merken
Selten werden wir jedoch mit dem ersten Prompt bereits die perfekte Antwort bekommen, daher erlauben uns verschiedene AI auch, unseres Prompt zu verfeinern, bis wir das gewünschte Ergebnis gefunden haben. Natürlich können wir auch den Prozess neu starten, wobei dies meist teurer sein kann, da einige AI-Modelle je Prompt abrechnen.
Somit sollte man sich bei den ersten Fehlschlägen nicht aus der Ruhe bringen lassen und einfach weiter probieren. Und sollte hier etwas gelingen, dann ist es immer ratsam, sich diesen Prompt inklusive der Antwort niederzuschreiben, um bei ähnlichen Aufgaben nicht wieder bei null anfangen zu müssen.
Dem Gedanken folgend ist es auch ratsam, sich zugleich Vorlagen für Prompts zu erstellen, welche dann nur noch mit den wechselnden Informationen befüllt werden müssen.
Die Elemente eines Prompts
Doch wie funktioniert nun das Prompten? Ein Prompt besteht aus den folgenden vier Elementen:
Die Anweisung stellt den Kern des Prompts dar. Welche Aufgabe soll die AI erfüllen?
Der Kontext bettet meine Anweisung in weitere Erklärungen und ermöglicht es, einen Zusammenhang herzustellen.
Daten erweitern den Prompt um wichtige Informationen, welche beachtet werden müssen bzw. die Grundlage für die Antwort bereiten können.
Das Format bestimmt die Art und Weise der Antwort, wie z. B. der Stil oder das Format.
Natürlich muss ein Prompt nicht immer alle diese Elemente aufweisen. Doch sind es diese vier, die ich geistig abhaken sollte, wenn ich meinen Prompt schreibe.
Die Anweisung – Kern des Prompts
Die Anweisung stellt die tatsächliche Aufgabe dar, welche die AI erfüllen soll. Diese kann so simpel sein wie “Die Katze macht…” (Antwort: “Miau”) oder eben eine komplexe Anforderung, um etwa einen Vortrag zu erstellen.
Hier gilt es meist, die Anweisung so simpel und klar wie möglich zu gestalten. Sollte man mal keine Idee haben, wie man etwas beschreibt, kann man auch negative Anweisungen geben, also benennen, was man nicht möchte.
In jedem Fall sollte man sich ein klares Bild von dem gewünschten Ergebnis machen und dies dann mit so wenig Worten wie nötig und so detailliert wie möglich angeben. Übrigens, auch wenn alles mit einer AI schneller gehen kann, kann auch der Entwurf eines Prompts viel Zeit einnehmen.
Bei Generative AI, welche bspw. Bilder erstellen ist es zudem wichtig, gewisse Codes und Formulierungen zu kennen, um ein gewünschtes Ergebnis zu erzielen. Hier gibt es zum Glück einige Guides, die einem helfen können. Am Ende des Beitrages habe ich ein paar hierzu verlinkt.
Möglichkeiten für die Anweisung
Grundlegende Fähigkeiten
Frage - Soll die AI bestimmte Informationen geben? (Hier ist darauf zu achten, dass diese nicht stimmen müssen, da die AI dies aus ihrer “Erinnerung” per Zufall generiert.)
Zusammenfassung - Die AI kann Texte oder andere Quellen übersichtlich zusammenfassen.
Analyse - Die AI analysiert Elemente auf eine bestimmte Frage hin.
Gedankenanstoß - Jemals nicht weitergekommen bei einer Aufgabe? Die AI kann einem einen Gedankenanstoß geben.
Texte - Eigentlich ganz klar und nur der Vollständigkeit halber. Die AI erstellt jegliche Texte vom Gedicht bis hin zur E-Mail.
Aufgaben - Es sollte ein Vorschlag unterbreitet werden, welchen Schritt man als Nächstes gehen sollte. Dies kann man natürlich auch gleich auf einen ganzen Plan erweitern.
Erweiterte Anweisungen
Quellenangaben - Können Quellen genannt werden, welche die Antwort belegen?
Zitate - Können Zitate von relevanten Personen genannt werden, welche die Antwort unterstützen oder aufwerten?
Statistiken/Daten - Können Statistiken oder andere Daten genannt werden, welche die Antwort unterstützen?
Analogien/Vergleiche - Soll die Antwort mit vergleichbaren Analogien untermauert werden?
Gegenargumente - Sollen gleich Gegenargumente für die Antwort erstellt werden?
Perspektive - Sollen mehrere Perspektiven und Meinungen, oder auch nur eine bestimmte, Teil der Antwort sein?
Keywords - Sollen bestimmte Begriffe oder Ausdrücke in der Antwort erscheinen?
Der Kontext - Hintergrund des Prompts
Eine simple Anweisung, kann schnell missverstanden werden, wenn der Hintergrund dieser nicht klar ist. Möchte ich eine Zusammenfassung aus einem Schriftsatz, ist es wichtig zu wissen, wofür diese genutzt werden soll. Geht es rein darum, einen Sachverhalt zusammenzufügen oder Argumente für eine Erwiderung zu sammeln. Beide Hintergründe werden zu völlig unterschiedlichen Ergebnissen führen.
So gesehen ist der Kontext das Licht, in dem der ganze Prompt gelesen werden soll und führt im Falle andere nicht eindeutiger Informationen dazu, dass diese richtig eingeordnet werden können.
Möglichkeiten für den Kontext
Kontext - Welchen Hintergrund umgibt der Prompt? Wie ist dieser zu lesen?
Zielgruppe - Auf welchen Personenkreis zielt die Antwort ab?
Sensible Angelegenheiten - Gibt es besondere sensible Angelegenheiten, welche bestmöglich ausgelassen oder vermieden werden sollen?
Fachbereich - Welchem Fachbereich ist der Prompt zuzuordnen? (Bsp. Strafrecht, Jura, Medizin, Software)
Umfang/Tiefe - Wie tief soll das Thema bearbeitet werden? (Schulvortrag 7. Klasse oder eine wissenschaftliche Abhandlung)
Daten - Informationen zum Prompt
Um die Antwort weiter zu präzisieren oder als Teil des Prompts selbst, können weitere Informationen mitgegeben werden. Abhängig von der Aufgabe kann es sich um den Text handeln, welcher analysiert werden soll oder um weitere wichtige Informationen, die eine Antwort in die richtige Richtung stoßen.
Möglichkeiten für Informationen
Beispiele - Als Teil des Prompts können Beispiele genannt werden, welche eine mögliche Variante der gesuchten Antwort darstellen.
Spezielle Terminologie - Gibt es spezielle Terminologie oder Fachbegriffe, welche beachtet oder verwendet werden sollten?
Fristen, Zeiten - Gibt es Fristen oder bestimmte Zeiten, welche bei der Antwort beachtet werden müssen?
Visuelle Elemente - Bilder, Grafiken, Tabellen oder andere visuelle Mittel, welche den Prompt aufwerten können.
Daten - Gibt es weitere Daten oder gesammelte Daten, welche im Prompt verarbeitet werden sollen?
Dokumente/Texte - Sollen Texte im Prompt verarbeitet werden? (Hier ist auf die technischen Limits zu achten. Bei ChatGPT kann GPT4 aktuell bspw. nur ca. 2400 Wörter (mehr Infos) verarbeiten.)
Format - Aussehen des Prompts
Schlussendlich sollte das Ausgabeformat des Prompts bestimmt werden. Wünsche ich mir einen Fließtext oder Stichpunkte? Soll es eine freundliche E-Mail für den Kollegen werden oder benötige ich ein Schriftstück für die Verwaltung. All diese Formate werden grundlegende unterschiedliche Ergebnisse liefern. Ein fehlendes Format für eine spezielle Art der Nutzung kann die ganze Antwort nutzlos machen.
Möglichkeiten für Formatangaben im Prompt
Ausgabeformat - In welchem Format soll die Ausgabe erfolgen? (Stichpunkte, Dialog, Anschreiben, E-Mail)
Ton/Ansprache - Wie soll die Antwort formuliert werden? (freundlich, formell, streng, locker, Siezen usw.)
Rolle - In welcher Rolle soll sich die AI “denken”? Ein Anwalt nutzt juristische Termine, eine Ärztin wird aus medizinischer Sicht antworten usw. (Handle als Anwalt, Mandant, Experte, Fan)
Ziel - Welches Ziel soll das Ergebnis allgemein liefern? (informieren, unterhalten, erklären)
Einschränkungen - Wie viele Wörter, Zeichen oder ähnliches soll die Antwort haben.
Sprache - Sofern gewollt, kann die Ausgabesprache von der Sprache des Prompts abweichen, z.B. um etwas zu übersetzen.
Was klappt nicht beim Prompten?
Bei all den vielen Möglichkeiten, die AI bietet, gibt es auch klare Restriktionen bzw. Ungenauigkeiten, welche eine AI unterliegt. Wer meinen anderen Artikel zu AI gelesen hat, weiß, dass Generative AI mehr oder weniger einem gewissen Zufallsmechanismus unterworfen, die Antworten “nur” errät. Dieser Zufall und die besondere Form des Datenspeicherns, welche übrigens bis heute niemand so 100 % verstanden hat, sorgen für die folgenden Einschränkungen:
????Fehlende Quellen - Auch wenn ich es oben als Methode angegeben habe, ist die AI meist nicht in der Lage Quellen oder weitere Hilfsmittel anzugeben.
????Vorurteile/Einstellungen - Ein AI-Modell ist immer nur so gut wie die Daten die es erhalten hat. Beim Training ist es schier unmöglich, dass die AI nicht einem bestimmten Wertekanon oder Vorurteilen unterliegt.
????Fehlinformationen/Halluzinationen- Informationen müssen nicht zwingend der Wahrheit entsprechen bzw. kann es so weit gehen, dass die AI Informationen erfindet. Bitte prüft Informationen immer nach oder gebt diese bestenfalls im Prompt selbst mit. AI-Models sind keine Suchmaschinen!
????Rechnen - Ja, es ist eine Software, aber AI kann nicht wirklich gut rechnen. Auch hier wird geraten, was da kommen könnte und diese Antwort unterliegt dem Zufall. Hier kann man entweder mit Tools oder Beispielen arbeiten, aber da geht der Taschenrechner schneller.
Techniken beim Prompten
Mittlerweile haben sich einige Techniken des Prompten durchgesetzt, welche ich gerne in der gebotenen Kürze vorstellen möchte. Im Grundsatz finden sich diese bereits in den genannten Elementen und ihren Beispielen. Es ist dennoch sinnvoll, diese nochmals zu sehen, um ein besseres Verständnis für das Prompten zu erlangen.
Zero-Shot-Prompting
Die einfachste Form eines Prompts. Das Wort “Shot” einfach für Beispiel und es handelt sich hierbei um einen Prompt ohne die Angabe von Beispielen.
Few-Shot-Prompting
“Few-Shot-Prompting” ist das “Gegenteil” von Zero-Shot-Prompting. Man gibt somit Beispiele beim Prompten an, um dem AI-Model mitzuteilen, welches Ergebnis man sich wünscht.
Role Prompting
Bereits in den oberen Beispielen benannt, geht es hier einfach darum, dass man eine bestimmte Rolle angibt, in welche sich die AI geben soll. Ziel ist es, dass die AI mit dem kurzen Satz eine Kombination aus allen Elementen des Prompting annimmt, da einer Rolle zugleich Kontext, Format und Informationen zugrunde liegen. Der Prompt beginnt dann mit “Act as a lawyer/Handle als ein Anwalt”.
Chain of Thought
Die Chain of Thought Methode zielt darauf ab, der AI einen Weg der Begründung vorzuzeigen, damit diese den Weg übernimmt und bestenfalls keine zufälligen Antworten gibt. Dies findet meist in Kombination mit Few-Shot-Prompting statt.
Zusammenfassung
Wie man wohl spätestens jetzt gemerkt hat, kann Prompten doch eine recht komplexe Angelegenheit werden. Im Grundsatz sollte man sich das Folgende merken:
4️⃣ Ein Prompt besteht aus den bis zu vier Elementen Anweisung, Kontext, Daten und Format und sollte immer so kurz wie nötig und so lang wie möglich sein. Präzision schlägt Masse!
???? Die richtigen Ergebnisse zu finden, kann ein längerer Prozess aus Trial-and-Error werden.
???? Gute Prompts sollte man sich merken und bestenfalls als Template nutzen.
???? Eine AI unterliegt vielen Ungenauigkeiten und man sollte das Ergebnis nie ungeprüft nutzen.
???? Wer nicht mal nicht weiterweiß, kann immer gerne hier nachschauen. ????
Download Cheat Sheet - Prompten mit AI
Hilfreiche Links
Prompt Engineering Guides:
https://www.promptingguide.ai/
Prompt Sammlung
Midjourney Guide
https://www.notion.so/Midjourney-AI-Guide-41eca43809dd4d8fa676e648436fc29c?pvs=4
DALL-E Guide
https://dallery.gallery/dall-e-ai-guide-faq/
Wenn dir der Beitrag gefallen hat und du keinen mehr verpassen willst, dann melde dich gerne bei meinem Newsletter an.
Damit erhältst du meinen akuellen Blogbeitrag und vielleicht den ein oder anderen interessanten Link oder Beitrag von Dritten direkt in dein Postfach.
[sibwp_form id=2] Weitere Beiträge