Ich experimentiere gerne mit der Bilderkennung von ChatGPT – besonders dann, wenn ein Bild der einzige Hinweis ist. Kürzlich hat ChatGPT in der neuen o3-Version genau so ein Geographie-Quizz gelöst, und ich war wirklich beeindruckt.
Das Ausgangsmaterial war ein einzelnes Bild – kein Kontext, keine Beschreibung, nur ein Detail einer Landschaftsaufnahme.

Meine Aufgabe an o3 war: Wo ist das?
Was danach passierte, war für mich ein Paradebeispiel für die agentischen Fähigkeiten von o3.
💡 o3 analysierte das Bild, prüfte die visuellen Merkmale, und begann, Hypothesen aufzustellen.
Es kombinierte Bildanalyse mit geographischem Wissen, zog Seen, Bergformationen und architektonische Details in Betracht – fast wie ein Detektiv.
Die KI ging strukturiert vor, stellte Rückfragen, und optimierte ihre Suche Schritt für Schritt. Ganze vier Minuten dauerte der Dialog – und am Ende kam sie auf St. Wolfgang am Wolfgangsee in Österreich. Volltreffer!
👉 Hier kannst du den ganzen Ablauf nachlesen:
Geographie-Quiz mit o3 lösen – mein Chat
Wichtig: Man muss auf „Nachgedacht für 4m 7s“ klicken, um alles zu sehen. Das Originalbild wird leider beim Share-Link nicht angezeigt, findet sich aber oben im Blogbeitrag.
Was mich besonders begeistert: o3 denkt nicht einfach nur nach, es handelt. Es analysiert, kombiniert, entscheidet – ganz im Sinne von „agentischem Verhalten“. In diesem Setup fühlt sich ChatGPT nicht mehr wie ein reiner Chatbot an, sondern wie ein echter Assistent auf Spurensuche.
Ich kann jedem, der Spaß an Rätseln, Karten, Bildern oder Geographie hat, nur empfehlen: Probier’s selbst aus! Lass o3 deine Rätsel entschlüsseln 😉
P.S.: „Nachdenk“prozess als Screenshot (leider ist die Qualität des Screenshots aufgrund der Länge nicht perfekt)
Wirklich faszinierend! Interessant, wie ChatGPT die Möglichkeiten erwägt und wider verwirft. Und sogar Vermutungen anstellt, man wolle es austricksen.