ChatGPT – Stärken und Schwächen des Chatbots
Stefanie Schneider hat mir vor kurzem erzählt, dass man ChatGPT auch für statistische Datenauswertungen nutzen kann. Das habe ich dann mal gleich ausprobiert. Ich wähle das Sprachmodell 4.0, gehe dort auf den Code-Interpreter und importiere über das +-Zeichen eine CSV-Datei, und zwar die der Alten Pinakothek in München. (Dass man dort über die erweiterte Suche die hier folgenden Operationen auch bequemer durchführen kann, ist geschenkt, denn es geht an dieser Stelle um das Prinzip.) Darin sind über 5000 Werke enthalten. Zuerst frage ich nach Werken aus dem 16. Jahrhundert. Nach einigem hin und her – wer chatgpt kennt, weiß, dass man mit ihm richtig schöne Gespräche führen kann – gibt er mir knapp 730 an, die der Bedingung gehorchen. Das hin und her kam dadurch zustande, dass man ihn auf die Tatsache aufmerksam machen musste, dass nicht nur Werke, die in der Entstehungs-Spalte mit “16. Jhdt.” gekennzeichnet waren, aus dem 16. Jahrhundert stammen, sondern z.B. auch solche, die auf “1534” datiert sind (herrlich, wie er sich dann dafür entschuldigt, dass er das nicht gleich berücksichtigt hat; ich weiß, „er“ ist wahrscheinlich schon einer epistemologisch problematische Anthropomorphisierung). Danach will ich wissen, welche von diesen Bildern größer als 1 qm sind (zugegeben erst mal keine kunsthistorische sonderlich relevante Information, aber es geht ja hier nur um die generelle Funktionsweise). Dabei kommt 0 heraus, genauso wie bei “größer als 0,5 qm”. Dabei gibt es eine ganze Reihe, die der Bedingung entsprechen. Offenbar zeigt sich auch hier: Rechnen kann er nicht. Ausgerechnet der Computer, aber es ist eben ein Sprachmodell, kein Zahlenmodell. Ich gehe mal davon aus, dass das Problem ein vorübergehendes ist. Stattdessen frage ich dann nach Werken aus dem 16. Jahrhundert, die erst nach 1900 in die Sammlung gekommen sind. Und das klappt – allerdings weiß ich nicht, ob das Ergebnis (103) richtig ist.
Hier noch die Chathistorie: https://chat.openai.com/share/9bff3a30-fe68-420f-93f2-0a90fc3a30c1
Also das Resultat ist zwiespältig, aber doch immerhin ermutigend insofern, als nunmehr wirklich ohne jede Programmierkenntnis statistisch gearbeitet werden kann. Solange, wie hier weiterhin Unkorrektheiten auftauchen, sollte man vielleicht weiterhin MAX verwenden. Das ist auch schon für Statistik- bzw. Informatik-Laien konzipiert, aber doch in der Benutzung anspruchsvoller als eine KI wie chatgpt.
Probieren Sie es aus!
1 KOMMENTAR