KI kommuniziert mit uns Menschen in unserer Sprache. Was natürlich aussieht, ist aber nur Mathematik. Ein kleiner Sprachkurs.
Danke, lieber Staubsauger
Wer mit einem Bot redet, sagt manchmal "Bitte" und "Danke". Das würde bei einem Staubsauger befremdlich wirken. Auf der anderen Seite ist es essenziell, einem Tier, dem man etwas beibringt, durch Lob und Belohnung zu danken.
Die Besonderheit von KI ist, dass sie – anders als etwa klassisch programmierte Expertensysteme – nicht nach der Regel "wenn a, dann auch b" lernt. Ein "KI-System [ist nach der Definition der KI-VO] ein maschinengestütztes System, das für einen in unterschiedlichem Grade autonomen Betrieb ausgelegt ist und das nach seiner Betriebsaufnahme anpassungsfähig sein kann und das aus den erhaltenen Eingaben für explizite oder implizite Ziele ableitet, wie Aussagen, wie etwa Vorhersagen, Inhalte, Empfehlungen oder Entscheidungen erstellt werden, die physische oder virtuelle Umgebungen beeinflussen können".
KI spricht "Token"
Übersetzt bedeutet das: KI "lernt", aus Eingaben Ziele zu befolgen, die nicht ausschliesslich durch den Menschen, sondern auch durch die Maschine gesteuert werden, ohne dass ein Mensch diesen Prozess beeinflussen oder gar kontrollieren kann. Damit KI nach der KI-VO ableitungsfähig ist, muss sie auf besondere Weise lernen. Dazu bedarf es der sogenannten Tokenisierung, also Aufspaltung der Sprache.
Wie ein Lateinwitz
Wenn man so will, funktioniert KI-Sprache technisch wie ein Lateinwitz auf Kölsch, der durch die Aufspaltung von Wortteilen Latein und Kölsch vermischt. "Datis nepis potus Colonia" kann mit dem nötigen Sprachverständnis umgedeutet werden in: "Dat is ne Pis(s)pott us Colonia (also Köln)".
Ein anderes Beispiel, das den Witz in sich verkörpert, lautet "Situs vilate in isse tabernit." Oder bei richtiger Zuordnung. "Si(eh)t us vi (wie) Latein, isset aber nit." Die sinngebende Zuordnung übernimmt im Falle der KI die Wahrscheinlichkeitsrechnung. KI funktioniert technisch so, dass Worte beim Training in die KI in kleine Bestandteile, sozusagen Wortschnipsel, sogenannte Tokens, zerlegt werden. Die Schnipsel allein ergeben keinen Sinn.
Sprache aus Zahlen
Die KI verarbeitet dazu Sprache als Input in Zahlen. Tokenisierung bezeichnet das Zerteilen von Text in Worte beziehungsweise Wortbestandteile und die anschliessende Umwandlung in Zahlen. Der Satz "Nach diesem Abend bin ich ein Experte in KI" könnte von einem Tokenisierer aufgeteilt werden in "Nach diesem Abend bin ich ein Experte in KI". 13 Token ergeben dann 43 Buchstaben.
Durch das Training "lernt" die KI, Worte nach Sinnzusammenhängen zusammenzustellen. Hierbei greift sie grundsätzlich auf die wahrscheinlichste Wortfolge zurück. Fragt man nach dem heissen gelben Himmelskörper, findet die KI zuerst "So" und dann "nne". Also Sonne.
Menschliche Intelligenz
Menschen und wohl auch Tiere lernen ohne diese Aufspaltung, indem sie Erfahrungen machen und zuordnen. Wer als Kleinkind einmal ein Bild eines Löwen im Bilderbuch gesehen hat, der erkennt ihn im Zoo wieder. KI muss demgegenüber künstlich unterscheiden lernen, indem man sie mit vielen Bildern von Löwen und anderen Tieren füttert und sie mit Kombinationen aus 0 oder 1 beziehungsweise ja oder nein "belohnt", wenn sie ein Muster einem anderen richtig zuordnet. Das Lernen ist technisch aufwendig, aber dank hoher Rechenleistung präzise.
Weltwissen in Schnipseln ist unberechenbar
Da aber nicht alle Ergebnisse so wahrscheinlich sind wie bei dem heissen gelben Himmelskörper Sonne, kommt es bei KI oft zu unerwünschten Ergebnissen. Die Technik hinter der KI ist auf ihre Weise beinahe so komplex wie die Abläufe in menschlichen oder tierischen Gehirnen, nur eben künstlich.
Stark vereinfacht gesprochen zerlegt die Technik das aus Texten, Bildern und Tönen bestehende Weltwissen in kleine Schnipsel und setzt sie nach mathematischen Regeln auf menschliche Aufforderung hin wieder zusammen. Das Ergebnis ist nicht zufällig, aber für den Menschen auch nicht berechenbar, reproduzierbar oder gar vorhersehbar.