Ich möchte zeigen, wie Künstliche Intelligenz die verborgenen Strukturen der Welt um uns herum bearbeiten kann. Fast alles ist quantifizierbar und kann daher in statistischen Beziehungen beschrieben werden - wenn X, dann Y. Was wir derzeit erleben - der KI-Boom - ist eine Folge der leichter verfügbaren (und zuverlässigen) Daten durch das Internet, der erhöhten Rechenleistung und schließlich der jahrzehntelangen Entwicklung cleverer und effizienter Algorithmen zur Datenanalyse. Nicht mehr und nicht weniger.
Januar 10, 2024
Künstliche Intelligenz & Uhrmacherei - Eine Einführung
Marcus Siems @siemswatches
Sammler, Autor, Datenanalyst
Künstliche Intelligenz und Uhrmacherei:
- Einführung - ChatGPT-Interview - Gemeinschaft Ausblick -
Künstliche Intelligenz ist ein Phänomen von wachsendem Interesse für unser aller Leben. Sie gleitet mehr und mehr aus der abstrakten Fachwelt in unsere alltäglichen Erfahrungen und Routinen. Und auch in der Welt der Uhren tauchen immer mehr Berichte zu diesem Thema auf (zum Beispiel [hier], [hier], [hier] oder [hier]). All diese Entwicklungen werden in der Regel mit viel Begeisterung aufgenommen... wahrscheinlich aus zwei Hauptgründen:
Erstens, weil es sich surreal anfühlt, dass eine so traditionelle und alteingesessene Branche wie die Uhrenindustrie beginnt, KI in größerem Umfang einzusetzen, nachdem sie scheinbar Jahrhunderte lang unverändert durch die Zeit gegangen ist. Und zweitens, weil 99,9% von uns (mich eingeschlossen) nicht wirklich wissen, was vor sich geht, wenn wir eine Suchanfrage bei ChatGPT und Co. eingeben.
KI-generiertes (DeepAI) Bild einer künstlichen Intelligenz, die in der Uhrmacherei arbeitet.
Auch wenn Künstliche Intelligenz eine unserer fortschrittlichsten Technologien ist, bringt sie einen mythischen Aspekt mit sich. Wahrscheinlich ähnlich wie die Menschen sich gefühlt haben müssen, als sie zum ersten Mal mit der Erkenntnis konfrontiert wurden, dass unsere Welt vollständig aus Miniaturteilchen besteht oder dass unsere Gehirne (und damit wir) durch elektrochemische Schaltkreise funktionieren. Wir müssen erst einzelnen Wissenschaftlern glauben, bevor wir es als Gesellschaft verstehen können.
Solange KI jedoch im Reich der Fabelwesen verbleibt, werden wir nicht in der Lage sein zu beurteilen, ob eine neue uhrmacherische Anwendung - sei es eine Website, ein Design oder ein Tool - wirklich neu und potenziell nützlich oder nur ein Spielzeug ist. Wir wären wie Dorothy, die dem KI-Zauberer folgt, der uns verspricht, was wir wollen. Aber zeigen Sie uns die roten Schuhe! Lassen Sie uns stattdessen dieses Unterfangen angehen und versuchen, besser zu verstehen, was Künstliche Intelligenz ist und wofür sie eingesetzt werden kann.
"Maschinelles Lernen Captcha" von Randall Munroe (xkcd).
1) Künstliche Intelligenz - Bedeutung
Ich denke, viel von der Kraft, die uns mit Ehrfurcht erfüllt, liegt bereits im Namen. Intelligenz ist wahrscheinlich eine der Eigenschaften, die wir als Menschen am ehesten mit uns selbst in Verbindung bringen und die uns vom Rest des Tierreichs unterscheiden[1]. Es ist ein Wort, das sehr viel Gewicht hat. Aber das, was wir dem Wort zuschreiben, und das, was in der KI-Forschung und -Anwendung tatsächlich getan wird, kann stark auseinanderklaffen.
Denn was ist pragmatisch gesehen Künstliche Intelligenz die Vorhersage eines Ergebnisses auf der Grundlage von Daten, auf die sie trainiert wurde (mehr dazu weiter unten). Mit anderen Worten: Es handelt sich um eine statistische Methode zur Identifizierung und Quantifizierung von Mustern. Nicht mehr und nicht weniger. Auf diese Weise kann es tatsächlich wie das menschliche Gehirn arbeiten. Auch wir versuchen, Muster in der Welt um uns herum zu finden, und wenn wir sie einmal gefunden haben, fällt es uns schwer, sie nicht mehr zu sehen. Nehmen Sie das folgende Beispiel eines Dalmatiners:
Schwarz-weiße Spritzer - können Sie den Dalmatiner erkennen? Foto mit freundlicher Genehmigung der Michael Bach Datenbank.
Wenn Sie das Bild zum ersten Mal sehen, sieht alles wie zufällige Flecken in Schwarz und Weiß aus. Irgendwann tauchen Strukturen auf, wie ein Baum im Hintergrund, eine Straße und möglicherweise Blätter. Der Hund (ein Dalmatiner) ist ziemlich schwer zu finden, aber wenn Sie ihn einmal gesehen haben, können Sie ihn nicht mehr übersehen. Das ist jedoch nur Ihr Gehirn, das den leeren Raum zwischen den schwarzen Flecken ordnet... Genau genommen gibt es keinen Hund.
Diese Mustererkennung - selbst auf einer abstrakten Ebene - ist keine Intelligenz, sondern eine Assoziation. Sei es die Assoziation zwischen Punkten und einem Hund; die Sonne und ein warmes Gefühl; der Uhrenmarkt und steigende Einzelhandelspreise; Größe und Gewicht eines Menschen; usw. Daher kann es besser als Lernen verstanden werden - oder in der gebräuchlicheren Bezeichnung für die zur Erzeugung von KI verwendeten Methoden als maschinelles Lernen. Und ich finde, diese Formulierung trifft das Wesentliche besser. Es braucht keinen hoch entwickelten Organismus (oder eine Maschine), um Assoziationen herzustellen und zu lernen... es ist lediglich eine statistische Beziehung zwischen zwei Dingen.
Bleiben wir bei den Hunden... selbst völlig zufällige Reize können gepaart und miteinander assoziiert werden. Wir alle wissen (hoffentlich) aus der Schule über die klassische Konditionierung Bescheid, und Ivan Pavlov berichtete bereits 1897 über diese Form des statistischen Lernens. Foto mit freundlicher Genehmigung von Kommunikationstheorie.
2) Künstliche Intelligenz - Grundlagen
Wie also kann eine Maschine "lernen" und was braucht es, um Ihre persönliche Künstliche Intelligenz[2]? Ich behaupte, dass es auf drei Hauptbestandteile und Schritte hinausläuft:
- Trainingsdaten
- eine Variable zur Vorhersage
- ein Modell, das die beiden verbindet
Wenn man es so aufschlüsselt, sieht es nicht mehr nach Magie aus, oder? Aber lassen Sie uns ein bisschen deutlicher machen, was ich mit diesen drei Zutaten meine und ein Spiel spielen... Wie viel ist meine Uhr wert?
Wir haben auch etwas für Sie, wenn Sie nicht nur theoretisch an dieser Frage interessiert sind... "4 Tipps zur Bewertung Ihrer Vintage Uhr: Anleitung für Einsteiger" - Ein Video über die Heuristik von Felix Goldammer.
Erstens, die Vorhersage... sie kann sich auf alles Unbekannte beziehen, das Sie beschreiben möchten: welchen Zug Sie beim Schachspiel machen sollen, ob die Person vor Ihnen krank ist oder nicht, was die richtige Antwort auf Ihre Frage ist, ob dieses neue Uhrendesign ein Erfolg wird. Oder wie in unserem kleinen Beispiel hier: Wie viel ist meine Uhr wert? Wichtig ist hier nur, dass die semantische Frage, die Sie stellen, quantifizierbare Antworten haben kann (hier: Preis in Euro).
Zweitens: Um das Ergebnis vorherzusagen, benötigen Sie relevante Informationen. Wie viel eine Vintage Uhr zum Beispiel wert ist, hängt von ihrem Zustand, ihrer Seltenheit, den Komplikationen, dem Ruf der Marke usw. usw. ab. Wichtig ist, dass Sie nicht irgendeine Information nehmen können... zum Beispiel die Farbe des Armbands oder der Mädchenname der Mutter des Designers sollten hier nicht von Bedeutung sein.
Drittens, eine Verbindung zwischen den Eingabedaten und der Ausgabevorhersage. Dieser dritte Teil ist die statistische Operation, die wir klassischerweise als Maschinelles Lernen und damit der zentrale Aspekt der KI. Diese Verbindung (oder dieses Modell) muss anhand der Eingabedaten von - in unserem Beispiel - mehreren Uhren und ihren jeweiligen bekannten Preisen trainiert werden. Wir könnten also feststellen, dass - im Durchschnitt(!) - Uhren in besserem Zustand höher bewertet werden, bestimmte Marken en vogue sind und einen Aufschlag auf den Preis bedeuten, Komplikationen in der Regel auch etwas mehr kosten, usw. usw.
Wenn Sie Eric Wind von Wind Vintage was bei der Bewertung einer Uhr wichtig ist: "Zustand, Zustand, Zustand!". Foto mit freundlicher Genehmigung von Esquire.
Dies ist eine semantische Beschreibung einer maschinell erlernten, quantifizierbaren Interaktion zwischen Marktfaktoren auf den Preis von Uhren. Es ist eine sehr vereinfachte Beschreibung dessen, was zum Beispiel bei OpenAI und ChatGPT oder bildgebenden KIs vor sich geht, aber im Kern ist es das, was auch hier vor sich geht*. Aber zu diesen Anwendungen kommen wir gleich noch.
3) Künstliche Intelligenz - Verschiedene Modelle
Lassen Sie uns nun einen kurzen Blick auf den mittleren Teil werfen - das maschinelle Lernmodell und seine Annahmen. Es gibt zahlreiche Möglichkeiten, wie man aus einer Reihe von Informationen auf das Ergebnis schließen kann. Die einfachste ist zum Beispiel die monotone (manchmal lineare) Beziehung: Je besser der Zustand, desto höher der Preis einer Uhr:
Abbildung 1. (Spielzeug-)Beispielszenarien, bei denen maschinelles Lernen Algorithmen angewendet werden können. Die farbigen Punkte stellen einzelne Uhren dar, die gestrichelte Linie impliziert die Vorhersage des Algorithmus. Eine allmähliche Vorhersage des Preises auf der Grundlage des Zustands (links) und eine Grenze zur Vorhersage des Behaltens/Verkaufs einer Uhr auf der Grundlage der emotionalen Bindung und der Zeit, die jede Uhr am Handgelenk verbringt (rechts). Die dargestellten Daten sind fiktiv und dienen nur zur Veranschaulichung.
Die gestrichelte Linie in der Abbildung beschreibt die Modellvorhersage. Es könnte zum Beispiel eine lineare 1:1-Beziehung sein und Preis = Bedingung * eine Konstante. Vielleicht gibt es aber auch Effekte, die über die Linearität hinausgehen und unsere Beziehung ist eher exponentiell - wenn Sie die Bedingung am oberen Ende ein wenig erhöhen, steigt der Preis dramatisch an... Diese genaue Beziehung zwischen Preis und Bedingung ist das, was man in dem Prozess lernen kann... von einer Maschine**...
4) Künstliche Intelligenz - Moderne Algorithmen
All diese einfachen Methoden, die ich gerade vorgestellt habe, sind schon Jahrhunderte alt und bilden die Grundlage unserer modernen Erfahrung mit KI. Eines der ersten massenhaft angewandten maschinellen Lernverfahren stammt aus dem Ersten Weltkrieg... Charles Spearman führte die Faktorenanalyse ein, um große Mengen psychologischer Fragen und Aufgaben zu vereinfachen und definierte - interessanterweise - einen allgemeinen Parameter für Intelligenz[3]. Diese erste Quantifizierung der Intelligenz wurde dann verwendet, um britische Soldaten zu beurteilen und geeignete Offiziere in ihren Reihen jenseits des alten, aber immer noch vorherrschenden aristokratischen Systems zu finden.
Sie finden "Eine kurze Geschichte der künstlichen Intelligenz" über die wichtigsten Entwicklungen der letzten 70 Jahre von BootstrapLabs hier.
In den 1970er und 80er Jahren wurden Anwendungen eingeführt, die eine leichte Modifikation dieser Methoden verwenden - künstliche neuronale Netze***. Hier wird ein Eingabeobjekt mit all seinen Merkmalen gewichtet (Modell), um eine Reaktion vorherzusagen. Wir haben zum Beispiel eine Uhr, die mehrere Merkmale aufweist - Größe, Alter, Material, Zustand, Marke, etc. - die wir als Schicht zusammenfassen. Und durch die Gewichtung dieser Merkmale könnten wir (in einer optimierten Welt) den besten Verkaufspreis abschätzen. Es handelt sich also um eine Erweiterung der linearen Schätzung von oben.
Abbildung 2. Schematische Darstellung der Architektur eines künstlichen neuronalen Netzwerks mit einer Schicht. Die Architektur dient nur zur Veranschaulichung einer Intuition und die "Ebenennamen" am unteren Rand sind Gedächtnisstützen und keine Beschränkungen oder tatsächlichen Modellierungsergebnisse.
Diese sehr einfache "Architektur" kann die Eingabe (eine Uhr) mit der Ausgabe (ihrem Preis) in Beziehung setzen... Auch diese Beziehung wird über Tausende und Abertausende von Uhren mit bekannten Preisen gelernt, bevor sie angewendet werden kann, um den Preis einer Uhr vorherzusagen, die noch nicht in der Datenbank enthalten ist. Außerdem wird sie immer einen gewissen Fehler enthalten, d.h. unbekannte Parameter wie z.B. die Stimmung der Bieter bei einer Auktion.
Nun stellen Sie sich vor, dass Sie nicht nur eine Schicht haben, die Ihnen direkt eine Ausgabe liefert, sondern dass diese Schicht ihre Informationen in eine andere, "tiefere" Schicht einspeist. Die tiefere Schicht definiert Beziehungen zwischen den Merkmalen und eine weitere tiefere Schicht danach die Merkmale von Merkmalen und eine weitere Schicht danach und danach... jede fasst ihren Input durch Beziehungen von Merkmalen aus der vorherigen Schicht zusammen und abstrahiert ihn...
Abbildung 3. Schematische Darstellung der Architektur eines künstlichen neuronalen Netzwerks mit mehreren "versteckten" Schichten. Die Architektur dient nur zur Veranschaulichung einer Intuition und die "Ebenennamen" am unteren Rand sind Gedächtnisstützen und keine Beschränkungen oder tatsächlichen Modellierungsergebnisse.
Sie können jede Ebene und jede Abstraktion auch im Sinne einer Sprache betrachten (Große Sprachmodelle). Die erste Schicht beschreibt Buchstaben, die zweite Schicht die Beziehung zwischen Buchstaben, also "Silben". In der dritten Schicht geht es um die Beziehung zwischen Silben -> Wörtern, in der vierten Schicht um Wörter -> Phrasen oder Sätze und dann weiter zu Absätzen und abstrakter Bedeutung*4. Diese Abstraktionen - die auch vom Algorithmus gelernt werden können, ohne ihn einzuschränken - sind der große Vorteil dieser "Deep Neural Networks" gegenüber allem im Bereich der Künstlichen Intelligenz die es vorher gab.
Eine gute Analogie für die tiefe Schichtstruktur der künstlichen Intelligenz ist die Handlung des Christopher Nolan-Films "Inception" aus dem Jahr 2010. Jede Ebene weiter unten ist wie ein weiterer Traum in einem Traum... Mit jedem Traum wird es absurder und surrealer. Foto einer handgezeichneten Handlungsstruktur des Films von Christopher Nolan selbst.
Natürlich sind diese Bezeichnungen für die verschiedenen Ebenen rein schematisch. Wörter, Sätze und Absätze sind Entitäten, die wir aus unserer täglichen Erfahrung heraus begreifen können. Aber ein statistisches Modell wird eine sehr abstrakte Darstellung aufbauen, die nicht unserem beschränkten Verständnis folgt. Dennoch sind diese tiefen Abstraktionsschichten der Grund dafür, dass wir uns mit ChatGPT und ähnlichen Algorithmen unterhalten können[4]. Das bedeutet, dass der Algorithmus einen bestimmten Absatz, Satz oder eine Frage nicht vorher gesehen haben muss, um seine Bedeutung zu verstehen, weil er Meta-Beziehungen aus anderen Textausschnitten finden kann.
Wie Sie sich jedoch vorstellen können, benötigen Sie eine Menge Rechenleistung und Textdaten, damit der Algorithmus lernen und funktionieren kann. ChatGPT 3.5 (kostenlose Version) zum Beispiel wurde wochen- und monatelang auf Tausenden von GPUs mit geschriebenem Text, Büchern und Websites trainiert und hat schließlich das Feedback von Tausenden von menschlichen Nutzern integriert.
5) Künstliche Intelligenz - Schlussfolgerung zu ihrem Wesen
Ich vermute also, dass Sie jetzt alle erleichtert aufatmen, nachdem wir dieses recht intensive Kapitel der Methodik abgearbeitet haben. Ich hoffe jedoch, dass ich Ihnen vermitteln konnte, dass Künstliche Intelligenz und Maschinelles Lernen 1) nicht neu sind, 2) im Kern ein "einfaches" Vorhersagemodell darstellen und 3) kein magisches Werkzeug sind, das uns von den übermächtigen Robotern geschenkt wurde, um uns mit Buchzusammenfassungen und Steampunk-Bildern von unseren Haustieren abzulenken.
Ein KI-generiertes Bild (DeepAI) von "Mehrere Uhrenzüge, die mit Computerschaltungen arbeiten".
Vielmehr Künstliche Intelligenz mit den verborgenen und latenten Strukturen der Welt um uns herum arbeitet. Fast alles ist quantifizierbar und kann daher in statistischen Beziehungen beschrieben werden - wenn X, dann Y. Was wir derzeit erleben - der KI-Boom - ist eine Folge der leichteren Verfügbarkeit von Daten durch das Internet, der erhöhten Rechenleistung und schließlich der jahrzehntelangen Entwicklung cleverer und effizienter Algorithmen zur Datenanalyse. Nicht mehr und nicht weniger.
Im nächsten Teil möchte ich im Detail darauf eingehen, was moderne KI in unserer geliebten Welt der Uhren tun kann und was nicht. Um diese - größtenteils spekulative - Diskussion zu unterstützen, habe ich auch mit mehreren Experten auf dem Gebiet der Uhrmacherei gesprochen, die alle in der Vergangenheit einige Überschneidungen mit der Tech-Welt hatten. Das wird ein Spaß!
* Ich entschuldige mich nachdrücklich für die übermäßige Vereinfachung.
** Durch einen cleveren Analyseansatz, aber nicht gerade durch Intelligenz[1]
*** Es gibt einige empirische Unterschiede zwischen Kohlenstoff- und Siliziumgehirnen - aber darauf wollen wir nicht näher eingehen. ANNs könnte man (bestenfalls) als ein vereinfachtes Modell der biologischen Funktion bezeichnen.
*4 Sie können sich ähnliche Abstraktionsebenen auch im Sinne der visuellen/Bildverarbeitung vorstellen. Die erste Schicht sind helle/dunkle Kanten, die auf einen bestimmten Ort beschränkt sind, die nächste Schicht können Winkel sein, die nächste Schicht immer komplexere Formen, die überall in der Szene zu finden sind, und die letzte Schicht sind Objektidentitäten, die sogar unabhängig vom Präsentationswinkel sein können, usw.
Referenzen und empfohlene Lektüre
[1] [Empfehlung] On Intelligence; Jeff Hawkins & Sandra Blakeslee, St. Martins Griffin Publishing, New York;
[2] [Empfohlene SciFi] Foundation Trilogie (1942-53); Isaac Asimov, Gnome Press;
[3] The proof and measurement of association between two things (1904); Charles Spearman, Am. J. Psychol;
[4] [Empfehlung] Der menschlichste Mensch - Was uns die künstliche Intelligenz über das Leben lehrt; Brian Christian (2011), Anchor;
Alle Rechte an Text und Grafiken sind dem Autor vorbehalten.