Was kann KI?

Es gibt keine künstliche Intelligenz! Was heute als KI verkauft wird ist wenig mehr als eine Mustererkennung, welche in ihrer generalisierten Form bereits an Grenzen des Machbaren gerät. Der korrekte Name wäre Large Language Model (LLM), wobei das erst einmal mehr mit Vektoren zu tun hat, als mit Sprache. Aktuelle, große Modelle stoßen heute an Grenzen, das noch mehr Parameter keine Verbesserung der erzielten Arbeitsergebnisse mehr zeitigen. Es hilft nicht immer mehr Trainingsdaten zu bemühen, es ist unumgänglich bessere Trainingsdaten an die Hand zu bekommen. Das soll aber hier nicht mein Thema sein.

Unterscheidungsmerkmale

Zu Begin ging es fast ausschließlich darum immer mehr Daten für das Training der Modelle zu nutzen. So sind heute die großen Modelle bereits über die 600 Milliarden Parameter hinaus. Allerdings werden die nicht im späteren Betrieb des Modells genutzt - da muss man die Anzahl der trainierten von den aktiven Parametern unterscheiden. Du kannst dir ja ausrechnen was es kosten würde über 600 mrd. 32bit Fließkommazahlen im Speicher teurer Beschleuniger zu halten und wie sinnvoll das wohl wäre. Es gibt schon bei der Bereitstellung zwei grundsätzliche Stellschrauben das Modell für den Betrieb kleiner zu gestallten:

  • die für das Endergebnis selten benötigten Parameter werden in Testläufen erkannt und deaktiviert
  • die Genauigkeit wird dem gewünschten Maß angepasst, indem kleinere Variablentypen genutzt werden (z.B. 8bit Ganzzahlen)

Für bessere Ergebnisse ist es sehr viel besser gleich die Trainingsdaten in den Themen einzuschränken und so spezialisierte LLMs zu trainieren wo generalisierte an Grenzen stoßen. Tumore erkennen oder Proteine falten zu können ist für einen Agenten der beim programmieren unterstützen soll wenig zielführend.

Auswahl

Um ein LLM gewinnbringend einzusetzen ist also zu vorderst wichtig das eigentliche Ziel zu definieren. Ein LLM wird dir die Arbeit nicht abnehmen, kann aber bei der richtigen Definition der Ziele und entsprechender Auswahl des LLMs auf unzählige Arten unterstützen. Es kann die eigene Perspektive erweitern oder beim Fokussieren auf einen Kernpunkt helfen, diametral entgegengesetzte Eigenschaften ausspielen. Ein Arbeitsauftrag oder Projekt hat üblicherweise viele Schritte die sich in ihrer Zielsetzung sehr stark unterscheiden können: Du musst nicht bei einem LLM bleiben. Jeder Schritt kann andere Anforderungen stellen, die ein anderes Modell vermutlich viel besser abdeckt. Es gibt kein bestes Modell! Bei einer ersten Recherche zu einem neuen Thema kann ein generalisiertes, großes Modell natürlich seine Stärken ausspielen. Ein kleines Modell mit einem angeschlossenen Suchmodul wird aber bei einem klar umrissenen Ziel nicht sehr weit zurückfallen, wenn denn deine Suchanfrage gut durchdacht ist.

Anforderungen

Schon bei der Auswahl eines LLMs kommt es oft nicht nur auf die gesteckten Ziele an. Welche Daten soll das LLM bearbeiten und unter welcher Jurisdiktion arbeitet es? Darfst du die zu bearbeitenden Daten überhaupt übergeben? Datenschutz und Datensicherheit müssen gleich zu begin mitgedacht werden. Wie viel Aufwand musst du betreiben Daten vorzubereiten um solchen Gesetzen nachzukommen und rechnet sich das überhaupt?

Vorheriger Beitrag