Michel Renfer

Teil 1: Die Grundlagen – ML, Generative AI und LLMs

Die Grundlagen: Machine Learning, Generative AI und Large Language Models

Artificial Intelligence ist in aller Munde. Doch der Begriff wird oft undifferenziert verwendet. Machine Learning, Generative AI, Large Language Models – alles läuft unter dem Label «AI», obwohl es sich um grundlegend verschiedene Konzepte handelt. Für IT-Entscheider ist diese Unterscheidung essenziell, denn sie bestimmt, welches Werkzeug für welches Problem das richtige ist. In diesem ersten Teil unserer fünfteiligen Serie ordnen wir die Begriffe ein und schaffen die Grundlage für die weiteren Themen: Agentic AI, RAG, MCP und den konkreten Einsatz bei dualstack.

 

Machine Learning: Das bewährte Fundament

Machine Learning (ML) ist keine neue Technologie. In der Netzwerk- und Security-Branche begegnet uns ML seit Jahren in zahlreichen etablierten Anwendungen: Anomalieerkennung in Monitoring-Systemen, Spam- und Malware-Erkennung, Predictive Maintenance, Traffic Classification und User Behavior Analytics. Das gemeinsame Prinzip: ML-Systeme arbeiten mit strukturierten Daten und klar definierten Aufgaben. Sie werden auf historischen Daten trainiert, erkennen Muster und treffen auf dieser Basis Vorhersagen oder Klassifikationen.

Ein ML-Modell, das für Anomalieerkennung trainiert wurde, kann genau das – und nichts anderes. Es generiert keine Texte, erstellt keine Zusammenfassungen und beantwortet keine freiformulierten Fragen. Diese Spezialisierung ist gleichzeitig Stärke und Limitation: ML-Systeme sind in ihrem definierten Anwendungsbereich hochpräzise, aber nicht flexibel einsetzbar.

 

Generative AI: Der Paradigmenwechsel

Generative AI ist eine Unterkategorie von Machine Learning, bringt jedoch einen fundamentalen Unterschied mit: Sie erzeugt neue Inhalte. Statt lediglich Daten zu klassifizieren oder Vorhersagen zu treffen, kann Generative AI Texte verfassen, Code schreiben, Bilder generieren und Zusammenfassungen erstellen. Der Durchbruch kam 2022 mit der Veröffentlichung von ChatGPT, das Generative AI einer breiten Öffentlichkeit zugänglich machte. Doch die Technologie geht weit über Chatbots hinaus. In Unternehmen ermöglicht sie grundlegend neue Arbeitsweisen: Statt Systeme über starre Schnittstellen zu bedienen, können Mitarbeitende in natürlicher Sprache beschreiben, was sie benötigen – und das System generiert eine passende Antwort. Für die Netzwerk- und Security-Branche bedeutet das beispielsweise die automatische Generierung von Konfigurationsdokumentation auf Basis bestehender Setups, die Zusammenfassung umfangreicher Log-Dateien in verständliche Incident-Reports oder die Übersetzung komplexer Firewall-Regelwerke in verständliche Beschreibungen.

 

Large Language Models: Das Herzstück

Large Language Models (LLMs) sind die Technologie, die Generative AI im Textbereich ermöglicht. Es handelt sich um neuronale Netzwerke mit Milliarden von Parametern, die auf enormen Mengen von Textdaten trainiert wurden. Die bekanntesten Vertreter sind GPT-4 von OpenAI, Claude von Anthropic, Gemini von Google sowie Llama von Meta als Open-Source-Alternative. Die Skalierung dieser Modelle ist beeindruckend: Während frühe Sprachmodelle mit Millionen von Parametern arbeiteten, operieren aktuelle LLMs mit hunderten von Milliarden. Diese Grössenordnung – kombiniert mit innovativen Trainingsverfahren – ermöglicht die Fähigkeiten, die LLMs so nützlich machen.

Wichtig ist dennoch, das Funktionsprinzip korrekt einzuordnen: Ein LLM besitzt kein «Wissen» im menschlichen Sinne. Es ist ein statistisches Sprachmodell, das vorhersagt, welches Wort in einem gegebenen Kontext am wahrscheinlichsten als Nächstes kommt. Diese Vorhersage basiert auf Mustern, die das Modell während des Trainings gelernt hat. Doch die Präzision dieser Vorhersage ist so hoch, dass die resultierenden Texte erstaunlich kohärent, fachlich fundiert und nützlich sind. LLMs können kontextuell antworten, zwischen Sprachen übersetzen, unstrukturierte Informationen in strukturierte Formate überführen und Code generieren oder analysieren.

 

Was setze ich wofür ein?

Für IT-Entscheider lässt sich die Unterscheidung auf eine einfache Formel bringen: ML eignet sich für Erkennung, Klassifikation und Vorhersage – etwa Anomalieerkennung, Threat Detection oder Capacity Planning. Generative AI und LLMs eignen sich für Erstellung, Zusammenfassung und Interaktion – etwa Dokumentation, Reporting, Wissensmanagement und die Interaktion mit komplexen Datenbeständen.

In der Praxis ergänzen sich beide Ansätze häufig. Ein ML-basiertes Monitoring-System erkennt eine Anomalie; ein LLM-basiertes System hilft anschliessend bei der Analyse, indem es relevante Dokumentation durchsucht und einen verständlichen Incident-Report generiert.

 

Grenzen kennen

Bei aller Leistungsfähigkeit ist es wichtig, die Grenzen aktueller LLMs zu kennen. Ein häufig diskutiertes Phänomen sind sogenannte «Halluzinationen»: Das Modell generiert Inhalte, die plausibel klingen, aber faktisch falsch sind. Für den Einsatz in der Netzwerk- und Security-Branche bedeutet das, dass LLM-Outputs stets als Unterstützung betrachtet werden sollten, nicht als alleinige Entscheidungsgrundlage. Auch der Datenschutz verdient Aufmerksamkeit: Welche Daten dürfen an externe Dienste übermittelt werden? Wo ist der Einsatz lokaler Modelle sinnvoller? Diese Fragen gehören in jede AI-Strategie.

 

In Teil 2 widmen wir uns dem Konzept der Agentic AI, die nicht nur antworten, sondern eigenständig handeln können.

Links
Weitere Infos