Verantwortungsvoller KI-Einsatz an der USTP

Richtlinien, Datenklassifizierung, KI-Glossar

Foto: Shutterstock

Generative KI-Tools wie ChatGPT oder Copilot können im Arbeits- und Studienkontext hilfreich sein – etwa zur Ideengenerierung, Strukturierung von Inhalten oder zur Effizienzsteigerung.

Ihr Einsatz erfordert jedoch besondere Sorgfalt: Sensible oder personenbezogene Informationen sollten nicht eingegeben werden, da diese Tools keine Vertraulichkeit garantieren.

Für den verantwortungsvollen Umgang sind Informationssicherheit, Datenschutz, rechtliche Vorgaben, Urheberrecht und akademische Integrität zu beachten.

Der Datenklassifizierungsleitfaden der USTP – University of Applied Sciences St. Pölten – hilft dabei, Risiken zu beurteilen und geeignete Schutzmaßnahmen auszuwählen. 

Direkt zum Thema springen:

Datenklassifizierung für KI-Tools – Leitfaden | KI-GlossarRichtlinien für den Umgang mit generativen KI-Anwendungen (PDF)

Datenklassifizierung für KI-Tools – Leitfaden

Datenklassifizierung ist ein systematischer Ansatz zur Einstufung von Informationen nach ihrem Sensibilitätsgrad und potenziellen Risiken bei Offenlegung. Sie hilft dabei, den verantwortungsvollen Einsatz von KI-Tools gemäß den KI-Richtlinien der USTP und den Vorgaben des EU AI Acts sicherzustellen.

Die folgende Einteilung bietet Orientierung, welche Informationen für KI-gestützte Anwendungen geeignet sind – und welche nicht.

Überblick:

Level 1 – Hochsensible Informationen

Stärkste Einschränkungen | Höchste Sicherheitsanforderungen

Beispiele:

  • Gesundheitsdaten
  • Biometrische Merkmale
  • Finanzkennzahlen

Nicht erlaubt:

  • Biometrische Identifikation und Kategorisierung
  • Emotionserkennung (außer für medizinische oder Sicherheitszwecke)
  • Automatisiertes Sammeln biometrischer Daten aus dem Netz
  • Verarbeitung besonderer Kategorien personenbezogener Daten ohne Pseudonymisierung und klare Zweckbindung


Level 2 – Sensible Informationen

Vertraulich | Gesetzlich geschützt

Beispiele:

  • Mitarbeitenden- und Studierendendaten
  • Prüfungsleistungen, Bewerbungen
  • Unveröffentlichte Forschungsdaten

Nicht erlaubt:

  • Social Scoring durch KI
  • Manipulative Systeme oder solche, die Schwächen ausnutzen
  • Emotionserkennung in Bildungskontexten
  • Ausschließlich profilbasierte Risikobewertungen


Level 3 – Sicherheitsrelevante Informationen

Interne Nutzung | Potenzielle Sicherheitsauswirkungen

Beispiele:

  • Administrative und operative Daten
  • Infrastruktur- und Sicherheitsinformationen
  • Nicht veröffentlichte akademische Inhalte

Erforderlich:

  • Transparenz über KI-Nutzung
  • Einhaltung der DSGVO
  • Vermeidung manipulativer Anwendungen
  • Menschliche Kontrolle bei Risikobewertungen


Level 4 – Nicht-sensible Informationen

Öffentlich oder für Veröffentlichung bestimmt

Beispiele:

  • Allgemeine Geschäftsinformationen
  • Forschungs- und Lehrmaterialien, die veröffentlicht wurden
  • Öffentlich zugängliche Daten

Auch hier gilt:

  • Nutzer*innen müssen über KI-Nutzung informiert werden
  • Irreführende Anwendungen sind unzulässig
  • Datenschutzprinzipien wie Datenminimierung sind zu beachten
  • Der Einsatz von KI muss dokumentiert werden

KI-Glossar

Eine Übersicht zentraler Begriffe rund um das Thema Künstliche Intelligenz zur schnellen Orientierung ist hier zu finden:

Fachbegriff Definition
Artificial Intelligence (AI) Die Simulation menschlicher Intelligenz in Maschinen, die Aufgaben wie Lernen, Schlussfolgern und Problemlösung ausführen können
Artificial General Intelligence (AGI) Ein theoretisches KI-System, das jede intellektuelle Aufgabe ausführen kann, die ein Mensch kann, mit Schlussfolgern, Lernen und Anpassungsfähigkeit
Artificial Narrow Intelligence (ANI)

Auch als schwache KI bekannt, ist sie darauf ausgelegt, eine einzige Aufgabe auszuführen (z. B. Spracherkennung, Empfehlungsalgorithmen)

Artificial Super Intelligence (ASI) Eine hypothetische KI, die die menschliche Intelligenz in allen Aspekten übertrifft, einschließlich Kreativität und emotionaler Intelligenz
Algorithm Eine Reihe von schrittweisen Anweisungen, denen ein Computer folgt, um eine bestimmte Aufgabe zu erfüllen
Bias Systematische Fehler oder unfaire Präferenzen in KI-Ausgaben aufgrund voreingenommener Trainingsdaten oder fehlerhafter Algorithmen
Burstiness Das unregelmäßige Auftreten von hochwertigen KI-generierten Inhalten gefolgt von weniger kohärenten Ausgaben
Business Value of AI Die wirtschaftlichen und strategischen Vorteile von KI in verschiedenen Branchen, einschließlich Automatisierung und Effizienzsteigerungen
Chatbot Eine Softwareanwendung, die menschliche Konversation durch Text- oder Sprachschnittstellen nachahmt
ChatGPT Ein generativer Chatbot, entwickelt von OpenAI, der menschenähnlichen Text basierend auf Kontext generiert
Computer Vision Ein Bereich der KI, der es Maschinen ermöglicht, visuelle Informationen aus der Welt zu interpretieren und zu verstehen
Conversational AI KI-Systeme, die darauf ausgelegt sind, menschenähnliche Gespräche zu simulieren, wie Chatbots und virtuelle Assistenten
Data Augmentation Techniken zur Erhöhung der Vielfalt von Trainingsdaten durch Modifikation vorhandener Datenproben
Data Mining Der Prozess der Analyse großer Datensätze, um Muster, Beziehungen und nützliche Erkenntnisse zu finden.
Data Science Das interdisziplinäre Feld, das Statistik, KI und Computing verwendet, um komplexe Daten zu analysieren und zu interpretieren
Deep Learning Eine Teilmenge des maschinellen Lernens, die neuronale Netzwerke mit mehreren Schichten verwendet, um Muster in Daten zu erlernen
Embeddings Darstellungen von Wörtern, Bildern oder anderen Daten als numerische Vektoren in KI-Modellen
Ethical AI Die Untersuchung und Implementierung von KI-Systemen, die fair, unvoreingenommen und mit menschlichen Werten im Einklang sind
Explainability (XAI) Die Fähigkeit eines KI-Systems, seinen Entscheidungsfindungsprozess auf eine Weise zu erklären, die Menschen verstehen können
Few Shot Learning Eine maschinelle Lerntechnik, bei der ein Modell aus einer sehr kleinen Anzahl von beschrifteten Daten lernt
Fine-Tuning Die Anpassung eines vortrainierten KI-Modells mit zusätzlichen Trainingsdaten, um es für eine bestimmte Aufgabe zu spezialisieren
Foundation Model Ein großskaliges KI-Modell, das auf verschiedenen Datensätzen trainiert wurde und für verschiedene Aufgaben angepasst werden kann (z. B. GPT, BERT)
Generative AI KI, die neue Inhalte erstellt, wie Text, Bilder, Musik und Code
Generative Adversarial Network (GAN) Ein Typ von KI-Modell, bei dem zwei Netzwerke konkurrieren, um die Qualität der generierten Daten zu verbessern
Generative Pre-trained Transformer (GPT) Ein Typ von KI-Modell, das Text vorhersagt, indem es Deep Learning und eine Transformer-Architektur verwendet
Hallucination Wenn ein KI-Modell falsche, irreführende oder völlig fiktive Informationen generiert
Heat Map Ein Visualisierungstool, das in der KI verwendet wird, um problematische Bereiche in einem Datensatz oder die Entscheidungsfindung eines Modells hervorzuheben
Hyperparameters Einstellbare Einstellungen in einem KI-Modell, die das Lernen beeinflussen, wie Lernrate und Anzahl der Schichten
Inference Der Prozess der Verwendung eines trainierten KI-Modells, um Vorhersagen für neue Daten zu treffen
Internet of Things (IoT) Ein Netzwerk verbundener physischer Geräte, die Daten sammeln und austauschen
Knowledge Graph Eine strukturierte Darstellung von Informationen, die Beziehungen zwischen verschiedenen Entitäten zeigt
Language Model (LM) Ein KI-System, das darauf ausgelegt ist, menschliche Sprache zu verstehen, zu interpretieren und zu verarbeiten
Large Language Model (LLM) Ein leistungsstarkes KI-Modell, das auf riesigen Textmengen trainiert wurde, um menschenähnlichen Text zu generieren (z. B. GPT-4)
Latent Space Der abstrakte Raum, in dem KI-Modelle komplexe Datenrepräsentationen organisieren und verarbeiten
Machine Learning (ML) Ein Zweig der KI, bei dem Algorithmen aus Daten lernen und die Leistung ohne explizite Programmierung verbessern
Model Drift Das Phänomen, bei dem die Genauigkeit eines KI-Modells im Laufe der Zeit aufgrund sich ändernder Datenmuster abnimmt
Multimodal AI KI, die mehrere Arten von Dateneingaben verarbeitet, wie Text, Bilder und Audio
Natural Language Processing (NLP) KI, die es Computern ermöglicht, menschliche Sprache zu verstehen, zu interpretieren und zu generieren
Neural Network Ein Computersystem, das dem menschlichen Gehirn nachempfunden ist und Informationen durch Schichten von Knoten verarbeitet
Neuro-Symbolic AI Ein hybrider KI-Ansatz, der neuronale Netzwerke und symbolisches Schlussfolgern kombiniert
Output Das von einem KI-System generierte Ergebnis, wie Text, Bilder oder Vorhersagen
Overfitting Wenn ein KI-Modell Muster zu spezifisch für Trainingsdaten lernt und seine Fähigkeit zur Verallgemeinerung reduziert
Parameter Variable in einem KI-Modell, die während des Trainings angepasst werden, um Vorhersagen zu verbessern
Perplexity Eine Metrik zur Messung der Unsicherheit – geringere Perplexität zeigt bessere Modellleistung an
Positional Encoding Eine Technik, die KI-Modellen hilft, die Wortreihenfolge in Textdaten zu verstehen
Predictive Analytics Die Verwendung von KI und Statistik zur Vorhersage zukünftiger Ergebnisse basierend auf historischen Daten
Probabilistic AI KI, die Wahrscheinlichkeiten in die Entscheidungsfindung einbezieht, um Unsicherheit zu handhaben
Prompt Der Eingabetext, der einem KI-System gegeben wird, um eine Antwort zu generieren
Prompt Engineering Die Praxis, effektive Prompts zu entwerfen, um KI-Modelle zu gewünschten Ausgaben zu führen
Quantum AI Die Anwendung von Quantencomputing zur Verbesserung von KI-Algorithmen und Verarbeitungsfähigkeiten
Reinforcement Learning (RL) Ein Typ von ML, bei dem KI durch das Erhalten von Belohnungen oder Strafen für durchgeführte Aktionen lernt
Self-Supervised Learning Ein maschineller Lernansatz, bei dem KI ihre eigenen Labels aus Rohdaten generiert
Semi-Supervised Learning Eine Mischung aus überwachtem und unüberwachtem Lernen, bei der KI sowohl aus beschrifteten als auch unbeschrifteten Daten lernt
Sentient AI Eine hypothetische KI, die zu Bewusstsein, Emotionen und Selbstwahrnehmung fähig ist
Supervised Learning Ein maschineller Lernansatz, bei dem KI aus beschrifteten Trainingsdaten lernt
Synthetic Data Künstlich generierte Daten zur Schulung von KI-Modellen, wenn echte Daten knapp oder sensibel sind
Temperature (in AI) Ein Parameter, der die Zufälligkeit in KI-generiertem Text steuert; höhere Werte führen zu kreativeren Antworten
Text Classification Die Kategorisierung von Text in vordefinierte Labels (z. B. Spam-Erkennung, Sentimentanalyse)
Tokens Die grundlegenden Einheiten (Wörter, Teilwörter oder Zeichen), die KI-Modelle in NLP-Aufgaben verarbeiten
Transfer Learning Die Verwendung eines vortrainierten KI-Modells für eine neue, aber verwandte Aufgabe zur Effizienzsteigerung
Transformer Model Eine KI-Modellarchitektur, die sich bei der Verarbeitung sequenzieller Daten wie Text auszeichnet (z. B. GPT, BERT)
Turing Test Ein von Alan Turing vorgeschlagener Test zur Bestimmung, ob eine KI menschenähnliche Intelligenz zeigen kann
Underfitting Wenn ein KI-Modell zu einfach ist, um bedeutungsvolle Muster aus Trainingsdaten zu lernen
Unsupervised Learning Ein Typ von ML, bei dem KI Muster in Daten ohne beschriftete Beispiele findet
Zero-Shot Learning Die Fähigkeit der KI, Aufgaben ohne vorherige Exposition gegenüber ähnlichen Beispielen auszuführen

Mehr zum Thema KI an der USTP lesen

Du willst mehr wissen? Frag nach!

KI-Verantwortliche der USTP