Verantwortungsvoller KI-Einsatz an der USTP

Richtlinien, Datenklassifizierung, KI-Glossar

Foto: Shutterstock

Generative KI-Tools wie ChatGPT oder Copilot können im Arbeits- und Studienkontext hilfreich sein – etwa zur Ideengenerierung, Strukturierung von Inhalten oder zur Effizienzsteigerung.

Ihr Einsatz erfordert jedoch besondere Sorgfalt: Sensible oder personenbezogene Informationen sollten nicht eingegeben werden, da diese Tools keine Vertraulichkeit garantieren.

Für den verantwortungsvollen Umgang sind Informationssicherheit, Datenschutz, rechtliche Vorgaben, Urheberrecht und akademische Integrität zu beachten.

Der Datenklassifizierungsleitfaden der USTP – University of Applied Sciences St. Pölten – hilft dabei, Risiken zu beurteilen und geeignete Schutzmaßnahmen auszuwählen.

Direkt zum Thema springen:

Datenklassifizierung für KI-Tools – Leitfaden | KI-Glossar | Richtlinien für den Umgang mit generativen KI-Anwendungen (PDF)

Datenklassifizierung für KI-Tools – Leitfaden

Datenklassifizierung ist ein systematischer Ansatz zur Einstufung von Informationen nach ihrem Sensibilitätsgrad und potenziellen Risiken bei Offenlegung. Sie hilft dabei, den verantwortungsvollen Einsatz von KI-Tools gemäß den KI-Richtlinien der USTP und den Vorgaben des EU AI Acts sicherzustellen.

Die folgende Einteilung bietet Orientierung, welche Informationen für KI-gestützte Anwendungen geeignet sind – und welche nicht.

Überblick:

Level 1 – Hochsensible Informationen
Level 2 – Sensible Informationen
Level 3 – Sicherheitsrelevante Informationen
Level 4 – Nichtsensible Informationen

Level 1 – Hochsensible Informationen

Stärkste Einschränkungen | Höchste Sicherheitsanforderungen

Beispiele:

Gesundheitsdaten
Biometrische Merkmale
Finanzkennzahlen

Nicht erlaubt:

Biometrische Identifikation und Kategorisierung
Emotionserkennung (außer für medizinische oder Sicherheitszwecke)
Automatisiertes Sammeln biometrischer Daten aus dem Netz
Verarbeitung besonderer Kategorien personenbezogener Daten ohne Pseudonymisierung und klare Zweckbindung

Level 2 – Sensible Informationen

Vertraulich | Gesetzlich geschützt

Beispiele:

Mitarbeitenden- und Studierendendaten
Prüfungsleistungen, Bewerbungen
Unveröffentlichte Forschungsdaten

Nicht erlaubt:

Social Scoring durch KI
Manipulative Systeme oder solche, die Schwächen ausnutzen
Emotionserkennung in Bildungskontexten
Ausschließlich profilbasierte Risikobewertungen

Level 3 – Sicherheitsrelevante Informationen

Interne Nutzung | Potenzielle Sicherheitsauswirkungen

Beispiele:

Administrative und operative Daten
Infrastruktur- und Sicherheitsinformationen
Nicht veröffentlichte akademische Inhalte

Erforderlich:

Transparenz über KI-Nutzung
Einhaltung der DSGVO
Vermeidung manipulativer Anwendungen
Menschliche Kontrolle bei Risikobewertungen

Level 4 – Nicht-sensible Informationen

Öffentlich oder für Veröffentlichung bestimmt

Beispiele:

Allgemeine Geschäftsinformationen
Forschungs- und Lehrmaterialien, die veröffentlicht wurden
Öffentlich zugängliche Daten

Auch hier gilt:

Nutzer*innen müssen über KI-Nutzung informiert werden
Irreführende Anwendungen sind unzulässig
Datenschutzprinzipien wie Datenminimierung sind zu beachten
Der Einsatz von KI muss dokumentiert werden

KI-Glossar

Eine Übersicht zentraler Begriffe rund um das Thema Künstliche Intelligenz zur schnellen Orientierung ist hier zu finden:

Fachbegriff	Definition
Artificial Intelligence (AI)	Die Simulation menschlicher Intelligenz in Maschinen, die Aufgaben wie Lernen, Schlussfolgern und Problemlösung ausführen können
Artificial General Intelligence (AGI)	Ein theoretisches KI-System, das jede intellektuelle Aufgabe ausführen kann, die ein Mensch kann, mit Schlussfolgern, Lernen und Anpassungsfähigkeit
Artificial Narrow Intelligence (ANI)	Auch als schwache KI bekannt, ist sie darauf ausgelegt, eine einzige Aufgabe auszuführen (z. B. Spracherkennung, Empfehlungsalgorithmen)
Artificial Super Intelligence (ASI)	Eine hypothetische KI, die die menschliche Intelligenz in allen Aspekten übertrifft, einschließlich Kreativität und emotionaler Intelligenz
Algorithm	Eine Reihe von schrittweisen Anweisungen, denen ein Computer folgt, um eine bestimmte Aufgabe zu erfüllen
Bias	Systematische Fehler oder unfaire Präferenzen in KI-Ausgaben aufgrund voreingenommener Trainingsdaten oder fehlerhafter Algorithmen
Burstiness	Das unregelmäßige Auftreten von hochwertigen KI-generierten Inhalten gefolgt von weniger kohärenten Ausgaben
Business Value of AI	Die wirtschaftlichen und strategischen Vorteile von KI in verschiedenen Branchen, einschließlich Automatisierung und Effizienzsteigerungen
Chatbot	Eine Softwareanwendung, die menschliche Konversation durch Text- oder Sprachschnittstellen nachahmt
ChatGPT	Ein generativer Chatbot, entwickelt von OpenAI, der menschenähnlichen Text basierend auf Kontext generiert
Computer Vision	Ein Bereich der KI, der es Maschinen ermöglicht, visuelle Informationen aus der Welt zu interpretieren und zu verstehen
Conversational AI	KI-Systeme, die darauf ausgelegt sind, menschenähnliche Gespräche zu simulieren, wie Chatbots und virtuelle Assistenten
Data Augmentation	Techniken zur Erhöhung der Vielfalt von Trainingsdaten durch Modifikation vorhandener Datenproben
Data Mining	Der Prozess der Analyse großer Datensätze, um Muster, Beziehungen und nützliche Erkenntnisse zu finden.
Data Science	Das interdisziplinäre Feld, das Statistik, KI und Computing verwendet, um komplexe Daten zu analysieren und zu interpretieren
Deep Learning	Eine Teilmenge des maschinellen Lernens, die neuronale Netzwerke mit mehreren Schichten verwendet, um Muster in Daten zu erlernen
Embeddings	Darstellungen von Wörtern, Bildern oder anderen Daten als numerische Vektoren in KI-Modellen
Ethical AI	Die Untersuchung und Implementierung von KI-Systemen, die fair, unvoreingenommen und mit menschlichen Werten im Einklang sind
Explainability (XAI)	Die Fähigkeit eines KI-Systems, seinen Entscheidungsfindungsprozess auf eine Weise zu erklären, die Menschen verstehen können
Few Shot Learning	Eine maschinelle Lerntechnik, bei der ein Modell aus einer sehr kleinen Anzahl von beschrifteten Daten lernt
Fine-Tuning	Die Anpassung eines vortrainierten KI-Modells mit zusätzlichen Trainingsdaten, um es für eine bestimmte Aufgabe zu spezialisieren
Foundation Model	Ein großskaliges KI-Modell, das auf verschiedenen Datensätzen trainiert wurde und für verschiedene Aufgaben angepasst werden kann (z. B. GPT, BERT)
Generative AI	KI, die neue Inhalte erstellt, wie Text, Bilder, Musik und Code
Generative Adversarial Network (GAN)	Ein Typ von KI-Modell, bei dem zwei Netzwerke konkurrieren, um die Qualität der generierten Daten zu verbessern
Generative Pre-trained Transformer (GPT)	Ein Typ von KI-Modell, das Text vorhersagt, indem es Deep Learning und eine Transformer-Architektur verwendet
Hallucination	Wenn ein KI-Modell falsche, irreführende oder völlig fiktive Informationen generiert
Heat Map	Ein Visualisierungstool, das in der KI verwendet wird, um problematische Bereiche in einem Datensatz oder die Entscheidungsfindung eines Modells hervorzuheben
Hyperparameters	Einstellbare Einstellungen in einem KI-Modell, die das Lernen beeinflussen, wie Lernrate und Anzahl der Schichten
Inference	Der Prozess der Verwendung eines trainierten KI-Modells, um Vorhersagen für neue Daten zu treffen
Internet of Things (IoT)	Ein Netzwerk verbundener physischer Geräte, die Daten sammeln und austauschen
Knowledge Graph	Eine strukturierte Darstellung von Informationen, die Beziehungen zwischen verschiedenen Entitäten zeigt
Language Model (LM)	Ein KI-System, das darauf ausgelegt ist, menschliche Sprache zu verstehen, zu interpretieren und zu verarbeiten
Large Language Model (LLM)	Ein leistungsstarkes KI-Modell, das auf riesigen Textmengen trainiert wurde, um menschenähnlichen Text zu generieren (z. B. GPT-4)
Latent Space	Der abstrakte Raum, in dem KI-Modelle komplexe Datenrepräsentationen organisieren und verarbeiten
Machine Learning (ML)	Ein Zweig der KI, bei dem Algorithmen aus Daten lernen und die Leistung ohne explizite Programmierung verbessern
Model Drift	Das Phänomen, bei dem die Genauigkeit eines KI-Modells im Laufe der Zeit aufgrund sich ändernder Datenmuster abnimmt
Multimodal AI	KI, die mehrere Arten von Dateneingaben verarbeitet, wie Text, Bilder und Audio
Natural Language Processing (NLP)	KI, die es Computern ermöglicht, menschliche Sprache zu verstehen, zu interpretieren und zu generieren
Neural Network	Ein Computersystem, das dem menschlichen Gehirn nachempfunden ist und Informationen durch Schichten von Knoten verarbeitet
Neuro-Symbolic AI	Ein hybrider KI-Ansatz, der neuronale Netzwerke und symbolisches Schlussfolgern kombiniert
Output	Das von einem KI-System generierte Ergebnis, wie Text, Bilder oder Vorhersagen
Overfitting	Wenn ein KI-Modell Muster zu spezifisch für Trainingsdaten lernt und seine Fähigkeit zur Verallgemeinerung reduziert
Parameter	Variable in einem KI-Modell, die während des Trainings angepasst werden, um Vorhersagen zu verbessern
Perplexity	Eine Metrik zur Messung der Unsicherheit – geringere Perplexität zeigt bessere Modellleistung an
Positional Encoding	Eine Technik, die KI-Modellen hilft, die Wortreihenfolge in Textdaten zu verstehen
Predictive Analytics	Die Verwendung von KI und Statistik zur Vorhersage zukünftiger Ergebnisse basierend auf historischen Daten
Probabilistic AI	KI, die Wahrscheinlichkeiten in die Entscheidungsfindung einbezieht, um Unsicherheit zu handhaben
Prompt	Der Eingabetext, der einem KI-System gegeben wird, um eine Antwort zu generieren
Prompt Engineering	Die Praxis, effektive Prompts zu entwerfen, um KI-Modelle zu gewünschten Ausgaben zu führen
Quantum AI	Die Anwendung von Quantencomputing zur Verbesserung von KI-Algorithmen und Verarbeitungsfähigkeiten
Reinforcement Learning (RL)	Ein Typ von ML, bei dem KI durch das Erhalten von Belohnungen oder Strafen für durchgeführte Aktionen lernt
Self-Supervised Learning	Ein maschineller Lernansatz, bei dem KI ihre eigenen Labels aus Rohdaten generiert
Semi-Supervised Learning	Eine Mischung aus überwachtem und unüberwachtem Lernen, bei der KI sowohl aus beschrifteten als auch unbeschrifteten Daten lernt
Sentient AI	Eine hypothetische KI, die zu Bewusstsein, Emotionen und Selbstwahrnehmung fähig ist
Supervised Learning	Ein maschineller Lernansatz, bei dem KI aus beschrifteten Trainingsdaten lernt
Synthetic Data	Künstlich generierte Daten zur Schulung von KI-Modellen, wenn echte Daten knapp oder sensibel sind
Temperature (in AI)	Ein Parameter, der die Zufälligkeit in KI-generiertem Text steuert; höhere Werte führen zu kreativeren Antworten
Text Classification	Die Kategorisierung von Text in vordefinierte Labels (z. B. Spam-Erkennung, Sentimentanalyse)
Tokens	Die grundlegenden Einheiten (Wörter, Teilwörter oder Zeichen), die KI-Modelle in NLP-Aufgaben verarbeiten
Transfer Learning	Die Verwendung eines vortrainierten KI-Modells für eine neue, aber verwandte Aufgabe zur Effizienzsteigerung
Transformer Model	Eine KI-Modellarchitektur, die sich bei der Verarbeitung sequenzieller Daten wie Text auszeichnet (z. B. GPT, BERT)
Turing Test	Ein von Alan Turing vorgeschlagener Test zur Bestimmung, ob eine KI menschenähnliche Intelligenz zeigen kann
Underfitting	Wenn ein KI-Modell zu einfach ist, um bedeutungsvolle Muster aus Trainingsdaten zu lernen
Unsupervised Learning	Ein Typ von ML, bei dem KI Muster in Daten ohne beschriftete Beispiele findet
Zero-Shot Learning	Die Fähigkeit der KI, Aufgaben ohne vorherige Exposition gegenüber ähnlichen Beispielen auszuführen

Verantwortungsvoller KI-Einsatz an der USTP

Datenklassifizierung für KI-Tools – Leitfaden

Level 1 – Hochsensible Informationen

Level 2 – Sensible Informationen

Level 3 – Sicherheitsrelevante Informationen

Level 4 – Nicht-sensible Informationen

KI-Glossar

Mehr zum Thema KI an der USTP lesen

KI-Verantwortliche der USTP

Hol dir alle Infos zu deinem Wunschstudium

Previously known as: