Als AI Data Annotation Specialist arbeitest du an der Schnittstelle von Datenverarbeitung, Datenpipelines und Machine Learning. Deine Hauptaufgabe ist es, skalierbare Workflows für automatisierte Datenannotation zu entwickeln und zu betreiben, während du gleichzeitig sicherstellst, dass Datensätze valide, konsistent und optimal für das Training von Modellen aufbereitet sind.
Du spielst eine zentrale Rolle dabei, hochwertige AI-Systeme zu ermöglichen, indem du Rohdaten in strukturierte, zuverlässige Trainingsdaten überführst.
Design, Entwicklung und Wartung von Pipelines für automatisierte und teilautomatisierte Datenannotation
Integration und Verarbeitung von multimodalen Datenquellen in strukturierte Daten-Workflows
Einsatz von Pre-Labeling-Techniken mit bestehenden Modellen zur Beschleunigung von Annotationen
Sicherstellung von Qualität, Konsistenz und Vollständigkeit annotierter Datensätze
Identifikation und Behebung von Datenqualitätsproblemen, Inkonsistenzen und Biases
Transformation und Standardisierung von Datensätzen in modellfertige Formate
Enge Zusammenarbeit mit ML Engineers, um Datensätze für Training und Evaluation zu optimieren
Abgeschlossenes Studium in Informatik, Data Science, Ingenieurwesen oder einem verwandten Fachgebiet
Mindestens 3 Jahre Erfahrung im Bereich Machine Learning Operations, AI oder Software Engineering
Sehr gute Programmierkenntnisse in Python und C++
Fundiertes Verständnis von AI-/Machine-Learning-Grundlagen und Datenanforderungen
Erfahrung mit Datenannotationstools oder Labeling-Workflows
Vertrautheit mit der Strukturierung und Formatierung von Datensätzen für ML-Frameworks (z. B. Robotik- oder multimodale Datensätze)
Hohe Detailgenauigkeit und ein ausgeprägtes Qualitätsbewusstsein
Erfahrung mit Cloud-Plattformen (AWS, GCP, Azure) ist von Vorteil