Abschlussarbeit (w/m/d): Extraktion von Text-Objekt-Relations in technischen Zeichnungen mit LLMs

Deutsches Zentrum für Luft- und Raumfahrt e. V. (DLR) -
Sankt Augustin

Jetzt bewerben

Details zur Stelle

Teilzeit

Leistungen

Weiterbildungsprogramme

Qualifikationen

TensorFlow
Informatik
PyTorch
Master
Machine Learning
OpenCV
PC-Kenntnisse
Elektrotechnik
Python

Vollständige Stellenbeschreibung

Kennziffer: 4254

Arbeitsort: Sankt Augustin

Eintrittsdatum: sofort

Karrierestufe: Studien- & Abschlussarbeit

Beschäftigungsgrad: Teilzeit

Dauer der Beschäftigung: befristet auf 6 Monate

Vergütung: Die Vergütung erfolgt gemäß der jeweils geltenden Tarifverträge des öffentlichen Dienstes (Bund).

Steige ein in die faszinierende Welt des Deutschen Zentrums für Luft- und Raumfahrt e. V. (DLR), um mit Forschung und Innovation die Zukunft mitzugestalten! Mit dem Know-how und der Neugier unserer rund 12.000 Mitarbeitenden aus 100 Nationen sowie unserer einzigartigen Infrastruktur bieten wir ein spannendes und inspirierendes Arbeitsumfeld. Gemeinsam entwickeln wir nachhaltige Technologien und tragen so zur Lösung globaler Herausforderungen bei. Möchtest du diese große Zukunftsaufgabe mit uns zusammen angehen? Dann ist dein Platz bei uns!

Das Institut für den Schutz terrestrischer Infrastrukturen hat die stabile Versorgung der Gesellschaft zum Ziel. Digitale Zwillinge ermöglichen die Überwachung und Reaktion auf Krisen und Angriffe sowie die Analyse und Optimierung der Resilienz terrestrischer Infrastrukturen.

Das erwartet dich

Eine Herausforderung bei der Erstellung digitaler Zwillinge ist die Umwandlung von technischen Dokumentationen, insbesondere von Rohrleitungs- und Instrumentierungsdiagrammen (P&IDs) und elektrischen Schaltplänen, in strukturierte, maschinenlesbare Daten. In dieser Arbeit sollen Methoden erforscht und evaluiert werden, die Textannotationen (Beschriftungen, Notizen, Teilenummern) nutzen, indem Sie Large Language Model (LLM)-Features mit Objektdetektoren kombinieren, die zur Vorhersage von Graphen verwendet werden.

Deine Aufgaben

Implementierung moderner OCR-Technologie für P&IDs und elektrische Zeichnungen und Aufbau eines Datensatzes (synthetisch + real) für Training und Evaluierung
Objekt) zu erstellen
Vergleich und Bewertung verschiedener Ansätze zur Kombination der Textfeatures mit der Symbolerkennung:
- regelbasierte Methoden, die Distanz, Ausrichtung und domänenspezifische Hinweise verwenden (z. B. „Text, der über einem Symbol platziert ist, beschreibt dieses in der Regel“)
- Extraktion von semantischen Features aus dem erkannten Text mit einem vortrainierten LLM und Kombinierung mit CNN-Features der Symbole
- Training eines Classifiers, der Text- und Objekt-features als Eingabe nimmt und eine binäre Ausgabe „related/nicht related“ vorhersagt

Das bringst du mit

laufendes Studium in Informatik, Mechatronik, Elektrotechnik oder einem verwandten Fachgebiet
Bereitschaft, sich in komplexe Themen einzuarbeiten
Grundkenntnisse im Bereich Machine Learning
gute Kenntnisse in der Programmierung mit Python
selbstständiges Arbeiten
gute Kommunikations- und Teamfähigkeiten

Gewünschte Qualifikation:

Erfahrung mit Computer Vision-Bibliotheken wie OpenCV, PyTorch oder TensorFlow
Grundkenntnisse von LLMs

Das bieten wir dir

Das DLR steht für Vielfalt, Wertschätzung und Gleichstellung aller Menschen. Wir fördern eigenverantwortliches Arbeiten und die individuelle Weiterentwicklung unserer Mitarbeitenden im persönlichen und beruflichen Umfeld. Dafür stehen dir unsere zahlreichen Fort- und Weiterbildungsmöglichkeiten zur Verfügung. Chancengerechtigkeit ist uns ein besonderes Anliegen, wir möchten daher insbesondere den Anteil von Frauen in der Wissenschaft und Führung erhöhen. Bewerbungen schwerbehinderter Menschen bevorzugen wir bei fachlicher Eignung.

Wir freuen uns darauf, dich kennenzulernen!

Fragen zu dieser Position ( Kennziffer 4254 ) beantwortet dir gerne:

Dr. Tobias Koch
Tel.: +49 2241 20148 55

Jetzt bewerben

Tools für Jobsuchende

Arbeitgebertools

Durchsuchen

Bleiben Sie in Kontakt