Stellenbeschreibung
Wir suchen eine/n engagierte/n Data & Knowledge Engineer (m/w/d) zur Verstärkung unseres Teams. In dieser Position sind Sie verantwortlich für die Entwicklung, Implementierung und Pflege innovativer Daten- und Wissensmanagementlösungen. Sie arbeiten an der Schnittstelle zwischen Datenarchitektur, Data Engineering und Wissensmanagement, um unsere Datenlandschaft effizient und zukunftssicher zu gestalten. Dabei tragen Sie maßgeblich dazu bei, komplexe Datenströme zu optimieren und wertvolle Erkenntnisse für unser Unternehmen zu generieren.
Aufgaben
- Alle Formate: Du verarbeitest heterogene Quellformate – PDF (inkl. OCR), Office-Dokumente, HTML, Markdown, Bilder und strukturierte Datenquellen – und überführst sie in ein einheitliches Verarbeitungsformat.
- Inhaltliche Kuratierung & Governance: Du sichtest und stimmst Quellen mit Fachkollegen ab, pflegst Glossar/Terminologie, klassifizierst Inhalte gemäß ISMS (ISO 27001) sowie DSGVO-Anforderungen und definierst Zugriffs- und Zuordnungsregeln je Wissensbasis.
- Dokument-Zerlegung & Chunking: Du entwickelst und evaluierst Chunking-Strategien – kontexterhaltendes Zerlegen von Dokumenten mit korrekter Metadaten-Mitführung und retrieval-optimierter Segmentierung.
- Embeddings & Vektor-DB: Du wählst und integrierst Embedding-Modelle, befüllst Vektordatenbanken (z. B. Chroma / Qdrant) und sorgst für konsistente, re-ingestierbare Datenbestände.
- Agentenbasierte Aufbereitung: Wo manuelle Aufbereitung nicht skaliert, baust du agentenbasierte Workflows (Orchestrator + Subagenten) zur automatisierten Klassifikation, Extraktion, Segmentierung und qualitätsgeprüften KB-Einspeisung
- Laufende KB-Pflege: Du sicherst Aktualität und Qualität durch regelmäßige Antwort-Checks, Lückenschließung und Nachvollziehbarkeitsdokumentation – nicht nur einmalige Befüllung.
Qualifikationen
- 3–4 Jahre Berufserfahrung im Data Engineering, ML Engineering oder einer vergleichbaren Rolle.
- Sehr gute Python-Kenntnisse sowie Erfahrung im Bau von Daten-/ETL-Pipelines.
- Praktisches Know-how mit LLMs und RAG: Embeddings, Vektordatenbanken, Chunking, Retrieval – idealerweise bereits in einem produktiven Setup.
- Erfahrung im Parsing und der Aufbereitung heterogener Dokumentformate (PDF/OCR, Office, HTML).
- Strukturierte, qualitätsbewusste Arbeitsweise und die Fähigkeit, Ergebnisse messbar zu machen.
- Sehr gute Deutsch- & gute Englischkenntnisse in Wort & Schrift.
Wir freuen uns auf Ihre Bewerbung und darauf, gemeinsam innovative Lösungen für unsere Datenwelt zu entwickeln.
Gehalt: 40.822,30€ - 75.567,18€ pro Jahr
Leistungen:
- Flexible Arbeitszeiten
- Homeoffice-Möglichkeit
- Kostenlose Getränke
- Kostenloser Parkplatz
Sprache:
- Deutsch (Erforderlich)
- Englisch (Erforderlich)
Arbeitsort: Zum Teil im Homeoffice in 63843 Niedernberg