Data & Knowledge Engineer

Mentopolis CSC GmbH
Niedernberg

Direkt bewerben

Details zur Stelle

Vollzeit
40.822,30 € – 75.567,18 € pro Jahr
vor 5 Tagen

Leistungen

Kostenloser Parkplatz
Homeoffice-Möglichkeit
Flexible Arbeitszeiten
Kostenlose Getränke

Qualifikationen

Englisch
SQL
Python
Deutsch
HTML

Vollständige Stellenbeschreibung

Stellenbeschreibung
Wir suchen eine/n engagierte/n Data & Knowledge Engineer (m/w/d) zur Verstärkung unseres Teams. In dieser Position sind Sie verantwortlich für die Entwicklung, Implementierung und Pflege innovativer Daten- und Wissensmanagementlösungen. Sie arbeiten an der Schnittstelle zwischen Datenarchitektur, Data Engineering und Wissensmanagement, um unsere Datenlandschaft effizient und zukunftssicher zu gestalten. Dabei tragen Sie maßgeblich dazu bei, komplexe Datenströme zu optimieren und wertvolle Erkenntnisse für unser Unternehmen zu generieren.

Aufgaben

Alle Formate: Du verarbeitest heterogene Quellformate – PDF (inkl. OCR), Office-Dokumente, HTML, Markdown, Bilder und strukturierte Datenquellen – und überführst sie in ein einheitliches Verarbeitungsformat.
Inhaltliche Kuratierung & Governance: Du sichtest und stimmst Quellen mit Fachkollegen ab, pflegst Glossar/Terminologie, klassifizierst Inhalte gemäß ISMS (ISO 27001) sowie DSGVO-Anforderungen und definierst Zugriffs- und Zuordnungsregeln je Wissensbasis.
Dokument-Zerlegung & Chunking: Du entwickelst und evaluierst Chunking-Strategien – kontexterhaltendes Zerlegen von Dokumenten mit korrekter Metadaten-Mitführung und retrieval-optimierter Segmentierung.
Embeddings & Vektor-DB: Du wählst und integrierst Embedding-Modelle, befüllst Vektordatenbanken (z. B. Chroma / Qdrant) und sorgst für konsistente, re-ingestierbare Datenbestände.
Agentenbasierte Aufbereitung: Wo manuelle Aufbereitung nicht skaliert, baust du agentenbasierte Workflows (Orchestrator + Subagenten) zur automatisierten Klassifikation, Extraktion, Segmentierung und qualitätsgeprüften KB-Einspeisung
Laufende KB-Pflege: Du sicherst Aktualität und Qualität durch regelmäßige Antwort-Checks, Lückenschließung und Nachvollziehbarkeitsdokumentation – nicht nur einmalige Befüllung.

Qualifikationen

3–4 Jahre Berufserfahrung im Data Engineering, ML Engineering oder einer vergleichbaren Rolle.
Sehr gute Python-Kenntnisse sowie Erfahrung im Bau von Daten-/ETL-Pipelines.
Praktisches Know-how mit LLMs und RAG: Embeddings, Vektordatenbanken, Chunking, Retrieval – idealerweise bereits in einem produktiven Setup.
Erfahrung im Parsing und der Aufbereitung heterogener Dokumentformate (PDF/OCR, Office, HTML).
Strukturierte, qualitätsbewusste Arbeitsweise und die Fähigkeit, Ergebnisse messbar zu machen.
Sehr gute Deutsch- & gute Englischkenntnisse in Wort & Schrift.

Wir freuen uns auf Ihre Bewerbung und darauf, gemeinsam innovative Lösungen für unsere Datenwelt zu entwickeln.

Gehalt: 40.822,30€ - 75.567,18€ pro Jahr

Leistungen:

Flexible Arbeitszeiten
Homeoffice-Möglichkeit
Kostenlose Getränke
Kostenloser Parkplatz

Sprache:

Deutsch (Erforderlich)
Englisch (Erforderlich)

Arbeitsort: Zum Teil im Homeoffice in 63843 Niedernberg

Direkt bewerben

Tools für Jobsuchende

Arbeitgebertools

Durchsuchen

Bleiben Sie in Kontakt