Pipeline-Entwicklung: Du entwickelst und wartest automatisierte Data-Ingestion-Pipelines und stellst die zuverlässige Verarbeitung von Batch- und Streaming-Daten sicher.
️ Mitarbeit an der Plattform: Du unterstützt beim Ausbau moderner, hybrider Datenplattformen (z. B. auf Basis von Spark/Databricks oder vergleichbaren Technologien) und implementierst Features für moderne Datenarchitekturen (Lakehouse & DWH).
️ Data Quality: Du setzt Schema-Validierungen und Datenqualitätsprüfungen während des Ingestion-Prozesses um und unterstützt bei der Metadatenextraktion.
️ Governance-Support: Du arbeitest an der Umsetzung von Zugriffskontrollen und Datenversionierungen mit, um die Reproduzierbarkeit von Datensätzen zu gewährleisten.
Performance-Support: Du unterstützt bei der Optimierung von Datenverarbeitungsprozessen und hilfst dabei, unnötige Datenbewegungen im System zu minimieren.
Wachstum: In Zusammenarbeit mit unseren Seniors vertiefst Du Dein Wissen in verteilten Systemen, MLOps-Tooling und modernen Lakehouse-Designs.