Wir sind syte – ein PropTech-Unternehmen aus Münster, das eine KI-gestützte Software für die Entscheidungsgrundlage der Immobilienentwicklung entwickelt. Unsere Plattform ersetzt wochenlange Expertenkonsultationen durch sofortige, KI-gesteuerte Analysen: Projektentwickler, Bauträger, Banken und Investoren nutzen syte, um zu entscheiden, ob, was und wo gebaut, renoviert oder erworben werden soll.
Als Junior Data Engineer (m/w/d) arbeitest du an der durchgängigen Verarbeitung unserer Produktionsdaten – vom Laden und Extrahieren der Daten über die Verarbeitung mit anspruchsvollen Algorithmen bis hin zum Deployment. Du arbeitest eng mit dem Produktteam zusammen, um dessen Bedürfnisse zu ermitteln und die passendsten Daten in höchster Qualität bereitzustellen. Dein Fokus liegt darauf, den Prozess weiter zu automatisieren und seine Effizienz zu steigern. Wir verarbeiten täglich Hunderte von Terabyte an Daten – Skalierbarkeit und Effizienz sind entscheidend!
- Erweitere unser Datenuniversum: Du recherchierst und bewertest neue Datenquellen und verantwortest den gesamten Datentransformations-Prozess – vom ersten Download bis zur Transformation in produktionsreife Formate.
- Gewinne Erkenntnisse aus komplexen Daten: Du gehst über Standard-SQL hinaus und arbeitest mit reichhaltigen, mehrdimensionalen Datensätzen wie 3D-Gebäudemodellen und LiDAR-Punktwolken und machst aus roher Geometrie verwertbare Erkenntnisse.
- Baue Pipelines, die sich selbst betreiben: Du automatisierst durchgängige Datenflüsse mit Airflow, Dataform und Python, reduzierst manuelle Arbeit und erhöhst die Zuverlässigkeit der gesamten Plattform.
- Sichere die Datenqualität: Du überwachst Pipelines, identifizierst Fehler und implementierst weitere Datenprüfungen, um die Lieferung von Daten in höchstmöglicher Qualität zu gewährleisten.
- Skaliere effizient auf Google Cloud: Du entwirfst und optimierst Pipelines, die Hunderte von Terabyte verarbeiten, und behältst dabei die Infrastrukturkosten im Griff.
- Entwickle KI-nativ: Du nutzt das volle Potenzial moderner KI-Coding-Tools wie Claude Code und Copilot und identifizierst proaktiv neue KI-Anwendungsfälle im Kontext des Data Engineering.
