Job Summary
Key Responsibilities
- Develop and train the 'Waste Foundation Model' based on modern architectures.
- Manage the ML training pipeline and model versioning.
- Build and maintain the evaluation suite for model performance measurement.
- Fine-tune models for downstream tasks and edge hardware.
- Analyze training runs systematically and develop sustainable solutions.
Who This Role Suits
- Experience in Computer Vision and Machine Learning.
- Proficiency in Python (PyTorch) and Rust for KI trainings and backend platform.
- Ability to collaborate effectively with cross-functional teams.
Tips to Apply
- Highlight your experience in developing Computer Vision models using modern architectures.
- Demonstrate proficiency in Python (PyTorch) and Rust for KI trainings and backend development.
- Emphasize your ability to work collaboratively with diverse teams.
Similar Roles You Might Like
Full Job Description
WeSort ist ein Hightech-Start-up aus Würzburg, das KI-basierte Recyclinglösungen entwickelt und damit einen wichtigen Beitrag zur Kreislaufwirtschaft kritischer Rohstoffe (Critical Raw Materials) leistet. Unsere Systeme sind bereits im industriellen Einsatz, unter anderem bei Schwarz/Lidl bzw. deren Umweltdienstleister PreZero. Unsere Technologie wurde mehrfach ausgezeichnet, unter anderem mit dem Deutschen Gründerpreis (verliehen von Porsche und ZDF), und WeSort ist Teil des SprinD-Programms (Agentur für Sprunginnovationen). Darüber hinaus war unser Team mit seiner Arbeit bereits in Formaten wie Galileo, ZDF WISO, der WirtschaftsWoche und der Süddeutschen Zeitung vertreten.
Für den nächsten großen Schritt suchen wir einen talentierten Machine Learning Engineer (m/w/d) mit Schwerpunkt Computer Vision und Foundation Models, der/die mit uns ein eigenes „Waste Foundation Model" auf Basis modernster Architekturen wie DINOv2, SigLIP oder EVA-02 aufbaut – die technologische Grundlage, auf der alle unsere zukünftigen Computer-Vision-Anwendungen aufsetzen werden.
Wir betreiben heute eine der größten kontinuierlich wachsenden Datenbasen gelabelter Abfallbilder weltweit – aus realen Sortieranlagen, über mehrere Stoffströme, Lichtverhältnisse und Verschmutzungsgrade hinweg. Diese Daten sind unser strategischer Vorteil. Daraus wollen wir ein domänen-adaptiertes Vision Foundation Model entwickeln, das als Backbone für sämtliche Downstream-Tasks (Detection, Klassifikation, Anomalie-Erkennung, Few-Shot-Learning) dient.
KI-Trainings entwickeln wir in Python (PyTorch), unsere Backend-Plattform in Rust.
Bereich: Software, Data & Artificial Intelligence
Arbeitsort: Office-based in Würzburg
Vertragsart: Festanstellung in Vollzeit
Start: ab sofort
Aufgaben
Das ist deine neue Leidenschaft:
- Du entwickelst und trainierst unser eigenes „Waste Foundation Model" – auf Basis von State-of-the-Art-Architekturen wie DINOv2, SigLIP oder EVA-02 – durch Continued Pretraining (Self-Supervised) auf unserer Abfallbild-Datenbasis
- Du gestaltest unsere komplette ML-Trainings-Pipeline: von der Datenaufbereitung (WebDataset, FFCV) über verteiltes Training (PyTorch FSDP/DDP, Mixed Precision) bis zur Modell-Versionierung
- Du baust und pflegst unsere Eval Suite – die zentrale Infrastruktur, die misst, ob unsere Foundation Models wirklich besser werden: Linear Probing, k-NN-Probing, Few-Shot-Detection, Cross-Domain-Generalization, Anomalie-Detection
- Du finetunst und destillierst unsere Modelle für konkrete Downstream-Tasks und Edge-Hardware (Sortieranlagen, GPU-Inferenz)
- Du analysierst Trainings-Runs systematisch, identifizierst Probleme wie Feature Collapse oder Domain Shift und entwickelst nachhaltige Lösungen statt kurzfristiger Workarounds
- Du arbeitest eng mit dem Cloud-Backend-Team zusammen, um Modelle effizient ins Deployment zu bringen (ONNX, TensorRT, OpenVINO)
- Du verfolgst aktiv die Forschungsentwicklung im Bereich Vision Foundation Models und übersetzt relevante Paper in produktive Lösungen
- Du denkst über das Modell hinaus und hast im Blick, wie deine Arbeit im realen Betrieb wirkt – für Sortieranlagen, Kunden und das Gesamtsystem
Qualifikation
Damit begeisterst du uns:
- Du bringst mehrjährige Erfahrung in der Entwicklung und im Training von Computer-Vision-Modellen mit, idealerweise mit Vision Transformers (ViT) und Self-Supervised-Learning-Methoden (DINO, MAE, iBOT, CLIP)
- Du beherrschst PyTorch sicher – inklusive verteiltem Training (DDP, FSDP), gemischter Präzision (bf16/fp16) und Performance-Optimierung (torch.compile, Profiling)
- Du verstehst nicht nur, wie man ein Modell trainiert, sondern auch wie man evaluiert. Du weißt, dass eine schwache Eval Suite jedes Pretraining wertlos macht
- Du hast Erfahrung mit modernen ML-Tooling-Stacks: Hydra für Configs, Weights & Biases oder MLflow für Tracking, DVC für Daten-Versionierung, timm für Backbones
- Du nutzt moderne KI-Tools (z.B. Claude, Copilot), um Routine-Coding zu beschleunigen und dich auf die wirklich harten Forschungs- und Architekturfragen zu konzentrieren
- Du hast ein gutes Verständnis für Datenpipelines bei großen Datenmengen (Millionen Bilder): Tar-Sharding, GPU-Augmentations (DALI), I/O-Bottlenecks
- Erfahrung mit Detection-/Segmentation-Frameworks (MMDetection, MMSegmentation) sowie Anomalie-Detection (anomalib) ist von Vorteil
- Du kennst dich mit Inferenz-Optimierung und Modell-Distillation aus (z.B. ViT-L → ViT-S) und hast idealerweise schon Modelle auf Edge-Hardware deployed
- Ausgeprägte Problemlösefähigkeit, analytisches Denken und wissenschaftliche Sorgfalt – du arbeitest hypothesengetrieben und nicht nach dem Try-and-Error-Prinzip
- Sicherer Umgang mit Cloud-GPU-Infrastruktur (AWS, Azure, GCP oder On-Premise H100/A100-Cluster)
- Fließende Deutsch- (mind. C1) sowie gute Englischkenntnisse werden vorausgesetzt
- Idealerweise hast du eigene Forschungserfahrung (Paper, Open-Source-Beiträge, Konferenz-Talks) oder bist promoviert – kein Muss, aber ein Plus
Benefits
Darauf kannst du dich freuen:
- Arbeit auf der „grünen Wiese" – Aufbau einer eigenen Foundation-Model-Strategie ohne Altlasten oder technische Schulden
- Zugang zu einer einzigartigen, wachsenden Datenbasis aus realen Sortieranlagen – ein strategischer Vorteil, den keine Universität und kaum ein Wettbewerber hat
- Einsatz aktueller Frameworks und eines top-modernen Tech-Stacks (PyTorch 2.x, FSDP, Hydra, W&B, DVC, timm)
- Substanzielle Compute-Ressourcen für Pretraining-Runs – wir wissen, dass ernsthaftes Foundation-Model-Training kein Hobby-Projekt ist
- Enge Zusammenarbeit mit Forschungspartnern (u.a. THWS Würzburg im Rahmen von Green-INNO) und die Möglichkeit, eigene Forschungsergebnisse zu publizieren
- Arbeiten in einem dynamischen und interdisziplinären Start-Up-Team mit viel Verantwortung und Gestaltungsspielraum von Anfang an
- Kurze Entscheidungswege und eine Kommunikation ohne Umwege
- Technologie mit Sinn: Du arbeitest an den größten Hebeln unserer Zeit – KI, Recycling und Circular Economy
Haben wir dein Interesse geweckt? Dann freuen wir uns auf deine Bewerbung! Ein formelles Anschreiben ist nicht unbedingt notwendig, aber gib bitte deine Gehaltsvorstellung in Jahresbrutto an.
Find more English Speaking Jobs in Germany on Arbeitnow
Skills
Frequently Asked Questions
Ready to Apply?
Click the button below to visit the job listing and submit your application on the employer's site.
Apply on arbeitnow.comPrepare for This Role
How to Write a Winning Cover Letter
Stand out with a compelling cover letter tailored to this role
Interview Preparation Guide
Master common questions and make a great impression
Salary Negotiation Guide
Learn how to negotiate your salary and benefits
Salary Research Guide
Understand market rates for this position
Similar Roles
Tech Lead
Zensurance
Senior Data Engineer
Valon Mortgage
SAP GTS Senior Consultant
Amer Sports
Senior NetSuite Developer - ERP Integration
yfood Labs GmbH
Senior Cloud Infrastructure Engineer - Leipzig (preferred) or Remote
eccenca GmbH
Senior Software Engineer Data & Cloud / Senior Data Engineer
ADEAL Systems GmbH
Product Manager - Berlin, Germany
Hygraph
Working Student Data & Analytics - Schwerpunkt Data Engineering (all genders)
clockin GmbH