Machine Learning Engineer - Foundation Models

WeSort.AI GmbH · Würzburg

May 4, 2026

Job Summary

Join WeSort, a high-tech startup in Würzburg, as a Machine Learning Engineer specializing in Computer Vision and Foundation Models. You will be responsible for developing and training a 'Waste Foundation Model' using cutting-edge architectures. The role includes managing the ML training pipeline, building the evaluation suite, fine-tuning models for downstream tasks, and collaborating with the cloud-backend team for model deployment.

Key Responsibilities

Develop and train the 'Waste Foundation Model' based on modern architectures.
Manage the ML training pipeline and model versioning.
Build and maintain the evaluation suite for model performance measurement.
Fine-tune models for downstream tasks and edge hardware.
Analyze training runs systematically and develop sustainable solutions.

Who This Role Suits

Experience in Computer Vision and Machine Learning.
Proficiency in Python (PyTorch) and Rust for KI trainings and backend platform.
Ability to collaborate effectively with cross-functional teams.

Tips to Apply

Highlight your experience in developing Computer Vision models using modern architectures.
Demonstrate proficiency in Python (PyTorch) and Rust for KI trainings and backend development.
Emphasize your ability to work collaboratively with diverse teams.

Similar Roles You Might Like

PRODUCE/CLERK

Kroger

Software Engineer - Product (Technical Leadership)

Staff Pharmacist FT

CVS Health

Cashier

Kroger

Head of Optimization & Planning - USDS

TikTok

Full Job Description

WeSort ist ein Hightech-Start-up aus Würzburg, das KI-basierte Recyclinglösungen entwickelt und damit einen wichtigen Beitrag zur Kreislaufwirtschaft kritischer Rohstoffe (Critical Raw Materials) leistet. Unsere Systeme sind bereits im industriellen Einsatz, unter anderem bei Schwarz/Lidl bzw. deren Umweltdienstleister PreZero. Unsere Technologie wurde mehrfach ausgezeichnet, unter anderem mit dem Deutschen Gründerpreis (verliehen von Porsche und ZDF), und WeSort ist Teil des SprinD-Programms (Agentur für Sprunginnovationen). Darüber hinaus war unser Team mit seiner Arbeit bereits in Formaten wie Galileo, ZDF WISO, der WirtschaftsWoche und der Süddeutschen Zeitung vertreten.

Für den nächsten großen Schritt suchen wir einen talentierten Machine Learning Engineer (m/w/d) mit Schwerpunkt Computer Vision und Foundation Models, der/die mit uns ein eigenes „Waste Foundation Model" auf Basis modernster Architekturen wie DINOv2, SigLIP oder EVA-02 aufbaut – die technologische Grundlage, auf der alle unsere zukünftigen Computer-Vision-Anwendungen aufsetzen werden.

Wir betreiben heute eine der größten kontinuierlich wachsenden Datenbasen gelabelter Abfallbilder weltweit – aus realen Sortieranlagen, über mehrere Stoffströme, Lichtverhältnisse und Verschmutzungsgrade hinweg. Diese Daten sind unser strategischer Vorteil. Daraus wollen wir ein domänen-adaptiertes Vision Foundation Model entwickeln, das als Backbone für sämtliche Downstream-Tasks (Detection, Klassifikation, Anomalie-Erkennung, Few-Shot-Learning) dient.

KI-Trainings entwickeln wir in Python (PyTorch), unsere Backend-Plattform in Rust.

Bereich: Software, Data & Artificial Intelligence
Arbeitsort: Office-based in Würzburg
Vertragsart: Festanstellung in Vollzeit
Start: ab sofort

Aufgaben

Das ist deine neue Leidenschaft:

Du entwickelst und trainierst unser eigenes „Waste Foundation Model" – auf Basis von State-of-the-Art-Architekturen wie DINOv2, SigLIP oder EVA-02 – durch Continued Pretraining (Self-Supervised) auf unserer Abfallbild-Datenbasis
Du gestaltest unsere komplette ML-Trainings-Pipeline: von der Datenaufbereitung (WebDataset, FFCV) über verteiltes Training (PyTorch FSDP/DDP, Mixed Precision) bis zur Modell-Versionierung
Du baust und pflegst unsere Eval Suite – die zentrale Infrastruktur, die misst, ob unsere Foundation Models wirklich besser werden: Linear Probing, k-NN-Probing, Few-Shot-Detection, Cross-Domain-Generalization, Anomalie-Detection
Du finetunst und destillierst unsere Modelle für konkrete Downstream-Tasks und Edge-Hardware (Sortieranlagen, GPU-Inferenz)
Du analysierst Trainings-Runs systematisch, identifizierst Probleme wie Feature Collapse oder Domain Shift und entwickelst nachhaltige Lösungen statt kurzfristiger Workarounds
Du arbeitest eng mit dem Cloud-Backend-Team zusammen, um Modelle effizient ins Deployment zu bringen (ONNX, TensorRT, OpenVINO)
Du verfolgst aktiv die Forschungsentwicklung im Bereich Vision Foundation Models und übersetzt relevante Paper in produktive Lösungen
Du denkst über das Modell hinaus und hast im Blick, wie deine Arbeit im realen Betrieb wirkt – für Sortieranlagen, Kunden und das Gesamtsystem

Qualifikation

Damit begeisterst du uns:

Du bringst mehrjährige Erfahrung in der Entwicklung und im Training von Computer-Vision-Modellen mit, idealerweise mit Vision Transformers (ViT) und Self-Supervised-Learning-Methoden (DINO, MAE, iBOT, CLIP)
Du beherrschst PyTorch sicher – inklusive verteiltem Training (DDP, FSDP), gemischter Präzision (bf16/fp16) und Performance-Optimierung (torch.compile, Profiling)
Du verstehst nicht nur, wie man ein Modell trainiert, sondern auch wie man evaluiert. Du weißt, dass eine schwache Eval Suite jedes Pretraining wertlos macht
Du hast Erfahrung mit modernen ML-Tooling-Stacks: Hydra für Configs, Weights & Biases oder MLflow für Tracking, DVC für Daten-Versionierung, timm für Backbones
Du nutzt moderne KI-Tools (z.B. Claude, Copilot), um Routine-Coding zu beschleunigen und dich auf die wirklich harten Forschungs- und Architekturfragen zu konzentrieren
Du hast ein gutes Verständnis für Datenpipelines bei großen Datenmengen (Millionen Bilder): Tar-Sharding, GPU-Augmentations (DALI), I/O-Bottlenecks
Erfahrung mit Detection-/Segmentation-Frameworks (MMDetection, MMSegmentation) sowie Anomalie-Detection (anomalib) ist von Vorteil
Du kennst dich mit Inferenz-Optimierung und Modell-Distillation aus (z.B. ViT-L → ViT-S) und hast idealerweise schon Modelle auf Edge-Hardware deployed
Ausgeprägte Problemlösefähigkeit, analytisches Denken und wissenschaftliche Sorgfalt – du arbeitest hypothesengetrieben und nicht nach dem Try-and-Error-Prinzip
Sicherer Umgang mit Cloud-GPU-Infrastruktur (AWS, Azure, GCP oder On-Premise H100/A100-Cluster)
Fließende Deutsch- (mind. C1) sowie gute Englischkenntnisse werden vorausgesetzt
Idealerweise hast du eigene Forschungserfahrung (Paper, Open-Source-Beiträge, Konferenz-Talks) oder bist promoviert – kein Muss, aber ein Plus

Benefits

Darauf kannst du dich freuen:

Arbeit auf der „grünen Wiese" – Aufbau einer eigenen Foundation-Model-Strategie ohne Altlasten oder technische Schulden
Zugang zu einer einzigartigen, wachsenden Datenbasis aus realen Sortieranlagen – ein strategischer Vorteil, den keine Universität und kaum ein Wettbewerber hat
Einsatz aktueller Frameworks und eines top-modernen Tech-Stacks (PyTorch 2.x, FSDP, Hydra, W&B, DVC, timm)
Substanzielle Compute-Ressourcen für Pretraining-Runs – wir wissen, dass ernsthaftes Foundation-Model-Training kein Hobby-Projekt ist
Enge Zusammenarbeit mit Forschungspartnern (u.a. THWS Würzburg im Rahmen von Green-INNO) und die Möglichkeit, eigene Forschungsergebnisse zu publizieren
Arbeiten in einem dynamischen und interdisziplinären Start-Up-Team mit viel Verantwortung und Gestaltungsspielraum von Anfang an
Kurze Entscheidungswege und eine Kommunikation ohne Umwege
Technologie mit Sinn: Du arbeitest an den größten Hebeln unserer Zeit – KI, Recycling und Circular Economy

Haben wir dein Interesse geweckt? Dann freuen wir uns auf deine Bewerbung! Ein formelles Anschreiben ist nicht unbedingt notwendig, aber gib bitte deine Gehaltsvorstellung in Jahresbrutto an.

Find more English Speaking Jobs in Germany on Arbeitnow

Skills

python rust aws gcp azure backend ui machine learning ai IT berufserfahren

Frequently Asked Questions

This Machine Learning Engineer - Foundation Models position is suitable for Mid-level professionals. WeSort.AI GmbH is looking for candidates with proven experience in the key skills mentioned, typically 2-5+ years depending on the specific requirements.

This Machine Learning Engineer - Foundation Models position requires on-site or hybrid work. Check the job details for the specific location and flexibility options.

Key skills for this Machine Learning Engineer - Foundation Models position include: python, rust, aws. Having a strong foundation in these areas will make your application competitive. Experience with related tools and frameworks is also valuable.

To apply, click the 'Apply' button on this page, which will direct you to WeSort.AI GmbH's application portal. Have your resume, portfolio (if applicable), and a compelling cover letter ready.

Salary ranges vary based on experience and location. Check the job posting for specific compensation details, or research similar Machine Learning Engineer - Foundation Models positions in your area.

Highlight relevant experience with python, rust, aws. Include specific projects, achievements, and measurable results. Tailor your resume to match the job description, focusing on how your background aligns with WeSort.AI GmbH's needs.

Most hiring processes take 2-4 weeks from application to offer. This may include initial screening, technical assessments, interviews, and background checks. WeSort.AI GmbH will keep you informed throughout each stage.