ML/AIWork

AI Platform / AIOps Engineer

SURF · Amsterdam, NL

Job description

Ben je klaar om de ruggengraat van de Nederlandse AI Factory te bouwen en te beheren, waar high-performance computing, cloud-native technologieën en AI samenkomen? Bij SURF speel je een sleutelrol bij het ontwerpen en opschalen van een AI-platform van de volgende generatie dat baanbrekend onderzoek en innovatie in heel Nederland mogelijk maakt. Klinkt het opzetten van de infrastructuur achter de Europese AI-ambities als een uitdaging die bij je past? Solliciteer dan nu.

Hier ga je werken

SURF is de ict-coöperatie van Nederlandse onderwijs- en onderzoeksinstellingen. Samen met hen werken we aan digitale diensten en complexe innovatievraagstukken om de kwaliteit van onderwijs en onderzoek te verhogen.

Werken bij SURF betekent deel uitmaken van een unieke en open organisatie. Dat merk je aan alles: de organisatiestructuur, de samenstelling van de projectteams, de cultuur op onze kantoren en de sfeer onder collega’s. SURF biedt uitstekende arbeidsvoorwaarden en hanteert een flexibele benadering van de balans tussen werk en privé. Medewerkers werken graag zelfstandig en iedereen krijgt de ruimte en vrijheid om zijn of haar talenten zo effectief en breed mogelijk in te zetten en te ontwikkelen.

In dit team kom je terecht

Je komt terecht in het AI Systems-team binnen de afdeling Advanced Solutions for Research. Je collega’s houden zich bezig met het trainen van taalmodellen zoals OpenEuroLLM en GPT-NL, en adviseren onderzoekers over het optimale gebruik van de Snellius-supercomputer voor AI-taken.

Je werkt met Python aan een snelgroeiend AI-platform. Het team kenmerkt zich door een open en samenwerkingsgerichte cultuur, met een sterke focus op kennisdeling en onderlinge ondersteuning.

Dit ga je doen

Als AI Platform / AIOps Engineer bij SURF bouw en beheer je de diensten en de orchestration-laag van de Dutch AI Factory. Je werkt aan de integratie van Slurm en Kubernetes, implementeert MLOps-tools en infrastructuur voor het aanbieden van modellen, en zorgt ervoor dat onderzoekers, bedrijven en overheidsorganisaties AI-workloads betrouwbaar en op schaal kunnen uitvoeren. Je werkt op het snijvlak van high-performance computing, cloud-native technologieën en AI-infrastructuur.

Je verantwoordelijkheden omvatten:

  • Het ontwerpen en implementeren van sandbox-omgevingen op gecontaineriseerde HPC/Kubernetes-infrastructuur

Het bouwen van de Slurm* Kubernetes-integratie, inclusief IAM, accounting/quotas, logging, monitoring en gebruikersinterfaces.

  • Het implementeren en beheren van MLOps- en runtime-services, zoals het bijhouden van experimenten, CI/CD-pijplijnen en model serving (Triton, vLLM, TensorRT-LLM, ONNX Runtime)
  • Het ontwikkelen van portabiliteitstools om workflows te verplaatsen tussen AI Factory-omgevingen, institutionele systemen en cloudplatforms
  • Implementeren van LLM/GPAI-sandboxes met veiligheidsfilters, logboekregistratie, rate limiting en monitoring
  • Implementeren van energiebewuste planning en duurzaamheidsdashboards
  • Ondersteunen van de EuroHPC-federatie en interoperabiliteit met andere AI Factories
  • Verstrekken van infrastructuur voor co-creatie en toegang (bijv. Jupyter, VS Code, projectruimtes)

Dit breng je mee

Je bent een ervaren engineer met een sterke technische basis en een duidelijke focus op schaalbare, toekomstbestendige oplossingen. Je brengt structuur in complexe situaties, communiceert helder en werkt zelfverzekerd in hoogwaardige, gedistribueerde infrastructuuromgevingen.

We zijn op zoek naar een nieuwe collega met:

  • BSc/MSc-niveau in informatica, software engineering of gelijkwaardig
  • Ruime ervaring met Kubernetes (operators, Helm, namespaces, RBAC, netwerken)
  • Ervaring met containertechnologieën (Docker/Podman, containerregisters, CI/CD)
  • Kennis van of ervaring met HPC-schedulers (Slurm) en Linux-systeembeheer
  • Ervaring met monitoring en observability (Prometheus, Grafana, ELK/Loki)
  • Een Infrastructure-as-Code-mentaliteit (Terraform, Ansible, SaltStack, GitOps)
  • Goede beheersing van Python en/of Go; Bash-scripting
  • Uitstekende beheersing van het Engels; Nederlands is een pluspunt

Sterke pluspunten

  • Ervaring met GPU-scheduling en NVIDIA-tools (CUDA, MIG, MPS, GPU Operator)
  • Kennis van model-serving frameworks (Triton, vLLM, TGI, Ray Serve)
  • Ervaring met MLOps-platforms (MLflow, Kubeflow, Weights & Biases)
  • Kennis van identiteitsfederatie (SRAM, eduGAIN, OIDC, LDAP)
  • Ervaring met high-performance opslag (parallelle bestandssystemen, S3/objectopslag)
  • Bijdragen aan open source

Aanvullende informatie

Kandidaten voor deze functie moeten reeds over een geldige werkvergunning voor Nederland beschikken.

Helaas kunnen wij voor deze functie geen visumsponsoring aanbieden.

Een antecedentenonderzoek kan deel uitmaken van het wervingsproces.

Bij SURF doen we onze werving met veel plezier zelf, acquisitie stellen we daarom niet op prijs.

Solliciteren bij SURF

Dit mag je verwachten

1

Solliciteren

Nadat je je sollicitatie hebt ingestuurd, ontvang je direct een bevestigingsmail.

2

Reactie

Na de sluitingsdatum ontvang je een reactie van ons recruitmentteam.

3

Eerste gesprek

We nodigen je uit op ons kantoor, want we willen je leren kennen.

4

Tweede gesprek

We nodigen je nogmaals uit voor een gesprek met anderen die jou ook willen leren kennen.

5

Assessment

Eventueel vragen we je om een opdracht (assessment) te doen.

6

Ben je de juiste persoon?

Dan ontvang je een salarisaanbod van één van onze HR-adviseurs.

7

Welkom bij SURF!

Je sluit aan bij onboardingactiviteiten met andere nieuwe collega’s.

Locatie Science Park, 140, 1098 XG, Amsterdam, Netherlands Opleidingsniveau WO Dienstverband Bepaalde tijd met intentie tot onbepaalde tijd Salaris €5450 - €7786 Uren per week 32-40 uur Deadline 24 juni 2026 Inhoudelijke vragen Damian Podareanu

damian.podareanu@surf.nl

+31647081947 Vragen over procedure SURF Recruitment

recruitment@surf.nl

+31 652534522

ML/AI Work links you to the employer's original posting — always verify the details there before applying.

More MLOps and Platform roles

View all →
AI Platform / AIOps Engineer
SURF
Apply →