ML/AI Infrastructure Engineer
Beyond.pl Sp. z o.o. · Poznań, PL
Job description
Beyond.pl to pierwszy w Europie Środkowo-Wschodniej operator data center świadczący wysokowydajne, skalowalne usługi IT na potrzeby sztucznej inteligencji, przetwarzania w chmurze i obciążeń korporacyjnych. Dostarczamy usługi w oparciu o własne, zlokalizowane w UE, centra danych – nowoczesne, bezpieczne i energooszczędne Dostarczając wysokowydajne oraz zasilane energią odnawialną usługi kolokacji i mocy obliczeniowej, odważnie wspieramy wizjonerów jutra. Przekształcamy tradycyjne centra danych w Fabryki AI, aby pomagać w rozwoju innowacji – w sposób zrównoważony, bezpieczny, suwerenny i na dużą skalę. Dostarczamy ekosystem usług i rozwiązań wspierający rozwój projektów AI. Nasza wielopoziomowa oferta składa się z: AIaaS na bazie NVIDIA AI Enterprise, GPUaaS, usług kolokacji GPU i usług zarządzanych.
Rodzaj pracy: hybrydowa, zdalna
Miejsce pracy: Poznań
Zadania
- Projektowanie, wdrażanie i optymalizacja systemów AI/ML opartych na GPU
- Zarządzanie infrastrukturą dla ML/AI – serwery GPU, storage, sieci wysokiej przepustowości
- Optymalizacja środowisk do trenowania modeli – dobór sprzętu, konfiguracja klastrów (np. Kubernetes, Slurm), tuning pod workloady AI.
- Monitoring i troubleshooting – analiza wykorzystania zasobów, wykrywanie wąskich gardeł i problemów z dostępnością.
- Integracja sprzętu i oprogramowania – testowanie i wdrażanie nowych technologii (np. nowa generacja akceleratorów, frameworki AI).
Nasze oczekiwania
- Doświadczenie w architekturze HPC – doświadczenie w projektowaniu, implementacji oraz zarządzaniem klastrami HPC
- Bardzo dobra znajomość systemów operacyjnych Linux oraz ich optymalizacja pod kątem HPC
- Bardzo dobra znajomość Kubernetes
- Znajomość systemów kolejkowania zadań np. Slurm
- Doświadczenie w sieciach HPC – Infiniband
- Znajomość systemów plików HPC – Ceph, Lustre
- Optymalizacja aplikacji HPC – tuning wydajności, profiling, analiza wąskich gardeł
- Znajomość Ansible, Terraform
- Znajomość platformy run.ai – zarządzanie zasobami GPU
- Umiejętność rozwiązywania problemów – analiza wydajności, debugowanie aplikacji HPC
- Umiejętność pracy zespołowej – współpraca z inżynierami i administratorami
- Dobre umiejętności komunikacyjne – dokumentowanie architektury, prezentacje dla zespołów technicznych
- Samodzielność i inicjatywa – umiejetność prowadzenia projektów i proponowanie nowych rozwiązań
- Chęć nauki nowych technologii – śledzenie trendów w HPC i adaptacja nowych rozwiązań
Oferujemy
- Pracę w wymiarze pełnego etatu w dynamicznie rozwijającej się firmie w sektorze IT
- Pracę hybrydową lub zdalną.
- Atrakcyjne wynagrodzenie adekwatne do posiadanych umiejętności.
- Rozwój zawodowy, w tym szkolenia i certyfikacje w obszarze AI
- Wymianę wiedzy i poszerzenie jej o kolejne rozwiązania.
- Samodzielność w działaniu i realny wpływ na strategię firmy.
- Bogaty pakiet socjalny (w tym Multikafeteria i lekcje języka angielskiego).
- Indywidualny fundusz szkoleniowy, prywatną opiekę medyczną i ubezpieczenie na życie.
- Przyjazne środowisko pracy i niezbędne narzędzia.
- Pracę z nowoczesnymi technologiami w centrach danych Beyond.pl
ML/AI Work links you to the employer's original posting — always verify the details there before applying.
More MLOps and Platform roles
View all →MLOps Engineer
Coventry Building Society · Manchester, GB
Forward Deployed Engineer
Databricks · Southend-on-Sea, GB
Principal Network Engineer - AI Infrastructure
CVS Health · Remote · Baltimore
Principal Software Engineer (AI)
Future Secure AI · Brisbane, AU
Principal Software Engineer (AI)
Future Secure AI · Adelaide, AU
Principal Software Engineer (AI)
Future Secure AI · Canberra, AU