ML/AIWork

ML/AI Infrastructure Engineer

Beyond.pl Sp. z o.o. · Poznań, PL

Job description

Beyond.pl to pierwszy w Europie Środkowo-Wschodniej operator data center świadczący wysokowydajne, skalowalne usługi IT na potrzeby sztucznej inteligencji, przetwarzania w chmurze i obciążeń korporacyjnych. Dostarczamy usługi w oparciu o własne, zlokalizowane w UE, centra danych – nowoczesne, bezpieczne i energooszczędne Dostarczając wysokowydajne oraz zasilane energią odnawialną usługi kolokacji i mocy obliczeniowej, odważnie wspieramy wizjonerów jutra. Przekształcamy tradycyjne centra danych w Fabryki AI, aby pomagać w rozwoju innowacji – w sposób zrównoważony, bezpieczny, suwerenny i na dużą skalę. Dostarczamy ekosystem usług i rozwiązań wspierający rozwój projektów AI. Nasza wielopoziomowa oferta składa się z: AIaaS na bazie NVIDIA AI Enterprise, GPUaaS, usług kolokacji GPU i usług zarządzanych.

Rodzaj pracy: hybrydowa, zdalna

Miejsce pracy: Poznań

Zadania

  • Projektowanie, wdrażanie i optymalizacja systemów AI/ML opartych na GPU
  • Zarządzanie infrastrukturą dla ML/AI – serwery GPU, storage, sieci wysokiej przepustowości
  • Optymalizacja środowisk do trenowania modeli – dobór sprzętu, konfiguracja klastrów (np. Kubernetes, Slurm), tuning pod workloady AI.
  • Monitoring i troubleshooting – analiza wykorzystania zasobów, wykrywanie wąskich gardeł i problemów z dostępnością.
  • Integracja sprzętu i oprogramowania – testowanie i wdrażanie nowych technologii (np. nowa generacja akceleratorów, frameworki AI).

Nasze oczekiwania

  • Doświadczenie w architekturze HPC – doświadczenie w projektowaniu, implementacji oraz zarządzaniem klastrami HPC
  • Bardzo dobra znajomość systemów operacyjnych Linux oraz ich optymalizacja pod kątem HPC
  • Bardzo dobra znajomość Kubernetes
  • Znajomość systemów kolejkowania zadań np. Slurm
  • Doświadczenie w sieciach HPC – Infiniband
  • Znajomość systemów plików HPC – Ceph, Lustre
  • Optymalizacja aplikacji HPC – tuning wydajności, profiling, analiza wąskich gardeł
  • Znajomość Ansible, Terraform
  • Znajomość platformy run.ai – zarządzanie zasobami GPU
  • Umiejętność rozwiązywania problemów – analiza wydajności, debugowanie aplikacji HPC
  • Umiejętność pracy zespołowej – współpraca z inżynierami i administratorami
  • Dobre umiejętności komunikacyjne – dokumentowanie architektury, prezentacje dla zespołów technicznych
  • Samodzielność i inicjatywa – umiejetność prowadzenia projektów i proponowanie nowych rozwiązań
  • Chęć nauki nowych technologii – śledzenie trendów w HPC i adaptacja nowych rozwiązań

Oferujemy

  • Pracę w wymiarze pełnego etatu w dynamicznie rozwijającej się firmie w sektorze IT
  • Pracę hybrydową lub zdalną.
  • Atrakcyjne wynagrodzenie adekwatne do posiadanych umiejętności.
  • Rozwój zawodowy, w tym szkolenia i certyfikacje w obszarze AI
  • Wymianę wiedzy i poszerzenie jej o kolejne rozwiązania.
  • Samodzielność w działaniu i realny wpływ na strategię firmy.
  • Bogaty pakiet socjalny (w tym Multikafeteria i lekcje języka angielskiego).
  • Indywidualny fundusz szkoleniowy, prywatną opiekę medyczną i ubezpieczenie na życie.
  • Przyjazne środowisko pracy i niezbędne narzędzia.
  • Pracę z nowoczesnymi technologiami w centrach danych Beyond.pl

ML/AI Work links you to the employer's original posting — always verify the details there before applying.

More MLOps and Platform roles

View all →
ML/AI Infrastructure Engineer
Beyond.pl Sp. z o.o.
Apply →