We are seeking a talented Edge AI Engineer with specialized expertise in GPU/TPU acceleration to join our team. The ideal candidate will have extensive hands-on experience in local Large Language Models (LLM) inference with embedded GPU/TPU architectures. As Principal Engineer specializing in Edge AI, you will play a crucial role in shaping the future Edge AI solution, leveraging the power of GPU/TPU acceleration and enterprise grade, large scale edge compute. 

The successful candidate will combine technical excellence with effective leadership, creating a positive impact on both projects and team dynamics. 
Senior Embedded Engineer/Architect with AI for Edge
Miejsce pracy: Warszawa
Key Responsibilities: 
High-Level Design and Architecture 
  • Influence the Edge AI strategy by providing expert advice on design and architecture
  • Make critical decisions regarding technical directions, scalability, and system performance
  • Develop and optimize AI inference models for deployment on edge devices with embedded GPU/TPU accelerators, focusing on local Low Latency Model (LLM) inference
  • Implement and fine-tune low-latency model inference pipelines to meet real-time performance requirements
  • Collaborate with cross-functional teams to integrate AI inference solutions into edge computing platforms and applications
  • Collaborate with the GPU Hardware Design Team to design and optimize GPUs that power next-generation devices
  • Conduct performance profiling and optimization to maximize the efficiency of GPU/TPU acceleration for local LLM inference
  • Work on micro-architecture development, ensuring efficient execution of graphics, compute, and AI workloads within energy and area constraints
  • Stay current with advancements in GPU/TPU technologies and edge AI frameworks, incorporating them into solution designs as appropriate
  • Provide technical expertise and support to project teams, ensuring successful implementation and deployment of edge AI solutions
Team Leadership:  
  • Lead and inspire a team of engineers, providing guidance, setting goals, and ensuring collaboration
  • Oversee project planning, execution, and delivery, ensuring alignment with business objectives 
  • Manage all phases of technical projects, from conception to completion 
  • Develop project specifications, track progress, and control costs
  • Foster a positive work environment, encouraging professional growth and knowledge sharing
  • Bachelor’s degree in computer science, Engineering, or a related field; Master’s degree preferred
  • 5+ years of hands-on experience in AI model development and deployment, with a focus on edge computing and local LLM inference
  • Strong programming skills in languages such as Python and C++ 
  • Proficiency in LLM frameworks (e.g., vLLM, Text generation inference, OpenLLM, Ray Serve, and HuggingFace Transformers) and deep learning libraries
  • Extensive experience with GPU/TPU acceleration for AI inference, including optimization techniques (tensor, pipeline, data, sharded data parallelism) and performance tuning, 
  • Hands on experience with one or more GPU frameworks: CUDA, Vulkan, OpenCL  
  • Deep knowledge of GPU memory layout, familiarity with NVIDIA Jatison, ARM Mali or relevant SoC configurations 
  • Knowledge of parallel computation, memory scheduling, and structural optimization 
  • Excellent problem-solving and analytical skills, with a passion for innovation and continuous learning
Additional Skills (Preferred): 
  • Experience with edge device hardware and software integration
  • Familiarity with edge computing architectures and IoT platforms
  • Experience with edge AI applications in domains such as robotics, autonomous vehicles, or industrial automation
Informujemy, że administratorem danych jest R Systems Computaris Poland z siedzibą w Warszawie, ul. Jana Pawła II 80 (dalej jako "administrator"). Masz prawo do żądania dostępu do swoich danych osobowych, ich sprostowania, usunięcia lub ograniczenia przetwarzania, prawo do wniesienia sprzeciwu wobec przetwarzania, a także prawo do przenoszenia danych oraz wniesienia skargi do organu nadzorczego. Dane osobowe przetwarzane będą w celu realizacji procesu rekrutacji. Podanie danych w zakresie wynikającym z ustawy z dnia 26 czerwca 1974 r. Kodeks pracy jest obowiązkowe. W pozostałym zakresie podanie danych jest dobrowolne. Odmowa podania danych obowiązkowych może skutkować brakiem możliwości przeprowadzenia procesu rekrutacji. Administrator przetwarza dane obowiązkowe na podstawie ciążącego na nim obowiązku prawnego, zaś w zakresie danych dodatkowych podstawą przetwarzania jest zgoda. Dane osobowe będą przetwarzane do czasu zakończenia postępowania rekrutacyjnego i przez okres możliwości dochodzenia ewentualnych roszczeń, a w przypadku wyrażenia zgody na udział w przyszłych postępowaniach rekrutacyjnych - do czasu wycofania tej zgody. Zgoda na przetwarzanie danych osobowych może zostać wycofana w dowolnym momencie. Odbiorcą danych jest serwis Just Join IT oraz inne podmioty, którym powierzyliśmy przetwarzanie danych w związku z rekrutacją.