Senior Data Engineer – medical industry (f / m/x)
Warszawa, PolskaОсновні характеристики вакансії
Робота на місці - без віддаленого формату
Дані: SQL / BI / Python
Мін. 5 років досвіду
Рівень Senior
Приватне медичне страхування
Opis
Poszukujemy doświadczonego Senior Data Engineera, który dołączy do ważnego projektu dla klienta z branży medycznej. W tej roli będziesz projektować, budować i utrzymywać potoki danych i hurtownie danych klasy korporacyjnej w AWS, ze szczególnym uwzględnieniem Amazon Redshift. Będziesz ściśle współpracować z różnymi zespołami i innymi jednostkami biznesowymi w celu dostarczenia kompleksowego rozwiązania danych zgodnego z GxP. Jest to stanowisko hybrydowe, wymagające co najmniej dwóch dni w tygodniu w biurze. Projektowanie i utrzymywanie pipeline'ów ETL/ELT przy użyciu SQL, Python i PySpark dla Redshift i Data Lake. Optymalizacja pipeline'ów SQL i zapewnienie wysokiej wydajności operacji klastrowych Opracowywanie bezpiecznych zbiorów danych i tabel gotowych do użycia w BI na potrzeby raportowania i analiz. Wdrażanie zautomatyzowanego monitorowania, rejestrowania i ostrzegania w celu zapewnienia integralności danych Przekładanie wymagań biznesowych na skalowalne dane i rozwiązania BI Zapewnienie zgodności ze standardami GxP i tworzenie dokumentacji walidacyjnej Co najmniej 5 lat doświadczenia w rozwoju ETL/ELT i inżynierii danych Duże doświadczenie w usługach AWS (S3, Glue, Lambda, IAM) i Amazon Redshift Biegłość w SQL, Python, PySpark i modelowaniu danych (gwiazda, płatek śniegu, wymiarowość) Praktyczne doświadczenie z GitHub, interfejsami API i dostrajaniem wydajności Znajomość środowisk podlegających regulacjom GxP i metodyk zwinnych Doskonałe umiejętności komunikacyjne w języku angielskim, zarówno w mowie, jak i piśmie Great Place to Work Stabilna sytuacja finansowa Kontrakty z globalnymi markami Centrum szkoleń wewnętrznych Wielu ekspertów, od których możesz się uczyć Otwarty i dostępny zarząd Profit sharing Program Sponsoringu Pasji Cykliczne imprezy i wyjazdy integracyjne Komfortowe i dobrze wyposażone biura Aplikacja MySii Opieka medyczna
Benefity
Great Place to Work
Stabilna sytuacja finansowa
Kontrakty z globalnymi markami
Centrum szkoleń wewnętrznych
Wielu ekspertów, od których możesz się uczyć
Otwarty i dostępny zarząd
Profit sharing
Program Sponsoringu Pasji
Cykliczne imprezy i wyjazdy integracyjne
Komfortowe i dobrze wyposażone biura
Aplikacja MySii
Opieka medyczna
Wymagania
Co najmniej 5 lat doświadczenia w rozwoju ETL/ELT i inżynierii danych
Duże doświadczenie w usługach AWS (S3, Glue, Lambda, IAM) i Amazon Redshift
Biegłość w SQL, Python, PySpark i modelowaniu danych (gwiazda, płatek śniegu, wymiarowość)
Praktyczne doświadczenie z GitHub, interfejsami API i dostrajaniem wydajności
Znajomość środowisk podlegających regulacjom GxP i metodyk zwinnych
Doskonałe umiejętności komunikacyjne w języku angielskim, zarówno w mowie, jak i piśmie
Zakres obowiązków
Projektowanie i utrzymywanie pipeline'ów ETL/ELT przy użyciu SQL, Python i PySpark dla Redshift i Data Lake.
Optymalizacja pipeline'ów SQL i zapewnienie wysokiej wydajności operacji klastrowych
Opracowywanie bezpiecznych zbiorów danych i tabel gotowych do użycia w BI na potrzeby raportowania i analiz.
Wdrażanie zautomatyzowanego monitorowania, rejestrowania i ostrzegania w celu zapewnienia integralności danych
Przekładanie wymagań biznesowych na skalowalne dane i rozwiązania BI
Zapewnienie zgodności ze standardami GxP i tworzenie dokumentacji walidacyjnej