Inżynier Danych
Stanowisko: Data Engineer
Lokalizacja: Całkowicie zdalnie
Wynagrodzenie: 36 000 USD - 60 000 USD
Przegląd roli
Ta pozycja wymaga szczegółowo skupionego inżyniera danych, który potrafi samodzielnie projektować i wdrażać pipeline'y danych, a także pełnić rolę zaufanego partnera technicznego w kontaktach z klientami i podczas spotkań z interesariuszami. Będziesz pracować bezpośrednio z PySpark, Airflow, Pythonem i SQL, kierując całością migracji danych i modernizacji platform w Azure i AWS. Oprócz działań technicznych, będziesz uczestniczyć w planowaniu sprintów, priorytetyzacji backlogu oraz ciągłej integracji i wdrażaniu infrastruktury danych. To rola na poziomie starszego specjalisty, z bezpośrednią widocznością w działach inżynierii, produktu i realizacji dla klienta.
Kluczowe obowiązki
- Projektowanie i rozwijanie pipeline'ów danych na poziomie przedsiębiorstwa oraz architektur migracji danych w chmurze.
- Budowa skalowalnych, łatwych w utrzymaniu pipeline'ów ETL/ELT z użyciem Apache Airflow, PySpark i nowoczesnych usług danych.
- Pisanie wydajnego, modularnego i dobrze przetestowanego kodu Python, opartego na zasadach czystej architektury i wydajności.
- Tworzenie i optymalizacja złożonych zapytań SQL na różnych relacyjnych i analitycznych bazach danych.
- Wkład w standardy modelowania danych, zarządzania danymi i wydajności pipeline'ów.
- Odpowiedzialność za wdrożenie pipeline'ów CI/CD, umożliwiających niezawodne wdrażanie przepływów danych i infrastruktury (np. GitHub Actions, Azure DevOps, Jenkins).
- Włączenie testów jednostkowych, testów integracyjnych i monitorowania na wszystkich etapach cyklu życia pipeline'u danych.
- Aktywny udział w ceremoniach Agile: planowanie sprintów, codzienne stand-upy, retrospektywy i grooming backlogu.
- Bezpośrednia współpraca z klientami, interesariuszami i zespołami interdyscyplinarnymi w celu przekładania potrzeb biznesowych na skalowalne rozwiązania techniczne.
- Pełnienie roli autorytetu technicznego w zespole — kierowanie decyzjami architektonicznymi i wkład w najlepsze praktyki oraz dokumentację wewnętrzną.
Wymagane kwalifikacje
- Ponad 4 lata praktycznego doświadczenia w inżynierii danych, z udokumentowanymi sukcesami w dostarczaniu złożonych rozwiązań danych w środowiskach produkcyjnych.
- Zaawansowane umiejętności programowania w Pythonie, w tym głęboka znajomość OOP, optymalizacji wydajności i strategii testowania.
- Zaawansowane umiejętności SQL: złożone joiny, CTE, funkcje okienkowe, indeksowanie i optymalizacja zapytań.
- Silne doświadczenie z Apache Airflow, PySpark i rozproszonym przetwarzaniem danych.
- Znajomość architektury i wdrażania rozwiązań danych na platformach Microsoft Azure, Amazon Web Services (AWS) lub obu.
- Udokumentowane doświadczenie w CI/CD dla pipeline'ów danych i infrastruktury (IaC i wdrożenia workflow).
- Praktyczna znajomość frameworków Agile (Scrum, Kanban) i narzędzi do współpracy (Jira, Confluence, Git itp.).
- Komfortowa komunikacja bezpośrednio z klientami, właścicielami produktów i interesariuszami nietechnicznymi.
- Doświadczenie w branżach regulowanych, takich jak opieka zdrowotna czy usługi finansowe, ze znajomością najlepszych praktyk w zakresie prywatności i zgodności (HIPAA, SOC 2 itp.).
Preferowane kwalifikacje
- Zaznajomienie z Snowflake, Databricks lub innymi nowoczesnymi platformami hurtowni danych.
- Doświadczenie z pipeline'ami MLOps i narzędziami takimi jak MLflow, PyTorch oraz wdrożeniami modeli ML w chmurze.
- Znajomość platform ETL takich jak Apache NiFi, Talend czy Informatica.
- Znajomość DBT (Data Build Tool) do modularnych transformacji SQL.
- Silne umiejętności komunikacyjne z udokumentowaną zdolnością do mentoringu, wsparcia dzielenia się wiedzą i dokumentowania decyzji inżynierskich.
- Doświadczenie w wizualizacji danych i wspieraniu zespołów analitycznych poprzez dobrze zorganizowane data mart lub API.
Jeśli jesteś zainteresowany, dołącz zaktualizowane CV.
-
30 dni10 904 PLN
1 2 3 30 dni10 904 PLNWitam! Zapoznałem się z Twoim opisem, rozumiem, że potrzebujesz Data Engineer, który pewnie pracuje z PySpark, Airflow, Python, SQL, chmurami Azure i AWS, buduje ETL/ELT pipeline'y, wdraża CI/CD i bierze udział w planowaniu w ramach Agile. Zgodnie z Twoim TZS, cały potrzebny stos i podejścia są mi dobrze znane, mam doświadczenie w rzeczywistej realizacji skomplikowanych pipeline'ów i współpracy z klientami, dlatego jestem gotów dołączyć bez długiego wprowadzania do procesu. Również zawsze jestem otwarty na rozmowy telefoniczne!
-
30 dni10 904 PLN
280 30 dni10 904 PLNWitaj, Tony.
Dziękuję za opis.
Ta okazja wydaje się być stworzona dla mnie i naprawdę mnie to ekscytuje.
Jestem starszym programistą z ponad 9-letnim doświadczeniem w tworzeniu i zarządzaniu systemami danych, korzystając z Pythona, SQL i pipeline'ów CI/CD.
Pracowałem dużo z Apache Airflow i PySpark, aby przenosić i przetwarzać dane w chmurze, i wiem, jak sprawić, by wszystko działało szybko i było niezawodne.
Piszę czysty, łatwy do utrzymania kod Pythona i mam silne umiejętności w pisaniu i optymalizacji złożonych zapytań SQL.
Ustanowiłem zautomatyzowane przepływy pracy za pomocą GitHub Actions i Azure DevOps, i czuję się komfortowo pracując zarówno na AWS, jak i Azure.
Jestem przyzwyczajony do bezpośredniej współpracy z klientami i zespołami, aby zrozumieć ich potrzeby i zamienić je w działające rozwiązania.
Jeśli szukasz kogoś, kto może wziąć pełną odpowiedzialność za Twoje pipeline'y danych i zrobić wszystko poprawnie, jestem gotowy do działania.
… Nie mogę się doczekać, aby z Tobą współpracować.
Stwórzmy razem coś nowego i wielkiego, co może odmienić nasze życie.
Jeszcze raz dziękuję
Stanislav
-
3 dni10 940 PLN
738 9 1 3 dni10 940 PLNWitam! Zapoznałem się z projektem i jestem gotowy do pracy. Jestem pewien, że będziesz zadowolony z efektu.
Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe
Automatyzacja procesów przez API i PythonaPoniżej opisałem aktualny proces i to, do jakiego wyniku chciałbym dojść. Dołączam również pliki rzeczywistego procesu, aby lepiej zrozumieć, jak on wygląda w rzeczywistości Aktualny proces Obecnie cały proces wykonywany jest ręcznie: ładowanie/wyładowanie plików,… AI i uczenie maszynowe, Python ∙ 3 godziny 20 minut temu ∙ 29 ofert |
Znalezienie i wdrożenie najlepszych projektów dla 4 maszyn Mac Mini M4
834 PLN
Znajdowanie i wdrażanie najlepszych projektów dla 4 maszyn Mac Mini M4Witam,Szukam doświadczonego technicznego freelancera, który rozumie sprzęt Mac Mini M4, DePIN, węzły blockchain, wnioskowanie AI, systemy automatyzacji, Docker i monitorowanie serwerów.Obecnie posiadam 4… AI i uczenie maszynowe, Kryptowaluty i blockchain ∙ 14 godzin 37 minut temu ∙ 7 ofert |
Opracowanie konsultanta AI dla strony internetowej do weryfikacji wiz pracowniczych (WordPress)Opracowanie AI-konsultanta dla strony internetowej do sprawdzania wiz pracowniczych (WordPress) O projekcie Tworzona jest anglojęzyczna strona internetowa do wstępnej weryfikacji możliwości uzyskania wizy pracowniczej do Izraela. Potrzebny jest AI-konsultant w formacie czatu… AI i uczenie maszynowe, Tworzenie chatbota ∙ 21 godzin 58 minut temu ∙ 31 ofert |
II agenci i aplikacje
2213 PLN
Szukam osoby, która już pracuje z agentami AI, które stworzyła, która wie, jak zapewnić bezpieczeństwo, uruchomić serwer, stworzyć aplikacje AI - osoby, która już ma praktyczne doświadczenie z AI na "TY". Po co szukam? Żeby mnie nauczyła, jak to robić, bo chcę dodać agentów… AI i uczenie maszynowe, AI consult ∙ 2 dni 5 godzin temu ∙ 18 ofert |
Generator stron internetowych (AI)potrzebna strona do generowania stron nawet najprostsza - przygotowano 20 szablonów i już dobiera najbardziej potrzebny generowanie stron odbywa się na podstawie jednego promptu (opis firmy) interesuje proste rozwiązanie i płatność nie za wszystkie pieniądze świata AI i uczenie maszynowe ∙ 5 dni 14 godzin temu ∙ 32 oferty |