Data QA Engineer
We are looking for a detail-oriented engineer with strong SQL and Data management experience to work with our analytics and data science back-end. This role will include verifying data integrity, deduplication, aggregated metrics. Building QA and validation processes for datasets and algorithms. The ideal candidate will have the ability to take ownership of daily data ingests from client and help building validation around it. Collaborate with the data science and ops teams.
Requirements
Strong SQL, MySQL or PostgreSQL
Experience writing scripts in Python
Should be comfortable working with big datasets
Experience validating data in text or CSV data formats
Attention to details and self organization
Nice to have
Experience with AWS S3
Background in science or engineering
Experience with a scheduler such as AirFlow or Jenkins
Big Data technologies: Redshift, Redshift Spectrum, Spark, Hadoop
Workload: Half-time or Full-time
Актуальные фриланс-проекты в категории Парсинг данных
Нужен парсер интернет-магазина https://www.lcsc.com/нужно регулярно (1 раз в месяц, или по запуску скрипта) получать актуальную информацию о товарах в наличии магазина https://www.lcsc.com/ из каталога всех разделов… Парсинг данных ∙ 10 часов 14 минут назад ∙ 34 ставки |
OpenCart — каталог аренды спецтехники
6000 UAH
OpenCart — каталог аренды спецтехникиНеобходимо запустить каталог аренды спецтехники на OpenCart.Тематика:экскаваторыавтовышкипогрузчикигенераторыкраныстроительные лесадругая строительная техника.Желательно, чтобы у вас уже был готовый шаблон или наработки под спецтехнику,… Веб-программирование, Парсинг данных ∙ 1 день 2 часа назад ∙ 47 ставок |
Перенести программу - слетел сервер, где была программа (официальный разрешенный парсинг гос данных)
2061 UAH
Добрый! У меня у клиента произошел данный кейс описанный ниже. Нужно помочь перенести на новый сервер и оттестировать программу. Лучше программист, который разбирается в парсинге. Настройка ПО и серверов, Парсинг данных ∙ 1 день 6 часов назад ∙ 28 ставок |
Парсинг сайтаТребуется реализация 4 парсеров (сайты каталоги) Есть тз, есть пример кода как референс . В задачи входит: Написать парсер Прикрутить прокси Логика дедубликации (перенести логику из примера) Логика хешированя по 3 полям Парсер должен работать как пайплайн с логикой что… Парсинг данных ∙ 2 дня 23 часа назад ∙ 44 ставки |
Сбор(парсинг) базы товаров с сайтов поставщиков (Excel / CSV)
10 000 UAH
Сбор базы товаров с сайтов поставщиков (Excel / CSV) Добрый день. Требуется специалист для сбора и структурирования данных с нескольких сайтов поставщиков, доступ к которым будет предоставлен.Задача: Необходимо сформировать единую базу товаров в формате Excel (XLSX) или CSV.Для… Веб-программирование, Парсинг данных ∙ 4 дня 6 часов назад ∙ 105 ставок |