Парсер OLX.UA
Написать Парсер номеров телефонов а также других данных ( Область,Город,Район,Категория,под категории,,Имя,Заголовок,Описание,Цена,Дата объявления,Номер объявления,URL объявления,В топе?) с сайт OLX.UA
Парсер должен уметь :
1) Парсить и сохранять в Excell данные с объявления сайт olx.ua ( Тлефоны, Область,Город,Район,Категория,подкатегории,,Имя,Заголовок,Описание,Цена,Дата обьявления,Номер объявления,URL объявления,В топе?)
2) Иметь возможность меню установки выбора заданий для парсинга : по городу, области, району, категории , под категории, частное или бизнес обьявление, в топе или нет, по цене от и до. Также должна быть возможность сбора по конкретно указанной ссылке в рамках сайта olx.ua
3) Данные должны сохраняться следующием формате : Отдельно файлы ( частное и бизнес), отдельно с отсеиванием дублей по телефон и без .
НАПРИМЕР собираем город Луцк Частные , на выходе должны получить в папке "Луцк далее папка - ЧАСТНЫЕ - далее папка 06.01.2020" (папки создаются автоматически) . В последней папке "06.01.2020" файлы всех основных категорий по отдельности ( детский мир, недвижимость ,транспорт и т.д БЕЗ дублей телефонов, и файлы с общим количеством по городу с дублями и файл без дублей.
ПРИМЕР НАЗВАНИЯ ФАЙЛОВ
название файла 24.12.18.06.09 - WD (21620) - Волынская обл - Луцк Ч ( дата, WD - без дублей номеров телефонов, количество , область ,город, Ч-частные)
название файла 24.12.18.06.09 - WD (521620) - Волынская обл - Луцк Б ( дата, отсутствие WD обозначает что файл с дублями номеров телефонов, количество , область ,город, Б-бизнес)
4) Во время парсинга должен быть виден тулбар с информацией сколько процентов задачи выполнено уже, сколько объявлений уже собрано , сколько осталось
5) Должна быть возможность сбора ВСЕХ или почти всех 95%-100% объявлений заданного города ( максимум можно за 1 запрос увидеть 500 страниц, поэтому в фоне работы программы при необходимости запросы автоматом должны разбиваться на более мелкие для достижения цели, например надо собрать Харьков Ленинский район там 100 тысяч объявлений (2000 страниц) , в фоне парсер разбивает его на более мелкие задачи или по цене или по категориям подкатегориям, не важно как, главное чтобы на выходе мы получили 100 тысяч объявлений).
6) Парсер должен иметь возмодность работать с несколькими потоками ( прокси) для увеличения скорости сбора, прокси вносятся в txt файл (по определенному шаблону) в парсере указывается путь к файлу.
7) Скорость парсинга на 1 поток не менее 10000 объявлений в час ( при работе core i7, 16гб ОЗУ), или 50000 объявлений час (10-15 потоков).
8) Перед выдачей парсера разработчику необходимо протестировать сбор не менее 100 тысяч объявлений ( 1 средний город) и сравнить количество выданных результатов ( количество) с тем что пишет сайт, оно должно совпадать .
9) Ниже прилагаю скрины парсера который у меня был ранее ( сейчас по неизвестным причинам не работает, с разаработчиком связь утеряна).
Додатки 4
-
Здравствуйте!
Готов реализовать быстро и качественно.
Опыт в парсинге - более 4-х лет
Обращайтесь - буду рад сотрудничеству)
-
208 6 0 Большой опыт в парсинге, сделал такой же проект на olx.uz, смотрите портфолио
-
3397 34 0 Здравствуйте. Я занимаюсь программированием и разработкой онлайн парсеров любой сложности. Мой профиль входит в 🏆ТОП-3 исполнителя в данной категории.
Выполню проект быстро и качественно. У меня есть большой опыт парсинга OLX. Я хорошо понимаю какая там защита и как её обходить.
Реализую мощный многопоточный парсер OLX.ua. Вам понадобятся IPv4-прокси, но разумное количество.
Парсер будет легко и удобно настраиваться, как Вы и описали.
Возможно два варианта реализации приложения:
1) Приложение для работы на Вашем ПК.
2) Приложение для работы на сервере (с управлением через веб админ. панель).
…
Гарантирую поддержку проекта после сдачи.
✅ Предлагаю лично обсудить подробности, чтобы назвать цену и сроки.
-
1639 20 0 3 пишу профессиональные парсеры на питоне, опыт 10 лет, рад буду плодотворному сотрудничеству
-
В цьому році на OLX поставили захист на парсинг данних особливо на номера телефонів, реалізовував парсер через curl php підставляв данні в хедер запиту та сформований токен, так ось цього токена вистачає на 3 запити далі блокується IP адреса. Яким чином формуэться в них токен ныхто не знає.
-
Як варіан реалізувати браузерне рішеня парсера, наприклад як розширення хром. Запускати розширення хай ходить по сторінкам OLX і парсить дані, але скоріш за все також можуть також блокувати якщо в секунду з одного IP дьоргати багато сторінок.
-
Даниил Яцура, цікаво що ти там хочеш робити 21 день за 25 к ?😐
-
Актуальні фриланс-проєкти в категорії Javascript та Typescript
Оптимізація Core Web Vitals (OpenCart) під Google PageSpeed — Мобільна та ПК версіїОпис замовлення: Шукаємо досвідченого frontend-розробника/фахівця з OpenCart для оптимізації швидкості завантаження сайту (категорії та картки товарів) під вимоги Google Core Web Vitals. Про проект: * CMS: OpenCart. * Специфіка: Сайт працює в режимі каталогу (кошика та… CMS, Javascript та Typescript ∙ 1 день 9 годин тому ∙ 17 ставок |
Оптимізація швидкості сайту WordPress
5092 UAH
повні деталі надішлемо в особисті повідомлення Мета Максимально прискорити завантаження сайту, особливо на мобільних пристроях. KPI (обов'язково) Після завершення робіт необхідно досягти наступних показників. Mobile Performance 90+ LCP менше 2.2 сек INP менше 200 мс CLS менше… HTML та CSS верстання, Javascript та Typescript ∙ 2 дні 5 годин тому ∙ 65 ставок |
Інтеграція калькулятора вартості послуг на сайт Webflow
14 825 UAH
Шукаємо розробника для інтеграції готового калькулятора вартості послуг на наш сайт, створений на Webflow. Про компанію Ми займаємося: збіркою меблів; монтажем телевізорів; монтажем полиць, картин, дзеркал та інших предметів; moving help; heavy lifting; handyman послугами;… Javascript та Typescript, Веб-програмування ∙ 2 дні 6 годин тому ∙ 62 ставки |
Шукаємо Odoo Developer — соло-розробника з досвідом розробки на Odoo 19 Community EditionЄ робочий, чисто спроектований проєкт на Odoo 19 Community — CRM для українського готелю, уже в production-grade інфраструктурі. Переписувати з нуля не плануємо. Шукаємо одну людину, яка підхопить проєкт, збереже працююче і поведе його далі: спершу CRM → потім HMS → бухгалтерія.… Javascript та Typescript, Веб-програмування ∙ 4 дні 6 годин тому ∙ 2 ставки |
Шукаю досвідченого Full Stack розробника для створення SaaS-сервісу для інтернет-магазинів.Ідея сервісу: Клієнт завантажує посилання на свій товарний фід (XML або CSV). Сервіс автоматично отримує товари, бере їхні фотографії та створює нові рекламні зображення за готовими шаблонами: ціна, знижка, логотип, акційні плашки тощо. Також у сервісі має бути простий редактор… Javascript та Typescript, Веб-програмування ∙ 5 днів 12 годин тому ∙ 87 ставок |