Предложить алгоритм работы парсера для авито.ру
253 PLNНужен специалист по парсерам - разработать алгоритм работы парсера.
Парсер должен уметь:
1. Скачивать все объявления с авито.ру
2. При повторном запуске он должен уметь понимать: какие объявления новые, какие удалены. База все время обновляется (добавляются новые, удаляются старые, остаются остальные актуальные).
Алгоритм должен включать описания:
1. Как реализуется охват всех объявлений.
2. Как происходит взятие контента объявлений.
3. Как программа защищается от бана прокси, сколько нужно прокси.
4. Какие технологии (язык программирования, база данных).
5. На чем лучше запускать - серверное ПО или настольный ПК, и почему.
6. Архитектура сервера/настольного ПК.
7. Какая ожидается скорость набора 1 млн объявлений (и обосновать - почему).
В заявке пишите цену и сроки.
Opinia zleceniodawcy o współpracy z Misha Titkov
Предложить алгоритм работы парсера для авито.руОтличный исполнитель!
![]()
Opinia freelancera o współpracy z ze zleceniodawcą
Предложить алгоритм работы парсера для авито.руХороший заказчик, поставил точные указания, был на связи.
Благодарю, за сотрудничество.
-
добрый день, буду рад помочь.
Алгоритм должен включать описания:
1. Как реализуется охват всех объявлений. Можно предусмотреть в интерфейсе выбор региона от куда парсить например: Москва выбираем парсинг всех категорий или выборочно, что нас интересует, сохраняет в базу данных которая хранится на сервере (MongoDb или MySql) чтобы потом можно было парсить только новые объявления, объявления буду хранится по категориям.
2. Как происходит взятие контента объявлений - например https://www.avito.ru/moskva
с этой страницы достаем все ссылки на объявления и каждую парсим по очередно, или https://www.avito.ru/moskva/lichnye_veschi , такая ссылка позволяет парсить по категориям. Телефоны на авито хранятся в base64 png, качаем их храним в базе, с подвязкой к каждому объявлению
3. Как программа защищается от бана прокси, сколько нужно прокси - прокси + создание ожидания перед отправкой следующего запроса: например каждый регион или категория парсятся в отдельном потоке и используют разные прокси сервера. Дальше идет подмена прокси, и дальнейший парсинг уже объявлений. По колличеству прокси не знаю, может получится парсить без банов... нужно тестировать
4. Какие технологии (язык программирования, база данных) - язык С++ интерфейс Qt creator, база данных MongoDb или MySql.
5. На чем лучше запускать - серверное ПО или настольный ПК, и почему. - лучше серверное оно работает без перебоев + можно парсер настроить один раз и он будет сам себе работать иногда заходить проверять нет ли там ошибок, а с настольным могут быть разные отключения, а форсмажор и с сервером может быть.
… 6. Архитектура сервера/настольного ПК. Сервер - Window Server 2012 R2, RAM 1gb, system type 64 or 32. Настольный : Win7-8-10, RAM 1gb system 64 or 32.
7. Какая ожидается скорость набора 1 млн объявлений (и обосновать - почему).
6 - 8 объявлений, если на компьютере 4 ядра, запускаем в 4 потока, получится в час 44тыс объявлений в час, через 22 часа будет 1 миллион. Это тоже не точно, может в минуту можно парсить больше чем 6-8, если парсить 30 в минуту чисто теоритически 1 час в одном потоке 43тыс, если 4 потока 172 800.
-
1 dzień42 PLN
175 2 1 1 dzień42 PLNГотов расписать
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Należy opracować bota Telegram do monitorowania samochodów z aukcji w USA (Copart, IAAI)Należy stworzyć bota Telegram do automatycznego wyszukiwania i monitorowania samochodów "BUY IT NOW" na aukcjach w USA (Copart, IAAI). Bot powinien działać w trybie automatycznym i wysyłać powiadomienia o nowych samochodach, które odpowiadają zadanym filtrom.Podstawowa… Parsowanie danych, Tworzenie chatbota ∙ 1 godzina 2 minuty temu ∙ 30 ofert |
Parsowanie produktów, przygotowanie do importu na WPWydobyć pełny katalog tych stron: https://svit-mebliv.ua/ https://kompanit.com.ua/ru https://amia.com.ua/ https://mebliromax.com.ua/ https://pehotin.com.ua/catalog/ https://www.sokme.ua/ru/ Wszystkie produkty muszą być połączone w jedną wspólną tabelę do importu do WP. Każdy… Programowanie stron internetowych, Parsowanie danych ∙ 2 dni 17 godzin temu ∙ 55 ofert |
Wymagany specjalista ds. promocji w Telegramie.
107 PLN
Zadania: zapraszanie rzeczywistych użytkowników z bazy nazw użytkowników do nowych czatów oraz wysyłanie wiadomości do docelowej bazy. Interesuje nas tylko jakościowy ruch i praca z żywą publicznością — wykonawców korzystających z botów, sztucznego zwiększania lub niskiej… Parsowanie danych, Promocja w sieciach społecznościowych (SMM) ∙ 7 dni 17 godzin temu ∙ 9 ofert |
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 11 dni 12 godzin temu ∙ 13 ofert |
Potrzebny specjalista do wyszukiwania kontaktów decydentów w UkrainieKonieczne jest zebranie bazy (lub gotowej bazy) kontaktów osób podejmujących decyzje (LPR) w firmach Ukrainy. Wyszukiwanie i zbieranie informacji, Parsowanie danych ∙ 11 dni 16 godzin temu ∙ 22 oferty |