Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Создание парсера


  1. 459    11  0
    2 дня1500 UAH

    Здравствуйте.
    Стоимость стандартного парсера от 250грн за источник
    Сроки разработки парсера / предоставление результатов - обычно в течении дня.
    Зависит от объемов требуемых работ.

    Вы должны сами понимать, что универсальных парсеров не бывает.
    По похожим проектам могу предложить следующее:
    - указывать регулярку для нужных параметров для каждого источника в админке.

    Но остается момент, как парсер будет находить товары?
    Вы будете задавать ссылки на товары? Как по мне это не совсем удобно.
    Для вычленения страниц с товарами с каждого источника - нужна регулярка.
    Для пагинации (пролистывания списка товара) - тоже.

    Это все нужно уточнять. Как написал выше, были похожие проекты. Делается небольшая админка, с возможностью добавления источника и задания / настройки для каждого регулярных выражений для всех нужных значений.

    Все работы выполняются в пределах разумной стоимости и в минимальные сроки...

  2. 10123    117  0
    5 дней5000 UAH

    Здравствуйте.

    Разрабатываю ботов и парсеры на NodeJS. Готов взяться. Пишите, обсудим.

  3. 345    2  0
    4 дня5000 UAH

    Готов обсудить задание
    Разрабатываю парсерт на PHP
    Готов постоянно сотрудничать

  4. Еще 4 ставки скрыты
  • Євген Сизінцев
    4 января 2023, 13:06 |

    Каждый сайт устроен и написан по разному, информацию выдает также, поэтому один универсальный парсер на 100500 сайтов вряд ли реализуем

  • Володимир M
    4 января 2023, 13:11 |

    Спасибо, поэтому и указал что хотелось бы задавать элемент (в коде страницы) для Парсинга на каждом сайте вручную

  • Сергей Рудько
    4 января 2023, 13:21 |

    У кожного сайту саоя розмітка хтмл. Тому і не вийде зробити універсальний парсер.

    Вам потрібна людина, яка зробить парсер і надалі буде з ним працювати.

    Грубо кажучи,  розробка 5000грн + постійна доробка +8$ година.

    Або ж 

  • Володимир M
    4 января 2023, 13:25 |

    Мне казалось я указал что вручную должны задаваться элементы сайта. Я понимаю что это не универсальный парсер т к разная разметка у разных сайтов. 

  • Ivan Hrytskiv
    4 января 2023, 13:42 |

    Ви так і не зрозуміли, що Вам відписували - немає універсального парсера
    в кожного сайта є своє DOM дерево
    Один сайт - один парсер

  • Сергей Рудько
    4 января 2023, 13:29 |

    Google Sheets -> “=ImportXML(посилання; Xpath; “en_US”) “

  • Ivan O. Fastflow
    4 января 2023, 13:29 |

    Что за кринж...

  • Евгений Н.
    4 января 2023, 13:38 |

    Были похожие проекты. Делалась небольшая админка. Где идет управление источниками и для каждого настройка регулярных выражений для каждого параметра (будь то характеристики товара или ссылки на товар / пагинацию)

  • Ivan Hrytskiv
    4 января 2023, 13:57 |

    так - було багато таких = всі провалом закінчувались ))))

  • Евгений Н.
    4 января 2023, 14:05 |

    Сочувствую, в чем у вас сложность - не знаю. Вполне себе рабочий проект уже несколько лет. 

    Онлайн парсер / апи (как угодно можно назвать) для выдачи актуальных цен на настроенные источники. На входе ссылка на товар, по которой определяется источник и настройки. На выходе json / xml / html по заданному шаблону.    

    Соответственно вся регулярка для каждого источника задется в админке. 


  • Ivan Hrytskiv
    4 января 2023, 14:10 |

    чи пошук регулярками чи xpath чи ін - всерівно для кожного істочніка(як ви пишете) - потрібно свій пошук, свою логіку
    Немає одних і тих же регулярок для пошуку цін по div

  • Евгений Н.
    4 января 2023, 14:19 |

    Так я и не писал, что везде одинаковая регулярка. Вот элементарные настройки для одного из старенького проекта. Быстро внес 2 регулярки от prom.ua для названия и кода товара. Все остальное делается так же. Так же добавляются и  другие поставщики. Параметры какие душе угодно. 

    image


  • Ivan Hrytskiv
    4 января 2023, 14:21 |

    так я ж не про то кажу

    кажу я і всі інші учасники = що для кожного нового сайту потрібно нову логіку (чи то регулярки чи xpath і т д )

  • Евгений Н.
    4 января 2023, 14:23 |

    Так в т.з. так и написано, что создаются в админке "проекты". Я всего лишь написал, что уже делалось такое и не раз. Конечно же для каждого "проекта / сайта / источника" необходимо вносить соответствующие настройки.  )))

  • Ivan Hrytskiv
    4 января 2023, 14:27 |

    так )))
    зробили ставку - побачимо що скаже замовник
    чи замовник до кінця зрозумів суть проблеми та як буде реалізовано це все )))

  • Профиль заблокирован
    4 января 2023, 14:28 |

    вам же не какой-то ноунейм-сайт без обновлений парсить?

    во-первых банальные защиты от роботов
    во-вторых сложность динамической разметки, тот же алегро вы регуляркой не получите, потому как там вложенность дерева на две сотни элементов и они генерируются, то есть нужно привязка и ступенчатое отсечение

    третье выплывает из второго - кому то хватает одного, кому то совершенно ного

  • Ivan Hrytskiv
    4 января 2023, 14:29 |

    підтримую

  • Евгений Н.
    4 января 2023, 14:38 |

    Все верно. Но во многих случаях описанное решается работой, через эмуляцию браузера (тот же селениум).  Не говорю, что во всех!!! Где этого нет - еще проще. Плюс автор проекта указал "Нужны только заданные товары", как понимаю будут указываться ссылки на нужные товары. Да и что загадывать. Я всего лишь указал, что такое делалось. Многие просто хотят "универсальные" парсеры. Но я в ставке на эту тему написал, что конечно же универсальных не бывает. 

    Изначально все делается, проверяется. У заказчика остается возможность задать новые источники, подправить существующие без вмешательство в код. Только и всего. Хотя за этим опять таки обращаются снова. 

  • Ivan Hrytskiv
    4 января 2023, 14:40 |

    ну так робіть ставку і робіть проект ))) 

  • Профиль заблокирован
    4 января 2023, 14:56 |

    селениум увы не панацея

  • Ivan Hrytskiv
    4 января 2023, 14:30 |

    ТОму то і кажу = що було багато таких проектів, де замовник хо ів універсальності - і нічого доброго не було - тому що немає універсального рішення

Актуальные фриланс-проекты в категории Парсинг данных

База сайтов на woocommerce

Необходимо собрать базу украинских сайтов интернет-магазинов на woocommerce с контактами, которые указаны на сайтах. Только работающие сайты (индикатор: обновление каталога/контента, рабочий домен) Формат таблицы - адрес сайта, номер телефона, e-mail.

Парсинг данных ∙ 1 день 8 часов назад ∙ 19 ставок

Создать дашборд в https://airtable.com/ по результативности рекламных креативов из facebook ads

Полноценное ТЗ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing

Базы данных и SQLПарсинг данных ∙ 2 дня 22 часа назад ∙ 17 ставок

Создание файла Exel для загрузки товаров на сайты других партнеров.

Меня интересует, чтобы сделать таблицу Excel со всеми параметрами. Вот сайт - https://heiztechnik.com.ua/ И позиции, которые интересуют, чтобы были перенесены : Ручные котлы : 1) TIS UNI 15-95 кВт (10) шт 2)TIS HARD 150-500 кВт (7) шт Пеллетные котлы: 1)TIS PELLET 15-95 кВт…

Парсинг данных ∙ 3 дня 2 часа назад ∙ 34 ставки

Требуется разработчик для парсинга каталога и автоматизации импорта данных

Подробное ТЗ в прикрепленном документе прошу в отклике указать ориентировочную стоимость и сроки реализации есть ли опыт работы с парсингом крупных каталогов какие возможные сложности или ограничения вы видите в данной задаче

Базы данных и SQLПарсинг данных ∙ 3 дня 5 часов назад ∙ 39 ставок

Найти товарный фид (Google Merchant XML) для сайта на OpenCart

700 UAH

Необходимо найти прямую ссылку на действующий товарный фид (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Найти оригинальный фидТребования к результату: Рабочая ссылка на XML-файл

PythonПарсинг данных ∙ 3 дня 10 часов назад ∙ 23 ставки

Заказчик
Володимир M
США США  18  0
Проект опубликован
3 года назад
190 просмотров
Метки