Спарсить тексты с сайта
800 UAHНа сайте размещен каталог исполнителей.
Нужно собрать часть текстовых данных из него.
Единицей сохранения должны быть предложения, разделенные точкой (кроме ситуации, когда точка используется для сокращении слова; нужно добавить в исключения ситуации, если перед точкой стоит менее 3 букв, например, г. или гг. - в таком случае не разделять на предложения).
Пример страницы: https://uaТОЧКАrepetitorsТОЧКАinfo/repetitor/hungarian/
Ссылки на разделы сайта, откуда парсить данные, я предоставлю. Все разделы имеют одинаковую структуру, сохраняются в одинаковом порядке. Всего будет около 150 разделов.
ЧТО СОХРАНЯТЬ
https://prnt.sc/xpcrjd
1 часть - Образование (после строки "Образование:"). В этом примере будете сохранено 5 записей. Раздел Образование
2 часть - Опыт (после строки "Опыт:"). В этом примере будет сохранено 2 записи. Раздел Опыт.
3 часть - О себе (в тексте выделено курсивом). В этом примере будет сохранено 2 записи. Раздел Опыт.
Перед сохранением удалять из текста маркеры •
КАК СОХРАНЯТЬ
Сохранять в бд MySQL.
Каждое предложение сохранять в отдельную запись.
Сохранять с учетом деления на разделы.
Раздел: Язык (пример, Английский)
Подразделы (одинаковые в каждом разделе): Образование, Опыт, О себе
--
Напишите вашу стоимость, когда можете начать, ориентир завершения. Если в работе много проектов, давайте реалистичные сроки.
Отзыв заказчика о сотрудничестве с фрилансером
Спарсить тексты с сайтавсе вовремя, согласно заданию.
Отзыв фрилансера о сотрудничестве с Eduard Eduard
Спарсить тексты с сайтаОчень понравилось сотрудничать. Однозначно рекомендую.
![]()
Актуальные фриланс-проекты в категории Парсинг данных
Сделать бота для проверки ссылок в ФБ
10 000 UAH
Есть гугл док, загружены ссылки в ФБ нужно, чтобы бот анализировал док на предмет опубликованных постов и ежедневно делал отчет Парсинг данных, Разработка ботов ∙ 3 часа 2 минуты назад ∙ 35 ставок |
Создание файла Exel для загрузки товаров на сайты других партнеров.Меня интересует, чтобы сделать таблицу Excel со всеми параметрами. Вот сайт - https://heiztechnik.com.ua/ И позиции, которые интересуют, чтобы были перенесены : Ручные котлы : 1) TIS UNI 15-95 кВт (10) шт 2)TIS HARD 150-500 кВт (7) шт Пеллетные котлы: 1)TIS PELLET 15-95 кВт… Парсинг данных ∙ 3 часа 43 минуты назад ∙ 20 ставок |
Требуется разработчик для парсинга каталога и автоматизации импорта данныхПодробное ТЗ в прикрепленном документе прошу в отклике указать ориентировочную стоимость и сроки реализации есть ли опыт работы с парсингом крупных каталогов какие возможные сложности или ограничения вы видите в данной задаче Базы данных и SQL, Парсинг данных ∙ 6 часов 35 минут назад ∙ 27 ставок |
Найти товарный фид (Google Merchant XML) для сайта на OpenCart
700 UAH
Необходимо найти прямую ссылку на действующий товарный фид (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Найти оригинальный фидТребования к результату: Рабочая ссылка на XML-файл Python, Парсинг данных ∙ 11 часов 52 минуты назад ∙ 19 ставок |
Парсинг товаров с супермаркетовНужен специалист (парсинг + Google Sheets + автоматизация). Цель: Создать систему автоматического получения и обновления цен на продукты питания из супермаркетов Сильпо и NOVUS с выводом данных в Google Sheets. Что необходимо реализовать: Создать основную Google Sheets таблицу с… Парсинг данных, Поиск и сбор информации ∙ 19 часов 42 минуты назад ∙ 38 ставок |