Парсинг данных
Нужно разработать программку для парсинга данных с 5-10 сайтов а потом чтобы все эти данные собирались в PDF или JPEG файл( или другой какой будет удобный) . Предварительно перед тем как собрать эти данные в один файл чтобы была возможность отобрать не нужную информацию, например если это картинки то удалить не нужные картинки вручную путем нажатия крестика на картинке и так само удалять не нужные слова.
Возьмем для примера слово "ВОДА". Мне нужно подтянуть текст из 2-х сайтов по этому запросу. Потом нужно подтянуть картинки по этому запросу из 3-х сайтов.
Для примера, по тексту это могут быть сайты:
1) http://sociation.org/word/%D0%B2%D0%BE%D0%B4%D0%B0/
2) http://www.reright.ru/analysis/285801~%D0%B2%D0%BE%D0%B4%D0%B0.html#spryazh
А по картинкам это могут быть:
4) http://color.romanuke.com/?color1=17&color2=11
5) Еще какой то сайт например https://dribbble.com/search?q=water или https://www.behance.net/search?content=projects&sort=appreciations&time=week&featured_on_behance=true&search=water или https://ru.pinterest.com/search/pins/?q=water&rs=typed&term_meta[]=water%7Ctyped
После того как мы спарсили текст и картинки, чтобы была возможность или на самом компютере или где то в онлайне на веб-странице отсеять не нужную информацию и оставить только ту что нужно.
В итоге должно получится что то наподобие как во вложении:
На php/python/ruby делать будете?
Сколько по времени?
Сколько по стоимости?
Додатки 1
-
396 17 1 Добрый день.
Хорошо, задача ясна. Вижу такое решение:
Записывать буду в формат PDF. Буду реализовывать с помощью библиатеки TCPDF.
Писать буду на PHP 7
-
171 2 0 Здравствуйте!
Задача интересная, готов выполнить, но есть несколько вопросов по описанию, хотелось бы обсудить.
-
видалено модератором
-
Актуальні фриланс-проєкти в категорії PHP
Багатосторінковий HTML-шаблон веб-сайту для онлайн-ставок та парсинг API матчів (
1109 UAH
|
Вирішити проблему навантаження на хостинг сайта на ПресташопСайт з кожним місяцем потребує більше і більше ресурсів. Відповідь хостера:Під час перевірки сервера було зафіксовано підвищене навантаження з боку сервера баз даних MySQL. У моменти виникнення помилки 500 процес MySQL використовує значну частину ресурсів процесора, що може… PHP, Бази даних та SQL ∙ 12 годин 8 хвилин тому ∙ 20 ставок |
Потрібна інтеграція KeyCRM → ПРРО Кашалот |
Сайт на WordPress з використанням теми Kadence та Kadence Blocks.
10 000 UAH
Нам потрібно створити сайт на WordPress з використанням теми Kadence та Kadence Blocks. Інтернет-магазину не буде (хоча, ймовірно, він буде доданий у майбутньому). Потрібна головна сторінка та кілька внутрішніх сторінок. Графіка вже готова, структура макета здебільшого… CMS, PHP ∙ 1 день 23 години тому ∙ 37 ставок |
Розробка 2 SEO-орієнтованих сайтів з продажу запчастин (квадроцикли та спецтехніка)Розробка двох спеціалізованих сайтів з продажу запчастинЗагальна інформація Потрібно розробити два спеціалізовані сайти: Запчастини для квадроциклів, UTV, SSV та іншої подібної техніки. Запчастини для спеціальної техніки. Існуючий сайт компанії: https://kiaparts.com.ua/ Нові… PHP, Веб-програмування ∙ 2 дні 20 годин тому ∙ 76 ставок |