Парсинг / Импортирование новостей в базу CMS DLE 15
Задача:
1. Нужно периодически собирать новости из html-файлов (уже спарсены), которые размещены в каталоге MSN_result_parse (список всех этих новостей обновляется каждые 5 минут в файле “allnews_list.txt”),

очищать от лишних тегов и всех ссылок (сделать красивый контент), после чего скопировать в каталог cleaned_after_parsed.
2. Далее забираем html-файлы из каталога Translated и в виде новостей публикуем на сайте, учитывая следующие моменты:
- Перед публикацией необходимо переименовать сопутствующие картинки из *.img в *.jpg).

- Самую первую строку в HTML-файле нужно использовать в качестве названия статьи, Keywords, Title и Metatags.
- В поле Description добавляем часть из самой новости за исключением заголовка.
- Нужно создать также short_story с картинкой, которая идёт первая по списку в новости, чтобы красиво выглядело на сайте.
- Учесть, что html-файлы рассортированы по различным подкаталогам и часто имеют одинаковые названия
- Вести лог-файлы по загруженным новостям, обработанным файлам, чтобы можно было отследить возможные сбои.
- удостовериться, что новости с картинками корректно выводятся и отображаются на сайте (не ломается вёрстка).
- Изображения,которые идут с новостью выравниваем по центру в теле полной новости (full_story)
Можно и не в виде модуля для CMS, а в виде обычных PHP-файлов, которые будут запускаться по крону.
-
463 6 0 Добрый вечер. С удовольствием бы выполнил данную задачу, парсить html умею, опыт в разработке на php большой.
Сделаю как отдельный сервис, не привязанный ни к каким CMS.
-
530 32 4 Добрый вечер, выполню в виде плагина для DLE.
Админпанель для просмотра логов и настроек, запуск по cron.
Обращайтесь.
-
Можно и так, с плагином проще интегрироваться в админку сайта, если это нужно конечно.
-
Актуальные фриланс-проекты в категории PHP
Исправить CLSНеобходимо исправить Cumulative Layout Shift через код PageSpeed не видит этой проблемы, но через Google Chrome видно, что есть смещение макета для компьютерной версии страницы В ответе Google Search появилась ошибка касательно скорости компьютерной версии Необходимо… PHP, Веб-программирование ∙ 2 дня 18 часов назад ∙ 29 ставок |
Перенести полностью готовую адаптивную HTML5-структуру в WordPress.
12 000 UAH
Я ищу опытного WordPress-разработчика, который сможет преобразовать наш тщательно подготовленный статический HTML5/CSS3 код в высокопроизводимую кастомную WordPress-тему. Фронтенд уже практически готов (примерно 99%): семантическая разметка, метаданные и мультиязычная структура… CMS, PHP ∙ 2 дня 21 час назад ∙ 65 ставок |
Интеграция GoPosПривет, делал кто нибудь интеграцию GoPos с кастомным сайтом для ресторана в Польше? Нужна помощь, у них очень скудная документация, есть только swagger и тот без описаний https://app.gopos.io/doc/swagger-ui/index.html Суть такая, использовали от них сайт для онлайн заказов,… PHP, Веб-программирование ∙ 3 дня 12 часов назад ∙ 25 ставок |
Прописать мета данные АЛЬТ при помощи ИИСайт на Laravel , на сайте много изображений, для которых нужно прописать корректные по семантики и релевантные для странице АЛЬТ описание изображения в автоматическом режиме, с возможностью проверки AI и машинное обучение, PHP ∙ 4 дня 10 часов назад ∙ 35 ставок |
Нужен разработчик для завершения и интеграции проекта по автоматическому сбору и обработке данных
700 UAH
Основная часть парсера уже реализована. Парсер работает на Windows-среде через Microsoft Edge: сайт имеет антибот-защиту, поэтому сбор данных выполняется не прямыми HTTP-запросами, а через живую браузерную сессию. Скрипты управляют открытой вкладкой Edge через Chrome DevTools… PHP, Веб-программирование ∙ 4 дня 16 часов назад ∙ 26 ставок |