Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
1 000 ₴

Определитель языка страниц (python)

проект завершен


Вы смотрите проект не придирчивого заказчика

Я быстро даю обратную связь, прислушываюсь к фрилансерам и у меня постоянный поток заказов разной сложности.

Люблю закрывать проекты быстро, без беконечных правок.

---

ТЗ Парсер-определитель языка


Вводные данные:

список веб адресов


Функционал:

- проверка доменного имени на вариацию окончаний и поддоменов разных стран. Т.е просто прикриплять к вводному веб адресу окончания разных стран. Пример: сайт.ру, site.uasite.de или de.site.uade.site.ru

- проверка текстов страниц на автоопределение языка гугл. Результаты о языках заносить в таблицу ексель.


*на предмет перевода парсим только ссылки со страницы из нашего списка

*избежать бана гуглом


Вывод:

- напротив списка сайтов фиксируем какие языки там присутствуют. Если несколько языков, то информация об этом в формате 1 язык 1 ячейка

- заносим в таблицу информацию об работающих адресах этого сайта в расширении других стран


Настройки парсера:

- Возможность выбрать до запуска: искать по всем расширениям стран или только по выбранным

- Возможность выбрать до запуска:

искать по всем языкам или только по выбранным


--


при подаче ставки, используем слово "Мангуст"


Отзыв заказчика о сотрудничестве с фрилансером

Качество
Профессионализм
Стоимость
Контактность
Сроки

Отличный исполнитель
парсер не только быстр, но и им приятно пользоваться !
буду предлагать дальнейшие проекты Сергею
рекомендую

Отзыв фрилансера о сотрудничестве с Сашей Шмуратовым

Оплата
Постановка задачи
Четкость требований
Контактность

Отличный заказчик. Все коротко и ясно. Оплата мгновенна. Большое спасибо. Всем рекомендую

qwe
Профиль удален | Сейф Сейф


  1.  10 дней 2 700 ₴
    Максим
    Максим Богоявленський
    1055     18  0

    Использую слово "Мангуст".
    Добрый день,
    Интересный заказ, к тому же есть наработки по подобным приложениям (даже здесь на freelancehunt - предыдущие заказы). Нужно уточнить некоторые моменты, но в целом вполне реализуемо. Если есть предпочтения по технологии/языку, то лучше обсудить сразу.
    Буду рад Вам помочь! В любом случае пишите - договоримся!

    Украина Львов | 16 августа 2019 |
  2.  фрилансер больше не работает на сервисе
  • Добрый день, 

    Можно уточнить некоторые детали:

    1. Я правильно понял, что Вам необходимо приложение с графическим интерфейсом? Или это серверный демон?

    2. Таблица ексель - обязательный критерий? Просто с обычной sqllite будет в разы быстрее работать.

    3. Некоторые сайты мультиязычны, но это не на уровне домена, а параметрами в cookies - Вы рассматривали этот вариант?


    Если есть сервер, то вообще не будет проблем с интерфейсом и функционалом, на локальной машине же могут быть ограничения по ресурсам.

  • Саша Шмуратов — заказчик проекта
    17 августа 2019 |

    Добрый

    Предпочтительно -запуск на моем компьютере
    интерфейс не обязателен. Могу запускать из терминала, если это сократит время разработчику

    Что быстрее, то и интереснее. Но если будет работать с моего компьютера, то есть еще особенность - я часто меняю устройство. Должно быть удобно.

    Прислушаюсь к оптимальному варианту. Главное результат:определить есть ли другие языки у сайта. И понять какие.
    Выгрузка в ексель нужна только под предлогом удобной работы потом со статститикой. Если эо можно оптимизировать по-другому:давайте рассматривать

  • Вас понял, если развертывать на локальном устройстве (и не всегда есть окружение Python) можно после окончательных правок собрать все в exe (запуск терминала), а сайты записывать в отдельный файл + файл с конфигами для запуска. Насчет базы данных, то можно записывать в локальный sqlite и носить с собой портативную программу для просмотра/правок - легче чем Excel однозначно. Насчет алгоритма поиска могу подумать детальнее, если в этом есть необходимость.