Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
1500 ₽

Доработка имеющегося сервиса по работе с текстовым содержимым

проект завершен
PHP


Сейчас имеется свой сервис, написанный на PHP. Что он делает? Он разбивает словосочетания на отдельные фразы и подсчитывает количество таких фраз с учетом словоформ.


Пример:

крапива для волос

крапива для волос отзывы

крапива для волос рецепты

отличные рецепты крапивы для волос

маски с крапивой для волос

крапива для волос полезные свойства

как сделать маску для волос с крапивой


Что выдаст сейчас сервис:


крапива 4 | 3 | 7

волос 7

рецепты 2

маску 1 | 1 | 2

сделать 1

свойства 1

отличные 1

отзывы 1

полезные 1


Здесь первая цифра - это количество слова в точной форме, вторая цифра - - в любой словоформе, а третья цифра - всего вхождений (точных + словоформ)


Что мне нужно доработать сейчас?

Нужно сделать поле для ввода "основной фразы".  Допустим основная фраза "крапива для волос"


Далее мне нужно, чтобы обновленный сервис анализировал, что находится слева и справа от этой основной фразы. А именно однословники или двух словники и трехсловники или в целом назовем все что от двухсловников и больше -  N словники. 


То есть сервис находит N словник - и заносит его в память.  И так по всем словам. Далее сервис берет все найденные однословники и проверяет их наличие в этих N словниках. Если наличие есть - то это слово не выводится в итоговый результат, а если не находится то выводится. Внимание - учет должен идти в любой словоформе!!!


После такой работы в итоговом результате должно быть следующее:

отзывы 1

отличные рецепты 1

сделать маску 1

полезные свойства 1


Пояснения:

1. Все предлоги, частицы и так далее (например, как из фразы "как сделать маску для волос с крапивой" - не учитываются, так как входят в список стоп слов - этот функционал реализован уже)

2. как я писал выше учет должен идти в любой словоформе. То есть у нас есть маски с крапивой для волос и 

как сделать маску для волос с крапивой. Здесь двухсловник - сделать маску. При этом однословник маски - является словоформной для маску. Поэтому в итоговый результат не пошел.


Такой же принцип действовать должен и для N словников. Вот взять основную фразу  - в точной форме она звучит "крапива для волос"


но у нас есть "крапивой для волос" и "волос с крапивой" - это все словоформы для "крапива для волос".  Предлог при этом лучше не учитывать вообще. у нас в основной фразе - для , а примере есть "с" - но тем не менее - это не влияет на результат. То есть важны все фразы которые рядом находятся (без учета предлога"). И если крапива и волос находятся друг за другом - то не важно какой между ними предлог. Система должна понять, что это и есть основная фраза.



Если что то непонятно - более детально - все обсудим по скайпу.

Отзыв заказчика об исполнителе Дмитрии Габдрахманове

Качество
Профессионализм
Стоимость
Контактность
Сроки

Дмитрий спасибо вам огромное! Вы выполнили мое нестандартное задание на все 10 балов. Все на высоком профессиональном уровне и в оговоренный срок. Я очень доволен работой с вами и надеюсь на дальнейшее сотрудничество!

Алексей Н. Алексей Нижегородцев | Сейф Сейф

Отзыв фрилансера о заказчике Алексее Нижегородцеве

Оплата
Постановка задачи
Четкость требований
Контактность

Отличный и адекватный заказчик. По всем вопросам на связи. Оплата в срок.

Дмитрий Г. Дмитрий Габдрахманов | Сейф Сейф



  1. 7 днейскрытаПобедившая ставка
    Дмитрий Габдрахманов
     550   15   0

    обращайтесь
    ))))))))))))))))))))))))))))))))
    ))))))))))))))))))))))))))))))))

    Россия Россия | 14 октября 2017 |

Заказчик
Проект опубликован
14 октября 2017
15 просмотров