Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
1500 ₽

Доработка имеющегося сервиса по работе с текстовым содержимым

закрыт без выполнения


Сейчас имеется свой сервис, написанный на PHP. Что он делает? Он разбивает словосочетания на отдельные фразы и подсчитывает количество таких фраз с учетом словоформ.


Пример:

крапива для волос

крапива для волос отзывы

крапива для волос рецепты

отличные рецепты крапивы для волос

маски с крапивой для волос

крапива для волос полезные свойства

как сделать маску для волос с крапивой


Что выдаст сейчас сервис:


крапива 4 | 3 | 7

волос 7

рецепты 2

маску 1 | 1 | 2

сделать 1

свойства 1

отличные 1

отзывы 1

полезные 1


Здесь первая цифра - это количество слова в точной форме, вторая цифра - - в любой словоформе, а третья цифра - всего вхождений (точных + словоформ)


Что мне нужно доработать сейчас?

Нужно сделать поле для ввода "основной фразы".  Допустим основная фраза "крапива для волос"


Далее мне нужно, чтобы обновленный сервис анализировал, что находится слева и справа от этой основной фразы. А именно однословники или двух словники и трехсловники или в целом назовем все что от двухсловников и больше -  N словники. 


То есть сервис находит N словник - и заносит его в память.  И так по всем словам. Далее сервис берет все найденные однословники и проверяет их наличие в этих N словниках. Если наличие есть - то это слово не выводится в итоговый результат, а если не находится то выводится. Внимание - учет должен идти в любой словоформе!!!


После такой работы в итоговом результате должно быть следующее:

отзывы 1

отличные рецепты 1

сделать маску 1

полезные свойства 1


Пояснения:

1. Все предлоги, частицы и так далее (например, как из фразы "как сделать маску для волос с крапивой" - не учитываются, так как входят в список стоп слов - этот функционал реализован уже)

2. как я писал выше учет должен идти в любой словоформе. То есть у нас есть маски с крапивой для волос и 

как сделать маску для волос с крапивой. Здесь двухсловник - сделать маску. При этом однословник маски - является словоформной для маску. Поэтому в итоговый результат не пошел.


Такой же принцип действовать должен и для N словников. Вот взять основную фразу  - в точной форме она звучит "крапива для волос"


но у нас есть "крапивой для волос" и "волос с крапивой" - это все словоформы для "крапива для волос".  Предлог при этом лучше не учитывать вообще. у нас в основной фразе - для , а примере есть "с" - но тем не менее - это не влияет на результат. То есть важны все фразы которые рядом находятся (без учета предлога"). И если крапива и волос находятся друг за другом - то не важно какой между ними предлог. Система должна понять, что это и есть основная фраза.



Если что то непонятно - более детально - все обсудим по скайпу.



  1.  фрилансер больше не работает на сервисе
  2. 1 деньскрыта
    Артем Клоксов
     1273   31   0

    Пишите. Но нужно разбираться в этом. Пока не все понятно.
    - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

    Россия Россия | 13 октября 2017 |
  1. 2 дняскрыта
    Олег Миронов
     538   12   0

    Не силён в грамматике, но если норм разъясните - могу сделать

    ВКонтакте: vk.com/pandcar
    Телеграмм: telegram.me/pandcar
    Скайп: pandcar97

    Беларусь Беларусь | 12 октября 2017 |
  2. 1 деньскрыта
    Дмитрий Габдрахманов
     550   15   0

    обращайтесь
    )))))))))))))))))))))))))))))))))))))))))))
    )))))))))))))))))))))))))))))))))))))))))))

    Россия Россия | 13 октября 2017 |

Заказчик
Проект опубликован
14 октября 2017
84 просмотра
Местоположение исполнителя
Украина Украина