Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
200 ₴

Поиск в непроиндексированном тексте (русский язык)

истекло время актуальности


Нужно реализовать поиск фразы в непроиндексированном тексте. При этом поиск должен выполняться с учетом словоформ. Подозреваю, что нужно использовать лемматизацию (то есть генерировать набор комбинаций словоформ слов и производить поиск по тексту). Возможно, вы предложите более эффективный/правильный вариант. Язык русский.


Реализация C# VS2013. С вас исходники проекта (лучше всего на bitbucket). При необходимости можно использовать сторонние словари и наработки вроде Яндекс Томита парсера.


В будущем будем обсуждать доработку ранжирования результатов поиска, например, по расстоянию между словами, порядку и т.д.


Сделать ставку!

Заказчик не желает делать предоплату? Предложите оплату через Сейф, чтобы избежать возможного мошенничества.
  • Это ж фраза, несколько слов (со знаками), не кусок текста - тест все равно будет проходить сравнение посимвольно: поставьте параллельную проверку всех нахождения всех слов в фразе (и, при необходимости, знаков пунктуации), желательно, через switch case, в теле установите счетчик для индексации текстового массива и массив (массивы) integer для регистрации мест находок. Все дальше просто проходите сравнение последовотельностей найденых слов в нужном порядке и колличестве. Может я не до конца понял ваше задание или найдется идея получше, ну, как говорится, чем смог. Конкретная реализация будет зависить от того, что у вас за программа, тобишь какими средствами работы со строками и символами пользуетесь.

  • Добавить

Заказчик
Артем Фролов
Украина Днепр  8   0
Проект опубликован
4 января в 08:46
79 просмотров
Способы оплаты
Поделиться