Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!
2300 ₽

скрипт генератор текста

проект завершен


Перед созданием ТЗ, я поискал готовые решения для генерации текстов - меня мало что устроило:

  1. Треть сводится к тому, что нажми на кнопку получи заранее подготовленный автором текст;
  2. Треть к тому, что вот есть шаблон, давайте подставлять в него синонимы либо заменять прилагательные, (делая предложения фиксированного размера и особо не изменяя положение слов в тексте - сохраняя Манхеттенское расстояние)
  3. Треть к цепям Маркова, которые а) сложны б) дают бредовый результат в) уже лет 10 как успешно палятся поисковыми системами.


Для себя задачу я ставил так: я должен иметь возможность скормить генератору подобранный мною текст на заданную тематику (например, сборник статей из разных источников). Генератор должен сформировать текст, в котором есть заголовки разных уровней, параграфы, предложения разной длины


Должен соблюдаться некий ритм текста - чередование длинных и коротких предложений, и каждое предложение в целом должно соответствовать правилам русского языка. 


Решение состоит в том, что бы обучить генератор на примере входящего текста, и по этим знаниям сформировать новый текст (каждый раз новый).


При поступлении текста, генератор разбирает его на токены, и запоминает, какие слова обычно идут в начале предложения, какие в конце, какое слово чаще идет после данного, какое реже. В общем, строит этакое дерево последовательностей. После этого берет случайные первые слова, дополняет одним из слов, которые обычно за ним идут, то же самое делает со вторым словом, потом с третьим и так далее, пока не встретится последнее слово.

Соответственно, чем больше текста будет скормлено, и чем лучше соблюдена тематика, тем лучше будет результат.

Этот генератор текста https://bablofil.ru/text_generator делает так на 100%. Это будет эталоном.

Язык исполнения: php или python3 или bash (а вдруг)


./generator.py ./train.txt 100 ./out/result 11
./train.txt - текст для тренировки
100 - количество статей
./out/result - папка и начало имени файла, к которому добавляется номер файла с шагом +1
11 - начальный номер

Отзыв заказчика об исполнителе Владиславе Переломове

Качество
Профессионализм
Стоимость
Контактность
Сроки

По опыту работы с фрилансерами на этой площадке, я признаюсь, как обычно сомневался, будет ли результат так быстро, как было сказано. Но в этот раз, моим страхам не суждено было сбыться!

Генератор получился отличный. Буду тестировать его на разных текстах, но уже понятно, что эти тексты пойдут в работу.
Я считаю, что ТЗ было проработанное, однако в процессе мы его еще улучшили и получили настоящий шедевр!

Исполнителя рекомендую ещё и потому, что в процессе общения разговор идет хорошо, будто я общаюсь с давним другом.

Дмитрий К. Дмитрий Кир | Сейф Сейф

Отзыв фрилансера о заказчике Дмитрии Кире

Оплата
Постановка задачи
Четкость требований
Контактность

Советую этого работодателя, оплата как и договорились(+ частичная оплата НЕ через сейф) так что этому заказчику можно на 100% доверять
Задача с четким ТЗ, конечно были правки но они не большие, даже сказал бы мизерные
Всегда был на связи, не конфликтный добрый человек)
Если сомневаетесь в заказчике, мой вам совет - не сомневайтесь)

Владислав П. Владислав Переломов | Сейф Сейф



  1. 1 день1000 ₽
    Вардан Мхитарян
     2315  проверен   31  0   2

    Добрый день
    Работаю поэтапно или БС
    Огромный опыт работы
    Пишите обсудим
    Мой скайп – salvadordali.news
    Жду контакта чтобы задать свои вопросы.
    Интересует долгосрочное сотрудничество.
    Telegram - @mek2ireq

    Украина Киев | 19 января в 18:27 |
  2. ставка скрыта фрилансером