Есть отсканированная англоязычная книга и ее текстовая копия в вордовском документе.
В книге значительная часть картинок и сокращений.
Текст однотипный, ФИО, родился, учился, работал, заработал, умер.
Нужно сделать:
1. Удалить картинки и их описание.
2. Просмотреть наличие грубых ошибок.
В данном случае важны ФИО художника и год рождения.
2. Раскрыть сокращения.
В начале книги есть список всех сокращений. Сокращения меняются по средствам ворда найти"А" заменить на "Б"
3. Перевести текст в гугл-переводчике на русский, проверить грубые ошибки и предоставить его в вордовском документе, в таком формате. http://socrealism.com.ua/gallery/artist/averkov-pp-1924
4. ФИО художника и город где он работал должны быть переведены на русский украинский и английский. Жирным выделять не нужно.
Работу думаю разумно поделить на несколько этапов.
Я прикрепил:
1. Исходник, фотокопию в формате PDF. (Сюда не грузится, поэтому даю ссылку https://cloud.mail.ru/public/9g6z/RZ4XLDtdz)
2. Обработанный Abbyy finereader 12 текст.
3. Промежуточный результат.
4. То что должно получится выглядит так: http://socrealism.com.ua/gallery/artist/averkov-pp-1924