Парсинг данных из корпуса и создание интерактивной системы
Создан проект, в котором осуществляется:
- регулярная автоматическая выгрузка корпусов Parliamentary Corpora;
- извлечение необходимых данных (текстовых единиц) из естественных текстов;
- различный языковой анализ текстовых единиц;
- представление всех данных в виде интерактивного графа, с возможностью отслеживать все связи, местонахождение в тексте и осуществлять поиск и анализ данных по доступным параметрам.
- регулярная автоматическая выгрузка корпусов Parliamentary Corpora;
- извлечение необходимых данных (текстовых единиц) из естественных текстов;
- различный языковой анализ текстовых единиц;
- представление всех данных в виде интерактивного графа, с возможностью отслеживать все связи, местонахождение в тексте и осуществлять поиск и анализ данных по доступным параметрам.