Я розробив систему візуального аналізу за допомогою Qwen2-VL, мультимодальної моделі штучного інтелекту від Alibaba через Hugging Face. Система приймає зображення та текстове запитання («Що не так із тактикою?») і надає глибокий аналіз, поєднуючи комп'ютерний зір та обробку природної мови.