Автоматична Генерація SFT Даних для LLM
Розробив скрипт для обробки кастомного текстового датасету (~400 записів) з використанням полегшеної мовної моделі. Створив рішення, що запускається в Google Colab, для автоматичної генерації нового CSV-датасету у форматі «питання-відповідь» на основі вихідних даних для подальшого навчання LLM.
Система здатна аналізувати кожен новий контекст, формувати релевантні питання та відповіді в реальному часі і ефективно працювати з великими обсягами даних.
Система здатна аналізувати кожен новий контекст, формувати релевантні питання та відповіді в реальному часі і ефективно працювати з великими обсягами даних.