Парсер профілів Instagram
Опис проєкту:
Розробив високопродуктивний парсер профілів Instagram, який зібрав понад 15 000 профілів для аналітики та бізнес-завдань.
Парсер автоматично проходив по списку користувачів, витягував публічну інформацію — ім’я, опис профілю (bio), кількість підписників/підписок, посилання на зовнішні ресурси (сайт, контакти), список відкритих постів та метадані — та зберігав результат у зручному форматі для подальшої обробки (CSV/SQLite/Excel).
Проєкт задумано з урахуванням реалій масштабного збору даних: обробка великих черг, стійкість до тимчасових блокувань, акуратне поводження з таймінгами та повага до обмежень платформи.
Функціональність:
Масовий збір даних з профілів Instagram (понад 15 000 профілів).
Витяг: ім’я, нік, біографія, кількість підписників/підписок, кількість постів, посилання в профілі, контактні дані (якщо доступні).
Підтримка як відкритих, так і частково приватних профілів (в межах дозволеного).
Ротація User-Agent та проксі для зниження ризику блокувань.
Асинхронна обробка задач із семафорами — контроль паралелізму для стабільності.
Повторні спроби та детальний логінг помилок (timeout, captchas, 429).
Збереження результатів у CSV/SQLite/Excel, дедуплікація та валідація даних.
Можливість фільтрації і попередньої обробки (наприклад, відбір акаунтів за кількістю підписників або мовою біо).
Розробив високопродуктивний парсер профілів Instagram, який зібрав понад 15 000 профілів для аналітики та бізнес-завдань.
Парсер автоматично проходив по списку користувачів, витягував публічну інформацію — ім’я, опис профілю (bio), кількість підписників/підписок, посилання на зовнішні ресурси (сайт, контакти), список відкритих постів та метадані — та зберігав результат у зручному форматі для подальшої обробки (CSV/SQLite/Excel).
Проєкт задумано з урахуванням реалій масштабного збору даних: обробка великих черг, стійкість до тимчасових блокувань, акуратне поводження з таймінгами та повага до обмежень платформи.
Функціональність:
Масовий збір даних з профілів Instagram (понад 15 000 профілів).
Витяг: ім’я, нік, біографія, кількість підписників/підписок, кількість постів, посилання в профілі, контактні дані (якщо доступні).
Підтримка як відкритих, так і частково приватних профілів (в межах дозволеного).
Ротація User-Agent та проксі для зниження ризику блокувань.
Асинхронна обробка задач із семафорами — контроль паралелізму для стабільності.
Повторні спроби та детальний логінг помилок (timeout, captchas, 429).
Збереження результатів у CSV/SQLite/Excel, дедуплікація та валідація даних.
Можливість фільтрації і попередньої обробки (наприклад, відбір акаунтів за кількістю підписників або мовою біо).