Advocaat.be Скребок
Цей проект є веб-скрейпером на базі Django, розробленим для збору даних про адвокатів з бельгійського довідника advocaat.be.
Процес збору даних поділений на два етапи:
Збір посилань: Проходження по сторінках пошуку для збору базової інформації (імена, посилання на профілі) та збереження їх у базу даних PostgreSQL.
Збагачення даних: Відвідування кожного зібраного профілю для витягнення детальної інформації (email, телефони, спеціалізації, мови, членство в колегіях тощо).
Процес збору даних поділений на два етапи:
Збір посилань: Проходження по сторінках пошуку для збору базової інформації (імена, посилання на профілі) та збереження їх у базу даних PostgreSQL.
Збагачення даних: Відвідування кожного зібраного профілю для витягнення детальної інформації (email, телефони, спеціалізації, мови, членство в колегіях тощо).