Парсинг базы
Требования к каналам:
1. Язык контента:
Русский или украинский
(допускается смешанный контент RU/UA)
2. Количество подписчиков:
Не менее 500 подписчиков
3. Активность:
Последний пост опубликован не позднее чем 32 часа назад
4. Комментарии:
В канале должны быть открыты комментарии под постами (через группу или встроенные)
5. Количество:
Минимум 15000 строк
6. Тематика:
Война, новости, политика, драки, трэш/жесть, спорт, автомобили, крипта, рыбалка и другие
Данные, которые нужно собрать по каждому каналу
Обязательные поля:
Название канала
username (ссылка)
Количество подписчиков
Тематика (новости, крипта, юмор, бизнес и т.д.)
Язык (RU / UA / MIX)
Дата и время последнего поста
Файл в формате:
Google Sheets / Excel (.xlsx)
-
Здравствуйте! Готов взять Ваш проект, выполню в срочном порядке. Опыт работы с подобными заданиями огромный, трудностей не возникнет. Если я Вас заинтересовал, пишите, рад сотрудничать!
-
Увидев задачу — нужно собрать базу Telegram-каналов по конкретным фильтрам: от 500 подписчиков, активность до 32 часов, открытые комментарии, тематики война и новости.
Понятно, что здесь главное — не просто наскрести ссылки, а получить чистую базу без дубликатов и мертвых каналов.
Сделаю все под Google Таблицу/Excel с колонками: название, ссылка, количество подписчиков, последняя дата поста, тематика.
Подход:
Сбор через поиск Telegram по ключевым словам и хештегам
Проверка каждого канала на критерии (подписчики ≥500, активность ≤32 ч)
… Фильтр открытых комментариев
Чистка от дубликатов и неактивных
Имел опыт со сбором баз каналов и групп — вручную и автоматизированно, понимаю, где она ломается (Telegram отсекает часть результатов поиска, поэтому копаю глубже).
Сейчас полностью свободен — стартую сегодня и до конца дня скину первую партию, чтобы вы оценили качество. Полная база — за 2 дня.
Напишите, сколько каналов ориентировочно нужно — тогда смогу точно сказать по сроку. Или можете сразу согласовать условия, и я начинаю.
-
472 2 0 Здравствуйте! Могу собрать базу Telegram-каналов по вашим критериям и предоставить в Google Sheets / Excel.
Как я вижу работу:
1. Сбор каналов по тематическим ключам и категориям: новости, политика, спорт, авто, крипта, трэш/жесть, рыбалка и т.д.
2. Проверка каждого канала по условиям: RU/UA/MIX, от 500 подписчиков, последний пост не старше 32 часов, открытые комментарии.
3. Дедупликация, чтобы не было повторов одного и того же канала.
4. Заполнение колонок: название, username/ссылка, подписчики, тематика, язык, дата и время последнего поста.
5. Подготовка финального файла в Google Sheets или .xlsx.
… Могу сделать аккуратно, без мертвых каналов и без случайного мусора. Если нужны именно 15000+ строк, лучше сразу согласовать тематики и источники поиска, чтобы база была не просто большой, а пригодной для использования.
Ориентировочно 5 дней, 3000 грн.
-
961 11 0 Здравствуйте.
Есть опыт сбора и обработки больших баз данных Telegram-каналов. Могу реализовать парсинг с фильтрацией по подписчикам, активности и наличию комментариев. Результат предоставлю в структурированном формате Excel/Google Sheets в соответствии с требованиями.
-
250 Добрый день! Ознакомился с заданием — реализую. Сделаю парсер на Python через Telethon, который соберет каналы по заданным тематикам с фильтрацией по языку, количеству подписчиков и активности. Все обязательные поля — название, username, подписчики, тематика, язык, дата последнего поста — сохраню в Excel или Google Sheets. 15000 строк с учетом всех фильтров — реальный объем. Уточните, пожалуйста — нужна разовая выборка или регулярное обновление базы? Готов взяться.
-
3015 24 0 1 Здравствуйте! Задание понятное. У меня есть опыт парсинга Telegram-каналов через официальное API (Telethon/Pyrogram), поэтому я соберу базу быстро и без риска пропуска критериев. Подскажите, пожалуйста, сбор планируется по вашему готовому списку гео-локаций/ключевых слов, или мне искать каналы самостоятельно по указанным тематикам?
-
650 2 0 Добрый день!
Соберу базу Telegram-каналов по вашим критериям — 15 000+ строк в Excel. Парсингом Telegram занимаюсь, задача понятна.
По каждому каналу в таблицу: название, username/ссылка, количество подписчиков, тематика, язык (RU/UA/MIX), дата и время последнего поста. С фильтрацией под ваши условия: ≥500 подписчиков, последний пост ≤32 часа, открытые комментарии (через группу или встроенные), нужные тематики (война, новости, политика, трэш, спорт, авто, крипта, рыбалка и т.д.).
Честно по одному моменту, чтобы ожидания совпали: 15 000+ каналов — большой объем, а в Telegram нет глобального каталога, так что собираю через поиск по ключевым словам/тематикам + связанные каналы (похожие/рекомендуемые), с задержками, чтобы сессии не ловили флуд-лимиты. Объем реальный, но набирается порциями, не мгновенно. Проверку активности (≤32 часа) и открытых комментариев делаю автоматически при сборе.
Удобно начать с тестовой партии (~300-500 каналов), чтобы вы оценили формат и качество фильтрации, а дальше добить до 15к. Детали с удовольствием согласуем в личных.
-
727 6 0 Привет, сделаю быстро, обращайтесь
_______________________________________
-
656 9 0 Доброго дня, Вика! Загалом задание понятное, для точного ответа по срокам и цене, хотелось бы уточнить некоторые вопросы, которые у меня возникли после анализа вашего задания. Пишите в личные сообщения – обсудим детали и ваши пожелания.
-
379 Есть опыт сбора информации из различных источников (в том числе - с Ютуба)
-
1009 2 0 Здравствуйте! Я понял задачу: нужно собрать базу Telegram-каналов по указанным критериям (от 500 подписчиков, активность до 32 часов, открытые комментарии, тематики — война, новости, политика и т.д.) и выгрузить данные в Google Sheets или Excel. Мой подход: использую парсинг через Telegram API, фильтрую каналы по языку (RU, UA, MIX), количеству подписчиков и времени последнего поста. Собираю обязательные поля: название, username, количество подписчиков, тематику, язык и дату последнего поста. Гарантирую минимум 15000 строк в чистом .xlsx файле. Уточните, есть ли конкретные требования к распределению по тематикам или языкам?
-
4975 41 4 1 Доброго дня!
Профессионально занимаюсь парсингом и автоматизацией данных. Готов реализовать сбор базы Telegram-каналов согласно ТЗ. Имею опыт работы с Telegram API, большими объемами данных, экспортом в Google Sheets/Excel и прокси.
Напишите мне в личные сообщения, уточним детали.
-
702 1 0 Здравствуйте! У меня есть опыт парсинга данных. Мои работы вы можете посмотреть в портфолио. Предлагаю лояльную цену и качественную работу. Пишите)
-
693 4 0 Добрый день. Готов выполнить задание. Для некоторых уточнений напишите, пожалуйста, в личные сообщения.
-
3152 15 0 Добрый день.
Ранее занимался сбором данных в Excel файлы. Готов быстро выполнить задачу.
Буду благодарен за сотрудничество.
-
172 Я NodeJS разработчик. Готов взяться за эту задачу. Пишите, обсудим
-
12912 67 0 Здравствуйте! Выполню ваше задание быстро и качественно.
Мои последние работы
https://indexfast.pp.ua - быстрая индексация сайта
https://mono-bank.pp.ua - все о монобанке
https://mamamia.pp.ua - интернет-магазин
https://programist.pp.ua/ua/portfolio/ - портфолио работ
https://monitortest.pp.ua - тестирование монитора
https://keytest.pp.ua - тестирование клавиатуры
… https://pctest.pp.ua - тестирование компьютера
https://vseetut.matviy.pp.ua - верстка
Мое портфолио: https://freelancehunt.com/ua/freelancer/romas6ka.html#portfolio
Пишите, начну сегодня работать. Буду рад сотрудничеству с Вами!
-
807 22 0 Добрый день!
Меня заинтересовал ваш проект. У меня есть опыт сбора и структурирования больших массивов данных из открытых источников, включая Telegram-каналы, социальные сети и тематические каталоги.
Я могу сформировать базу Telegram-каналов в соответствии с вашими критериями: язык контента (RU/UA/MIX), минимум 500 подписчиков, активность (последняя публикация не позднее 32 часов), наличие открытых комментариев, а также тематическая классификация (новости, политика, крипта, спорт, авто, трэш и т.д.).
Для сбора данных использую открытые аналитические каталоги Telegram (типа TGstat/аналогов), ручную проверку каналов, а также дополнительную валидацию активности и комментариев. Все данные будут очищены от дубликатов и структурированы в Google Sheets или Excel в нужном формате.
Результат будет включать:
… • название канала;
• username/ссылка;
• количество подписчиков;
• тематика;
• язык контента;
• дата и время последнего поста.
-
Задайте ваш вопрос заказчику