Парсинг Хабра
Нам нужен парсинг со структурированным, упорядоченным загрузкой всех публикаций Хабро, с картинками и комментариями. Все. Это вся суть проекта. Бюджет, пока скромный, предложите
Далее более детально+лирика+наступительные потенциальные проекты, если интересно
Как вариант, вот 2 упрощенные пути (или ваш авторский творческий подход) парсингу:
1. В гугле есть в открытом доступе скрипт, по запросу "как я парил Хабр". Здесь сценарий вытягивает только часть публикаций. Но нужна вся инфа. Можете его модифицировать
2. Самое легкое +качественное, в моем смысле, парсинг Хабру - это шаблон Зенки (или аналоги) по алгоритму "Mozilla Firefox-> Страница-> сохранить как PDF". Вопрос, сколько Gb таким хорошим парсингом будет весить...
Поэтому желательно, чтобы оба этих варианта парсинга были реализованы.
Так как до формата выходных данных первого варианта парсингу, проще GUI с фейсом, для ОФЛАЙН поиска прикрутить. Это может быть ещё одно из отдельных заявлений: фронтенд с тремя полями:
1. путь ко всем публикациям (лолярная директория или сервер:порт)
2. Поле ввода слова, словосочетание
3. поле для вывода результата поиска по имени файла
как кнопка для открытия (быстрого просмотра) одного из файлов результата (и если один дисплей может открыть 6-8 результатов поиска одновременно, с полосами прокрутки в каждом, для быстрого анализа, составки текстов), то производительность обучения будет расти в десятки раз! А софт-то простенький, на пару сотен срок кода большинство из которого уже давно существует в открытом доступе на Gihub!
А формат дающих из второго варианта парсингу - это качественный офлайн просмотр и чтение в PDF
// При парсинге необходимо, чтобы инфа загружалась и хранилась 30 дней хотя бы, с доступом 24/7 ; на триал (free) облачном сервере или Mega 20 Gb бесплатно. Для загрузки. Также есть безлименные облачные хранилища с триал периодом (если общая " вес" парсингу будет превышать лимит Mega)
Оплатить готов на протяжении 72 часов с момента этой публикации или с момента подтверждения исполнителя. Приоритет, при выборе исполнителя: на данный момент - это соотношение опыта и бюджета.
Предлагайте бюджет. Оплата напрямую, могу и в любой крипти. Показываете доказательства: ящики или видео с монитора, загружающиеся именно все публикации, а не половина и не без нескольких:) детали важны:) и получаете оплату + сам материал заказа - это мощная база для саморазвитки или организации обучения других!
P.S.: актуальным также будет проект по оптимизации/установке ОФЛАЙН чтения/поиск информации по Википедиям: Укр, Ру, Eng версии, с картинками, комментариями, лентами (он инфа). Инструкции и софт из GUI есть в свободном доступе
HTML или JavaScript
+
txt или word
+
На виході - дані всіх сторінок з публікаціями сайту Хабру в форматах:
HTML або JavaScript
+
txt або word
+
.pdf
-
161 Доброго дня!
Я python-програміст, візьму в роботу Ваш проект. Три роки працюю з Python:
-скріпти
-телеграм боти
-створення сайтів(фронт і бек)
-парсери
-створення десктопних програм.
У мене індивідуальний підхід до кожного проекту, тому пропоную почати нам знайомство і перейти до обговорення ділових відносин, а також реалізації вашого проекту у встановлені терміни.
-
1190 24 0 2 Доброго дня, досить цікавий проект для виконання. З парсингом знайомий, UI прикручу, інтернетом користуватися вмію. При хорошій комунікації, виконаю два способа за тиждень.
....Ціна вказана тільки за один спосіб....
-
278 Добрий день. Виконаю ваше замовлення. Гарантую адекватний зворотній зв'язок.
Актуальные фриланс-проекты в категории Парсинг данных
База сайтов на woocommerceНеобходимо собрать базу украинских сайтов интернет-магазинов на woocommerce с контактами, которые указаны на сайтах. Только работающие сайты (индикатор: обновление каталога/контента, рабочий домен) Формат таблицы - адрес сайта, номер телефона, e-mail. Парсинг данных ∙ 9 часов 10 минут назад ∙ 16 ставок |
Создать дашборд в https://airtable.com/ по результативности рекламных креативов из facebook adsПолноценное ТЗ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Базы данных и SQL, Парсинг данных ∙ 1 день 23 часа назад ∙ 17 ставок |
Создание файла Exel для загрузки товаров на сайты других партнеров.Меня интересует, чтобы сделать таблицу Excel со всеми параметрами. Вот сайт - https://heiztechnik.com.ua/ И позиции, которые интересуют, чтобы были перенесены : Ручные котлы : 1) TIS UNI 15-95 кВт (10) шт 2)TIS HARD 150-500 кВт (7) шт Пеллетные котлы: 1)TIS PELLET 15-95 кВт… Парсинг данных ∙ 2 дня 3 часа назад ∙ 34 ставки |
Требуется разработчик для парсинга каталога и автоматизации импорта данныхПодробное ТЗ в прикрепленном документе прошу в отклике указать ориентировочную стоимость и сроки реализации есть ли опыт работы с парсингом крупных каталогов какие возможные сложности или ограничения вы видите в данной задаче Базы данных и SQL, Парсинг данных ∙ 2 дня 6 часов назад ∙ 39 ставок |
Найти товарный фид (Google Merchant XML) для сайта на OpenCart
700 UAH
Необходимо найти прямую ссылку на действующий товарный фид (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Найти оригинальный фидТребования к результату: Рабочая ссылка на XML-файл Python, Парсинг данных ∙ 2 дня 11 часов назад ∙ 22 ставки |