Парсинг Хабра
Привіт
Потрібен парсинг зі структурованим, впорядкованим вивантаженням усіх публікацій Хабру, з картинками і коментарями. Все. Це вся суть проекту. Бюджет, поки що, скромний, пропонуйте
Далі більш детально+лірика+наступні потенційні проекти, якщо цікаво
Як варіант, ось 2 спрощені шляхи (або ваш авторський творчий підхід) парсингу:
1. В гуглі є у відкритому доступі скрипт , по запиту "как я парсил Хабр". Там скрипт тільки частину публікацій витягує. Але потрібна вся інфа. Можете його модифікувати
2. Найбільш легкий+якісний, в моєму розумінні, парсинг Хабру - це шаблон Зенки (або аналог) по алгоритму "Mozilla Firefox-> Сторінка-> зберегти як PDF". Питання скільки Gb такий якісний парсинг буде важити...
Тому бажано, щоб обидва цих варіанти парсінга було реалізовано.
Так як до формату вихідних данних першого варіанту парсингу, простіше GUI з фейсом , для ОФЛАЙН пошуку прикрутити. Це мабуть буде ще одне з окремих замовлень: фронтенд з 3ма полями:
1. шлях до всіх публікацій (локальна директорія або сервер:порт)
2. поле для вводу слова, словосполучення
3. поле для виводу результату пошуку з назвою файла,
як кнопкою для відкриття(швидкого перегляду) одного з файлів результату (а якщо в одному дисплеї можна буде відкрити 6-8 результатів пошуку одночасно, з полосами прокрутки в кожному, для швидкого аналізу, співставлення текстів), то освітня продуктивність зросте в десятки разів! А софт-то простенький, на пару сотен строк коду більшість з якого вже давно існує у відкритому доступі на Gihub!
А формат данних з другого варіанту парсингу - це якісний офлайн перегляд і читання в PDF
// Під час парсингу, необхідно, щоб інфа завантажувалась і зберігалась 30 днів хоча б, з доступом 24/7 ; на тріал (free) хмарному сервері або Mega 20 Gb безкоштовно . Для вивантаження. Також є безлімітні хмарні сховища з тріал періодом (якщо загальна " вага" парсингу буде перевищувати ліміт Mega)
Оплатити готовий на протязі 72 годин з моменту цієї публікації або з моменту ствердження виконавця. Пріоритет, при виборі виконавця: на данний момент - це співвідношення досвіду та бюджетності.
Пропонуйте бюджет. Постоплата напряму, можу і в будь якій крипті. Показуєте докази: скріни чи відео з монітора, що вивантажені саме всі публікації, а не половина і не без декількох 🙂 деталі важливі 🙂 і отримуєте оплату + сам матеріал замовлення - це потужна база для саморозвитку чи організації навчання інших!
P.S.: актуальним також буде проект по оптимізації/структуризації ОФЛАЙН читання/пошуку інформації по Вікіпедіям: Укр, Ру, Eng версіям, з картинками, коментарями, лінками (вся інфа). Інструкції і софт з GUI є у вільному доступі
На виході - дані всіх сторінок з публікаціями сайту Хабру в форматах:
HTML або JavaScript
+
txt або word
+
.pdf
-
161 Доброго дня!
Я python-програміст, візьму в роботу Ваш проект. Три роки працюю з Python:
-скріпти
-телеграм боти
-створення сайтів(фронт і бек)
-парсери
-створення десктопних програм.
У мене індивідуальний підхід до кожного проекту, тому пропоную почати нам знайомство і перейти до обговорення ділових відносин, а також реалізації вашого проекту у встановлені терміни.
-
1190 24 0 2 Доброго дня, досить цікавий проект для виконання. З парсингом знайомий, UI прикручу, інтернетом користуватися вмію. При хорошій комунікації, виконаю два способа за тиждень.
....Ціна вказана тільки за один спосіб....
-
278 Добрий день. Виконаю ваше замовлення. Гарантую адекватний зворотній зв'язок.
Актуальні фриланс-проєкти в категорії Парсинг даних
Svitlahata
750 UAH
Потрібно імпортувати 1819 товарів із XML/YML-фіду Prom.ua до OpenCart 3. Є готовий XML-файл, який містить назви товарів, описи, ціни, фотографії, характеристики, виробників та категорії. Необхідно: імпортувати всі товари до OpenCart 3; створити та прив’язати категорії;… CMS, Парсинг даних ∙ 6 годин 1 хвилина тому ∙ 23 ставки |
Парсинг даних через мобільне APIШукаю людину з досвідом парсингу даних через мобільне API, для парсингу e-commerce, rozetka та аналоги Завдання: 1. Перехоплення трафіку мобільного додатку (Android) налаштування проксі, аналіз запитів 2. Визначення потрібних API endpoints, куди йдуть запити, які headers… Python, Парсинг даних ∙ 2 дні тому ∙ 30 ставок |
Шукаю програміста або вайб-кодера для автоматизації збору даних 2https://drive.google.com/file/d/14tP5XWJB9acV4gn_cJrFwMpihUj3EbQz/view?usp=sharing я випадково на ту ссылку послав Веб-програмування, Парсинг даних ∙ 2 дні 3 години тому ∙ 39 ставок |
Створити дашборд у https://airtable.com/ по результативності рекламних креативів з facebook adsПовноцінне ТЗ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Бази даних та SQL, Парсинг даних ∙ 6 днів 21 година тому ∙ 20 ставок |
Створення файлу Exel для завантаження товарів на сайти інших партнерів.Мене цікавить щоб зробити табличку Exel з повністю всіма параметрами. Ось сайт -https://heiztechnik.com.ua/ І позиціії які цікавлять щоб були перенесенні : Ручні котли : 1) TIS UNI 15-95 кВт(10) шт 2)TIS HARD 150-500 кВт(7) шт Пелетні котли: 1)TIS PELLET 15-95 кВт(10) шт 2)TIS… Парсинг даних ∙ 7 днів 1 година тому ∙ 38 ставок |