HTML scraper for a CSV file or a spreadsheet (e.g Excel) to run on Mac
I need a simple HTML scraper for a CSV file or a spreadsheet (eg Excel) to run on MacOS. It can be in Python.
The HTML files being the contents of the Land and Mortgage Register of a given real estate in Poland are scrapped.
HTML files are located on the built-in disk in the MacOS computer, so you do NOT need a bot entering the site https://przegladarka-ekw.ms.gov.pl/eukw_prz/KsiegiWieczyste/wywarkaKW and filling in reCAPTCHA.
The goal of the scraper:
Export data to one spreadsheet
Additional information and functions:
- input files are named according to the number of the Land and Mortgage Register. Because there are 3 files for one number, the number is followed by the characters "-1", "-2" and "-3" - depending on the number of the input file. You can change the names - if necessary. Example: KR1P/00445050/1-1; KR1P/00445050/1-2; KR1P/00445050/1-3.
- 3 HTML files (file 1 - main, file 2, file 3) contain data that is exported to multiple columns in one row of the spreadsheet. Each column is different data from these files. It is possible that there will be no data to download in one file - then the script inserts the "-" character in the given cells and the data will come from two files.
- For each issue of the Land and Mortgage Register, the structure of three HTML files is the same, although for different numbers they differ eg in content (text) and may differ eg in the number of rows (eg Three mortgages are entered, instead of one). The difference in the number of poems, therefore, consists in duplicating the first line - depending on the content of the given Land and Mortgage Register.
- some source files (about 20% of them) have a certain string (expression) that qualifies the HTML file so that it does not check the next two files for a given number of the Land and Mortgage Register. Then the script scraper only this one file and exports the data to an automatically created, new, one spreadsheet. This one file will be used for all of the situations described above. There is no need to create more than one file. The sheet will consist of one column. In each row, the numbers of Land and Mortgage Registers visible in file 1 will be imported.
I have a list of all expressions/words that appear in files so that on the equality sign, the script can adjust its operation.
Suggestions:
1. Semi-ready scripts are available at:
a) https://medium.freecodecamp.org/how-to-scrape-websites-with-python-and-beautifulsoup-5946935d93fe
b) BeautifulSoup
c) https://scrapy.org
When I receive an e-mail address, I will send:
- HTML source files
- final file (spreadsheet), which is a template - what should the file with the imported data look like. The target format is .csv or .xls
The matter is urgent and I need a script as soon as possible.
I'm asking for:
- valuation
- time limit for completion
- method of settlement
- e-mail address
Please check the video instruction and send me a valuation.
If any questions please ask me.
Общение предпочтительно на английском, но можно и на русском.
Актуальні фриланс-проєкти в категорії Python
Розробка програмного забезпечення з ШІПотрібно розробити програмне забезпечення для автоматичного виявлення, захоплення та супроводження об'єкта за допомогою відеокамери та поворотного механізму.Вихідні дані: Відеокамера з оптикою. Поворотний пристрій по двох осях (азимут/кут місця). Сервоприводи з керуванням через… AI та машинне навчання, Python ∙ 14 годин 56 хвилин тому ∙ 12 ставок |
ТЗ НА ДОПРАЦЮВАННЯ AI-БОТА ГЕНЕРАЦІЇ ПЕРСОНАЛЬНИХ ПІСЕНЬТЗ НА ДОПРАЦЮВАННЯ AI-БОТА ГЕНЕРАЦІЇ ПЕРСОНАЛЬНИХ ПІСЕНЬГОЛОВНА ЦІЛЬ Створити стабільний преміальний продукт, який: генерує максимально якісні персональні пісні; не вигадує факти про клієнта; працює стабільно під навантаженням; легко масштабується; дозволяє аналізувати та… Python, Розробка ботів ∙ 16 годин 1 хвилина тому ∙ 30 ставок |
Спеціаліст з Excel / автоматизації процесів (Excel + бажано програмування)Шукаємо спеціаліста з ПРОСУНУТИМИ знаннями Excel для оптимізації існуючого файлу та автоматизації процесів. Буде великою перевагою, якщо ви також маєте навички програмування / VBA / Power Query / Power Automate або досвід створення складної логіки в Excel. Завдання проекту Є… Python, Бази даних та SQL ∙ 19 годин 33 секунди тому ∙ 32 ставки |
Автоматизація процесів через API та PythonНижче описав поточний процес і те, до якого результату хотілося б прийти. Також прикладаю файли реального процесу, щоб краще зрозуміти, як він виглядає в реальності Поточний процес Зараз весь процес виконується вручну: завантаження/вивантаження файлів, перенесення даних… AI та машинне навчання, Python ∙ 20 годин 1 хвилина тому ∙ 41 ставка |
Потрібно створити бот в тг для оплати підписки.
2000 UAH
Потрібно створити бот в телеграмі де користувач зможе оформити підписку на доступ до веб камер котрі знгаходяться у дворі. Організувати в боті оплату двух видів підписок (на місяць і на один день). Бот повинен автоматично перевірити оплату і після видавати посилання-доступу Python, Розробка ботів ∙ 1 день 8 годин тому ∙ 78 ставок |