HTML scraper for a CSV file or a spreadsheet (e.g Excel) to run on Mac
I need a simple HTML scraper for a CSV file or a spreadsheet (eg Excel) to run on MacOS. It can be in Python.
The HTML files being the contents of the Land and Mortgage Register of a given real estate in Poland are scrapped.
HTML files are located on the built-in disk in the MacOS computer, so you do NOT need a bot entering the site https://przegladarka-ekw.ms.gov.pl/eukw_prz/KsiegiWieczyste/wywarkaKW and filling in reCAPTCHA.
The goal of the scraper:
Export data to one spreadsheet
Additional information and functions:
- input files are named according to the number of the Land and Mortgage Register. Because there are 3 files for one number, the number is followed by the characters "-1", "-2" and "-3" - depending on the number of the input file. You can change the names - if necessary. Example: KR1P/00445050/1-1; KR1P/00445050/1-2; KR1P/00445050/1-3.
- 3 HTML files (file 1 - main, file 2, file 3) contain data that is exported to multiple columns in one row of the spreadsheet. Each column is different data from these files. It is possible that there will be no data to download in one file - then the script inserts the "-" character in the given cells and the data will come from two files.
- For each issue of the Land and Mortgage Register, the structure of three HTML files is the same, although for different numbers they differ eg in content (text) and may differ eg in the number of rows (eg Three mortgages are entered, instead of one). The difference in the number of poems, therefore, consists in duplicating the first line - depending on the content of the given Land and Mortgage Register.
- some source files (about 20% of them) have a certain string (expression) that qualifies the HTML file so that it does not check the next two files for a given number of the Land and Mortgage Register. Then the script scraper only this one file and exports the data to an automatically created, new, one spreadsheet. This one file will be used for all of the situations described above. There is no need to create more than one file. The sheet will consist of one column. In each row, the numbers of Land and Mortgage Registers visible in file 1 will be imported.
I have a list of all expressions/words that appear in files so that on the equality sign, the script can adjust its operation.
Suggestions:
1. Semi-ready scripts are available at:
a) https://medium.freecodecamp.org/how-to-scrape-websites-with-python-and-beautifulsoup-5946935d93fe
b) BeautifulSoup
c) https://scrapy.org
When I receive an e-mail address, I will send:
- HTML source files
- final file (spreadsheet), which is a template - what should the file with the imported data look like. The target format is .csv or .xls
The matter is urgent and I need a script as soon as possible.
I'm asking for:
- valuation
- time limit for completion
- method of settlement
- e-mail address
Please check the video instruction and send me a valuation.
If any questions please ask me.
Общение предпочтительно на английском, но можно и на русском.
Актуальные фриланс-проекты в категории Python
Разработка программного обеспечения с ИИНеобходимо разработать программное обеспечение для автоматического обнаружения, захвата и сопровождения объекта с помощью видеокамеры и поворотного механизма.Исходные данные: Видеокамера с оптикой. Поворотное устройство по двум осям (азимут/угол места). Сервоприводы с… AI и машинное обучение, Python ∙ 3 часа 12 минут назад ∙ 6 ставок |
ТЗ НА ДОПРАЦЮВАНИЕ AI-БОТА ГЕНЕРАЦИИ ЛИЧНЫХ ПЕСЕНТЗ НА ДОПРАЦЮВАННЯ AI-БОТА ГЕНЕРАЦІЇ ПЕРСОНАЛЬНИХ ПІСЕНЬГОЛОВНА ЦІЛЬ Створити стабільний преміальний продукт, який: генерує максимально якісні персональні пісні; не вигадує факти про клієнта; працює стабільно під навантаженням; легко масштабується; дозволяє аналізувати та… Python, Разработка ботов ∙ 4 часа 17 минут назад ∙ 17 ставок |
Специалист по Excel / автоматизации процессов (Excel + желательно программирование)Ищем специалиста с ПРОДВИНУТЫМИ знаниями Excel для оптимизации существующего файла и автоматизации процессов. Будет большим преимуществом, если вы также имеете навыки программирования / VBA / Power Query / Power Automate или опыт создания сложной логики в Excel. Задачи проекта… Python, Базы данных и SQL ∙ 7 часов 16 минут назад ∙ 26 ставок |
Автоматизация процессоів через API и PhytonНиже описал текущий процесс и то, к какому результату хотелось бы прийти. Также прикладіваю файлы реалтного процесса чтобы лучше понять как он выглядит в ревльности Текущий процесс Сейчас весь процесс выполняется вручную: загрузка/выгрузка файлов, перенос данных между… AI и машинное обучение, Python ∙ 8 часов 17 минут назад ∙ 32 ставки |
Необходимо создать бота в ТГ для оплаты подписки.
2000 UAH
Необходимо создать бота в телеграме, где пользователь сможет оформить подписку на доступ к веб-камерам, которые находятся во дворе. Организовать в боте оплату двух видов подписок (на месяц и на один день). Бот должен автоматически проверять оплату и после выдавать ссылку-доступа. Python, Разработка ботов ∙ 21 час 4 минуты назад ∙ 71 ставка |