HTML scraper for a CSV file or a spreadsheet (e.g Excel) to run on Mac
I need a simple HTML scraper for a CSV file or a spreadsheet (eg Excel) to run on MacOS. It can be in Python.
The HTML files being the contents of the Land and Mortgage Register of a given real estate in Poland are scrapped.
HTML files are located on the built-in disk in the MacOS computer, so you do NOT need a bot entering the site https://przegladarka-ekw.ms.gov.pl/eukw_prz/KsiegiWieczyste/wywarkaKW and filling in reCAPTCHA.
The goal of the scraper:
Export data to one spreadsheet
Additional information and functions:
- input files are named according to the number of the Land and Mortgage Register. Because there are 3 files for one number, the number is followed by the characters "-1", "-2" and "-3" - depending on the number of the input file. You can change the names - if necessary. Example: KR1P/00445050/1-1; KR1P/00445050/1-2; KR1P/00445050/1-3.
- 3 HTML files (file 1 - main, file 2, file 3) contain data that is exported to multiple columns in one row of the spreadsheet. Each column is different data from these files. It is possible that there will be no data to download in one file - then the script inserts the "-" character in the given cells and the data will come from two files.
- For each issue of the Land and Mortgage Register, the structure of three HTML files is the same, although for different numbers they differ eg in content (text) and may differ eg in the number of rows (eg Three mortgages are entered, instead of one). The difference in the number of poems, therefore, consists in duplicating the first line - depending on the content of the given Land and Mortgage Register.
- some source files (about 20% of them) have a certain string (expression) that qualifies the HTML file so that it does not check the next two files for a given number of the Land and Mortgage Register. Then the script scraper only this one file and exports the data to an automatically created, new, one spreadsheet. This one file will be used for all of the situations described above. There is no need to create more than one file. The sheet will consist of one column. In each row, the numbers of Land and Mortgage Registers visible in file 1 will be imported.
I have a list of all expressions/words that appear in files so that on the equality sign, the script can adjust its operation.
Suggestions:
1. Semi-ready scripts are available at:
a) https://medium.freecodecamp.org/how-to-scrape-websites-with-python-and-beautifulsoup-5946935d93fe
b) BeautifulSoup
c) https://scrapy.org
When I receive an e-mail address, I will send:
- HTML source files
- final file (spreadsheet), which is a template - what should the file with the imported data look like. The target format is .csv or .xls
The matter is urgent and I need a script as soon as possible.
I'm asking for:
- valuation
- time limit for completion
- method of settlement
- e-mail address
Please check the video instruction and send me a valuation.
If any questions please ask me.
Общение предпочтительно на английском, но можно и на русском.
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Potrzebny parser sklepu internetowego https://www.lcsc.com/należy regularnie (1 raz w miesiącu, lub przy uruchomieniu skryptu) uzyskiwać aktualne informacje o produktach dostępnych w sklepie https://www.lcsc.com/ z katalogu wszystkich działów… Parsowanie danych ∙ 9 godzin 48 minut temu ∙ 34 oferty |
OpenCart — katalog wynajmu sprzętu specjalistycznego
493 PLN
OpenCart — katalog wynajmu sprzętu specjalistycznegoPotrzebne jest uruchomienie katalogu wynajmu sprzętu specjalistycznego na OpenCart.Tematyka:koparkipodnośnikiładowarkigeneratorydźwigirusztowaniainny sprzęt budowlany.Preferowane, abyście mieli już gotowy szablon lub… Programowanie stron internetowych, Parsowanie danych ∙ 1 dzień 2 godziny temu ∙ 47 ofert |
Przenieść program - serwer, na którym był program, padł (oficjalne dozwolone parsowanie danych publicznych)
169 PLN
Witaj! Mój klient ma przypadek opisany poniżej. Potrzebna pomoc w przeniesieniu na nowy serwer i przetestowaniu programu. Lepiej, aby to był programista, który zna się na parsowaniu. Konfigurowanie oprogramowania i serwerów, Parsowanie danych ∙ 1 dzień 6 godzin temu ∙ 28 ofert |
Parsowanie stronyWymagana jest implementacja 4 parserów (strony katalogowe) Jest specyfikacja, jest przykład kodu jako referencja. Do zadań należy: Napisanie parsera Podłączenie proxy Logika deduplikacji (przeniesienie logiki z przykładu) Logika haszowania według 3 pól Parser powinien… Parsowanie danych ∙ 2 dni 22 godziny temu ∙ 44 oferty |
Zbieranie (parsowanie) bazy towarów z witryn dostawców (Excel / CSV)
822 PLN
Zbieranie bazy produktów z witryn dostawców (Excel / CSV)Dzień dobry.Potrzebny jest specjalista do zbierania i strukturyzowania danych z kilku witryn dostawców, do których dostęp zostanie zapewniony.Zadanie:Należy stworzyć jednolitą bazę produktów w formacie Excel (XLSX) lub… Programowanie stron internetowych, Parsowanie danych ∙ 4 dni 6 godzin temu ∙ 105 ofert |