Poprawić parsowanie danych w Excelu
"Specjalista" na freelancehunt wykonał parsowanie danych do Excela:
- poprawić błędy (1 przykład załączony)
- zoptymalizować pracę, aby parsowanie działało 24/7 bez przerw, obecnie po kilku dniach zdalny komputer przestaje działać (prawdopodobnie z powodu rozmiaru Google Excel)
Załączniki 1
-
Aby dokładnie ocenić koszt, należy przejrzeć kod parsera
Jestem gotów Ci pomóc już teraz
Proszę o przesłanie kodu do przeglądu
-
Dzień dobry. Aby ocenić koszt i ogólnie to, czy podejmę się wykonania tego zadania, muszę dowiedzieć się więcej szczegółów.
-
213 1 0 «Witam! Zapoznałem się z Twoim zadaniem oraz błędem WinError 10061. Występuje on z powodu przerwania połączenia między sterownikiem przeglądarki a skryptem podczas długotrwałej pracy.
Jak proponuję rozwiązać problem:
Stabilność 24/7: Dodam do kodu obsługę wyjątków (Error Handling). Jeśli skrypt straci połączenie, automatycznie zrestartuje sesję bez Twojego udziału.
Optymalizacja zapisu: Wprowadzę buforowe zapisywanie. Dane będą najpierw zbierane lokalnie, a następnie ładowane do Google Sheets dużymi blokami. To rozwiąże problem z "ciężką" tabelą.
Audyt: Sprawdzę obciążenie pamięci zdalnego PC, aby wyeliminować przyczynę zawieszania się.
Warunki:
Koszt: 1500 zł (przez Sejf).
… Termin: 1-2 dni na poprawki i testowanie.
Jestem gotów rozpocząć pracę od razu po uzyskaniu dostępu do kodu.»
-
367 1 0 Dobry wieczór!
Mam doświadczenie w poprawianiu i optymalizacji istniejących parserów, w tym tych, które zostały zrealizowane za pomocą Excel / Google Sheets i mają problemy ze stabilnością przy długotrwałej pracy.
Dobrze rozumiem typową sytuację, kiedy:
parser działa przez kilka godzin/dni,
potem zdalny komputer zaczyna "siadać",
Google Excel/Sheets rozrasta się i staje się wąskim gardłem (pamięć, limity, synchronizacja).
Co mogę zrobić:
Rozebrać i poprawić błędy logiczne parsowania
przeanalizować załączony przykład błędu;
… sprawdzić obsługę wyjątków, duplikaty, awarie w formatowaniu danych;
poprawić niepoprawny zapis w tabeli.
Optymalizować architekturę pod pracę 24/7
wynieść gromadzenie danych z Google Excel do bardziej stabilnego magazynu (lokalna baza danych / pliki / kolejki);
zmniejszyć liczbę operacji zapisu w Google Sheets;
dodać kontrolę pamięci, restarty procesu, logowanie błędów;
uczynić parser stabilnym do długotrwałej ciągłej pracy.
Zmniejszyć zależność od zdalnego komputera
przeanalizować, dlaczego system "siada" po kilku dniach;
zaproponować rozwiązanie, które nie wymaga stałej ręcznej kontroli.
Wynik:
poprawione błędy parsowania;
stabilna praca 24/7 bez awarii;
zalecenia lub wdrożenie optymalnego schematu przechowywania danych;
minimalizacja obciążenia Google Excel.
Na początek potrzebne są:
dostęp do aktualnego rozwiązania (skrypt/Excel/opis logiki);
zrozumienie, jaki zakres danych gromadzi się w ciągu doby;
gdzie dokładnie teraz uruchamiany jest parser (lokalnie / VPS / zdalny komputer).
Jestem gotowa podłączyć się i uporządkować rozwiązanie.
-
150 Witam!
Mogę pomóc poprawić parsowanie danych w Excelu/Google Sheets.
Proszę wyjaśnić, w jaki sposób obecnie działa parser (jaki kod/jaki instrument jest używany — Python, Google Apps Script, inne?), i w jaki sposób występują awarie (upadki, zawieszanie się).
Mogę:
- sprawdzić kod parsera
- zoptymalizować logikę przetwarzania danych
… - zaproponować sposób, aby skrypt działał stabilniej
Dziękuję!
-
172 1 1 Witaj! Jestem gotów zrealizować ten projekt, mam duże doświadczenie w tworzeniu różnych aplikacji.
-
264 Witam. Zapoznałem się z zadaniem i przykładem błędu.
Mogę poprawić błędy w obecnym parserze i zoptymalizować jego działanie, aby działał stabilnie 24/7. Usunę przyczyny zawieszeń i awarii podczas długotrwałego wykonywania, zmniejszę obciążenie systemu i dodam poprawną obsługę błędów.
W razie potrzeby skonfiguruję logowanie i automatyczne przywracanie działania, aby proces się nie zatrzymywał.
Jestem gotów przejrzeć kod i szybko zaproponować rozwiązanie.
-
957 5 0 1 Dobry wieczór.
Nazywam się Ołeksij.
Jestem gotów poprawić wszystkie błędy i ulepszyć kod (jeśli to możliwe),
jestem gotów wszystko wykonać szybko i jakościowo, ponieważ wielokrotnie pracowałem z Google Sheets.
Wykonam wszystko w ciągu dnia!
Z poważaniem Ołeksij.
Będę zadowolony ze współpracy!
-
434 9 0 Dobry wieczór. Jeśli skrypt jest napisany w pythonie, to mogę go poprawić.
-
2283 25 1 Cześć, programista python z doświadczeniem ponad 5 lat, rozumiem, że na zrzucie ekranu używane jest selenium, możemy omówić albo ulepszenia, albo po prostu rozwiązanie problemu z zachowaniem sesji przeglądarki i ponownym uruchamianiem przy awariach. Piszcie na prywatne, omówimy szczegóły, będę zadowolony ze współpracy!
-
411 Cześć. Mogę przejąć i doprowadzić ten parsing do normalnego „24/7”, ale ważne jest, aby nie łatać Excela, a usunąć przyczynę awarii.
Z tego, co opisałeś, problem jest typowy: Google Sheets/Excel jako „baza danych” rozrasta się, zaczyna zwalniać, limity/kwoty/pamięć, i w pewnym momencie wszystko się sypie razem z zdalnym komputerem.
Co zrobię:
szybko przejrzę błędy w formułach/parserze (jak w twoim przykładzie) i poprawię logikę
dodam normalne logowanie + automatyczne ponowne uruchamianie, aby skrypt sam się uruchamiał po awariach
…
optymalizuję zapis danych: w partiach, bez zbędnych przeliczeń/formatań, aby nie „zabijać” tabeli
jeśli tabela jest już duża — zaproponuję odpowiednią opcję dla 24/7: przechowywanie danych w bazie danych (PostgreSQL/SQLite) lub przynajmniej w plikach (CSV/JSON) + w Google Sheets oddawanie tylko „witryny” (ostatnie N wierszy / agregaty)
Wyjaśnię wprost: zrobienie stabilnego 24/7 parsowania, które pisze nieskończoność w Google Sheets, — prawie zawsze zły pomysł. Do ciągłej pracy potrzebne jest miejsce do przechowywania, które jest do tego stworzone.
Na początek potrzebuję: dostępu do pliku/skryptu, krótkiego opisu, gdzie jest uruchamiane (Windows/VPS), oraz linku do arkusza Google lub jego kopii. Po tym podam dokładną ocenę czasu i zaproponuję najkrótszą drogę do stabilności.
-
1251 35 1 3 Cześć Witalij, jestem tym, kogo potrzebujesz.
Mój stos, mam duże doświadczenie.
Napisz do mnie, omówimy to prywatnie.
-
991 12 1 Jestem gotowy szybko i jakościowo zrealizować Twoje zamówienie. Mam doświadczenie w pracy z podobnymi projektami, zawsze przestrzegam terminów i wymagań technicznych. Będę zadowolony z współpracy!
-
1006 6 1 Widzę błąd WinError 10061 / Przekroczono maksymalną liczbę prób do localhost — oznacza to, że WebDriver (Chrome/Chromedriver) "upada" i połączenie z nim jest odrzucane. Naprawię to: dodam health-check + automatyczne ponowne uruchamianie sterownika/przeglądarki, stabilne czasy oczekiwania/retry oraz logowanie, aby parser działał 24/7. Również zoptymalizuję zapis do Google/Excel (wsadowo), aby nie zawieszał się z powodu rozmiaru tabeli.
-
Скорее всего у Вас срабатывает лимит на количество запросов.
-
Скорее всего краш браузера которым управляет скрипт python c selenium. порт 59486 этот использует именно эта связка)....вердикт - или нехватка оперативки для браузера или ручное закрытие
-
Попросите "специалиста" чтоб добавил в скрипт логику перезапуска браузера с очисткой кеша, после каждых 1000 игр)
-
Делайте парсинг а базу данных+ простой веб, для просмотра и поиска. Кто рожает мысли парсить в Гугл?
-
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Baza stron na woocommercePotrzebna jest baza ukraińskich stron internetowych sklepów internetowych na woocommerce z kontaktami, które są podane na stronach. Tylko działające strony (wskaźnik: aktualizacja katalogu/treści, działająca domena) Format tabeli - adres strony, numer telefonu, e-mail. Parsowanie danych ∙ 2 dni 8 godzin temu ∙ 21 ofert |
Stworzyć dashboard w https://airtable.com/ dotyczący efektywności reklamowych kreacji z facebook adsPełnoprawne TZ https://docs.google.com/document/d/1_n_oYRNZWYxalUA---DM5AD1b5ZSrtePw5J4G42svGw/edit?usp=sharing Bazy danych i SQL, Parsowanie danych ∙ 3 dni 22 godziny temu ∙ 18 ofert |
Stworzenie pliku Exel do załadowania towarów na strony innych partnerów.Interesuje mnie, aby stworzyć tabelę Excel ze wszystkimi parametrami. Oto strona - https://heiztechnik.com.ua/ A pozycje, które mnie interesują, powinny być przeniesione: Kotły ręczne: 1) TIS UNI 15-95 kW (10) szt 2)TIS HARD 150-500 kW (7) szt Kotły na pelety: 1)TIS PELLET… Parsowanie danych ∙ 4 dni 2 godziny temu ∙ 35 ofert |
Wymagany programista do parsowania katalogu i automatyzacji importu danychSzczegółowe TZ w załączonym dokumencie proszę w odpowiedzi podać orientacyjną cenę i terminy realizacji czy masz doświadczenie w parsowaniu dużych katalogów jakie możliwe trudności lub ograniczenia widzisz w tym zadaniu Bazy danych i SQL, Parsowanie danych ∙ 4 dni 5 godzin temu ∙ 41 ofert |
Znaleźć feed produktowy (Google Merchant XML) dla strony na OpenCart
57 PLN
Konieczne jest znalezienie bezpośredniego linku do działającego pliku z danymi produktowymi (XML) konkurenta dla Google Merchant Center Platforma (CMS): OpenCart / ocStore Znajdź oryginalny plik z danymiWymagania dotyczące wyniku: Roboczy link do pliku XML Python, Parsowanie danych ∙ 4 dni 10 godzin temu ∙ 25 ofert |