Розпізнати текст для капчі
16 PLNТехнологія(мова) не має значення. Народ хто дружить з ocr, мені потрібно розпізнати номера на зображеннях(капча), сам пишу на php але поки хоч якось робоче рішення знайшов на пітоні:
import cv2
import pytesseract
import numpy as np
import sys
img = cv2.imread('./3.png', cv2.IMREAD_COLOR)
img = cv2.cvtColor(img, cv2.COLOR_BGR2BGRA)
img = cv2.resize(img, None, fx=9, fy=9) # Увеличение изображения в 9 раз
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
(thresh, blackAndWhiteImage) = cv2.threshold(grayImage, 127, 255, cv2.THRESH_BINARY)
balance = pytesseract.image_to_string(blackAndWhiteImage)
print(balance)
Цей скріпт не фільтрує в результаті літери і правильно розпізнає далеко не кожне зображення, є 800 шт. уже 100% правильно розпізнано(я їх прогнав через платний сервіс), я так розумію що напевно потрібно обучити pytesseract. Потрібно розробити рішення яке б хочаб 75% варіантів розпізнавало, api не пропонувати, тому що це дорого - всього потрібно розпізнати біля 100к. однотипних капч.
Самі капчі в зображеннях, нічого скачувати не потрібно, роботоздатність написаного вами скріпта легко і швидко перевірити, на зображеннях чітка закономірність розташувань цифр + скріпт уже видаляє сіру тінь.
Приклад:



Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 17 godzin 28 minut temu ∙ 10 ofert |
Potrzebny specjalista do wyszukiwania kontaktów decydentów w UkrainieKonieczne jest zebranie bazy (lub gotowej bazy) kontaktów osób podejmujących decyzje (LPR) w firmach Ukrainy. Wyszukiwanie i zbieranie informacji, Parsowanie danych ∙ 22 godziny 5 sekund temu ∙ 13 ofert |
Trzeba zeskrobać dane z LinkedInPotrzebujemy wyciągnąć dane z LinkedIn według naszej listy. Dla każdego wpisu należy znaleźć i zebrać dostępne dane, jeśli takie są na profilu LinkedIn, w tym zdjęcie profilowe w serwisie społecznościowym LinkedIn, adres e-mail, linki do mediów społecznościowych, stronę… Parsowanie danych ∙ 1 dzień 3 godziny temu ∙ 23 oferty |
Parsowanie i klasyfikacja danychSzukamy dewelopera do realizacji systemu zbierania i strukturyzacji danych z otwartych źródeł. Posiadamy bazę właścicieli małych firm w USA, która zawiera imię i nazwisko, nazwę firmy, adres oraz stan. Należy zbudować proces wzbogacania tych rekordów dodatkowymi informacjami z… Programowanie stron internetowych, Parsowanie danych ∙ 1 dzień 4 godziny temu ∙ 36 ofert |
Svitlahata
61 PLN
Potrzebne jest zaimportowanie 1819 produktów z pliku XML/YML Prom.ua do OpenCart 3. Jest gotowy plik XML, który zawiera nazwy produktów, opisy, ceny, zdjęcia, cechy, producentów i kategorie. Wymagane: zaimportować wszystkie produkty do OpenCart 3; utworzyć i powiązać… Content Management Systems, Parsowanie danych ∙ 2 dni 7 godzin temu ∙ 33 oferty |