Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Opublikuj swój projekt za darmo i zacznij otrzymywać oferty od wykonawców freelancerów w ciągu kilku minut po ...!

Cоздат Lambda функцию на Python для анализа контента резюме


  1. zgłoszenie zostało ukryta przez freelancera
  • Artem Nemirov
    17 sierpnia 2022, 15:35 |

    Budget?

  • Vladimir Proyektny Українські стартапи
    19 sierpnia 2022, 11:18 |

    Ожидаем ваших предложений

  • Oleksii Fedchishyn
    18 sierpnia 2022, 18:23 |

    Здравствуйте. Задача сильно размытая. Конкретизируйте, пожалуйста.

    Что значит "tune"? В примере есть только функция, которая достаёт имя. По остальным фичам тоже есть готовые функции? Если да, то что именно не устраивает? Достаёт не то, что нужно, или не достаёт всё, что нужно?

  • Vladimir Proyektny Українські стартапи
    22 sierpnia 2022, 13:16 |

    Здравствуйте. Сейчас мы достаём из системы: имя, фамилию, скайп, email, ссылки на соц. сети, навыки (синхронизируя их с нашей БД). Не устраивает то, что текущая функция достаёт не всегда то, что нужно.
    Также хотим, чтобы помимо парсинга перечисленных выше полей, парсились также поля с датой рождения, локацией, специальностью, ссылкой на телеграмм. 

    Tune означает, что мы хотим полностью переписать текущий парсер, заменив на новый.

  • Oleksii Fedchishyn
    22 sierpnia 2022, 19:08 |

    Тогда я бы не назвал это tune )) Но задача в целом понятна. Я для одного проекта делал парсинг резюме с сайта jobs ua (или похожего, не очень помню). Сразу могу сказать, что точность вряд ли когда-либо будет 100%. Просто из-за разнородности оформления. Но можно добиться неплохого результата.

    Ещё вопрос: сколько примерно у вас источников получения резюме? Я к тому, что более высокой точности можно добиться, если делать парсеры для каждого источника отдельно. То есть, костяк один, а нюансы можно подстраивать. Если в одном источнике более-менее стандартизированная форма резюме, это может сработать.

  • Vladimir Proyektny Українські стартапи
    22 sierpnia 2022, 19:50 |

    Чаще всего подгружают резюме скачанные с LinkedIn, work.ua, rabota.ua, djinni. Но также довольно часто встречаются резюме самописные, так сказать, т.е. те, которые человек самостоятельно составляет.

  • Oleksii Fedchishyn
    22 sierpnia 2022, 20:01 |

    Понятно. Резюме с известных ресурсов можно парсить с довольно высокой точностью. "Самопальные" - крайне сложно. Там всегда будет погрешность.

    Также я видел у вас в примерах PDF-файлы. С этим вообще сложно. Не все ПДФ можно перевести в читаемый текст - некоторые парсятся сплошной строкой. Хотя, конвертировать в картинки, а потом распознавание изображений в текст подключить. 

    В общем, я бы взялся за данный проект, но мне крайне сложно прогнозировать, сколько времени это займёт. Поэтому могу предложить работу этапами: один источник - один этап. И оплату почасово за каждый этап. Остановимся, когда решите, что точность вас устраивает.

  • Vladimir Proyektny Українські стартапи
    23 sierpnia 2022, 17:39 |

    Здравствуйте. Насчёт поэтапной реализации парсинга резюме - посовещаюсь с командой и Вам отпишусь. Но, в целом, идея хорошая.
    Насчёт пдф: недавно тестировали вот это решение: https://github.com/chrismattmann/tika-python#airgap-environment-setup как промежуточный вариант для вытаскивания информации с разных форматов файлов.


Zleceniodawca
Vladimir Proyektny Українські стартапи
Ukraina Czerkasy  19  0
Projekt został opublikowany
5 miesięcy 22 dni temu
111 wyświetlenia