Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Post your project for free and start getting offers from freelance performers within minutes after posting!

Cоздат Lambda функцию на Python для анализа контента резюме


  1. proposal concealed by freelancer
  • Artem Nemirov
    17 August, 15:35 |

    Budget?

  • Vladimir Proyektny
    19 August, 11:18 |

    Ожидаем ваших предложений

  • Oleksii Fedchishyn
    18 August, 18:23 |

    Здравствуйте. Задача сильно размытая. Конкретизируйте, пожалуйста.

    Что значит "tune"? В примере есть только функция, которая достаёт имя. По остальным фичам тоже есть готовые функции? Если да, то что именно не устраивает? Достаёт не то, что нужно, или не достаёт всё, что нужно?

  • Vladimir Proyektny
    22 August, 13:16 |

    Здравствуйте. Сейчас мы достаём из системы: имя, фамилию, скайп, email, ссылки на соц. сети, навыки (синхронизируя их с нашей БД). Не устраивает то, что текущая функция достаёт не всегда то, что нужно.
    Также хотим, чтобы помимо парсинга перечисленных выше полей, парсились также поля с датой рождения, локацией, специальностью, ссылкой на телеграмм. 

    Tune означает, что мы хотим полностью переписать текущий парсер, заменив на новый.

  • Oleksii Fedchishyn
    22 August, 19:08 |

    Тогда я бы не назвал это tune )) Но задача в целом понятна. Я для одного проекта делал парсинг резюме с сайта jobs ua (или похожего, не очень помню). Сразу могу сказать, что точность вряд ли когда-либо будет 100%. Просто из-за разнородности оформления. Но можно добиться неплохого результата.

    Ещё вопрос: сколько примерно у вас источников получения резюме? Я к тому, что более высокой точности можно добиться, если делать парсеры для каждого источника отдельно. То есть, костяк один, а нюансы можно подстраивать. Если в одном источнике более-менее стандартизированная форма резюме, это может сработать.

  • Vladimir Proyektny
    22 August, 19:50 |

    Чаще всего подгружают резюме скачанные с LinkedIn, work.ua, rabota.ua, djinni. Но также довольно часто встречаются резюме самописные, так сказать, т.е. те, которые человек самостоятельно составляет.

  • Oleksii Fedchishyn
    22 August, 20:01 |

    Понятно. Резюме с известных ресурсов можно парсить с довольно высокой точностью. "Самопальные" - крайне сложно. Там всегда будет погрешность.

    Также я видел у вас в примерах PDF-файлы. С этим вообще сложно. Не все ПДФ можно перевести в читаемый текст - некоторые парсятся сплошной строкой. Хотя, конвертировать в картинки, а потом распознавание изображений в текст подключить. 

    В общем, я бы взялся за данный проект, но мне крайне сложно прогнозировать, сколько времени это займёт. Поэтому могу предложить работу этапами: один источник - один этап. И оплату почасово за каждый этап. Остановимся, когда решите, что точность вас устраивает.

  • Vladimir Proyektny
    23 August, 17:39 |

    Здравствуйте. Насчёт поэтапной реализации парсинга резюме - посовещаюсь с командой и Вам отпишусь. Но, в целом, идея хорошая.
    Насчёт пдф: недавно тестировали вот это решение: https://github.com/chrismattmann/tika-python#airgap-environment-setup как промежуточный вариант для вытаскивания информации с разных форматов файлов.