Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Розмістіть свій проєкт безплатно та почніть отримувати пропозиції від фрилансерів-виконавців уже через хвилини після публікації!

Cоздат Lambda функцию на Python для анализа контента резюме


  1. ставка прихована фрилансером
  • Артем Немиров
    17 серпня 2022, 15:35 |

    Budget?

  • Владимир Проектный Українські стартапи
    19 серпня 2022, 11:18 |

    Ожидаем ваших предложений

  • Oleksii Fedchishyn
    18 серпня 2022, 18:23 |

    Здравствуйте. Задача сильно размытая. Конкретизируйте, пожалуйста.

    Что значит "tune"? В примере есть только функция, которая достаёт имя. По остальным фичам тоже есть готовые функции? Если да, то что именно не устраивает? Достаёт не то, что нужно, или не достаёт всё, что нужно?

  • Владимир Проектный Українські стартапи
    22 серпня 2022, 13:16 |

    Здравствуйте. Сейчас мы достаём из системы: имя, фамилию, скайп, email, ссылки на соц. сети, навыки (синхронизируя их с нашей БД). Не устраивает то, что текущая функция достаёт не всегда то, что нужно.
    Также хотим, чтобы помимо парсинга перечисленных выше полей, парсились также поля с датой рождения, локацией, специальностью, ссылкой на телеграмм. 

    Tune означает, что мы хотим полностью переписать текущий парсер, заменив на новый.

  • Oleksii Fedchishyn
    22 серпня 2022, 19:08 |

    Тогда я бы не назвал это tune )) Но задача в целом понятна. Я для одного проекта делал парсинг резюме с сайта jobs ua (или похожего, не очень помню). Сразу могу сказать, что точность вряд ли когда-либо будет 100%. Просто из-за разнородности оформления. Но можно добиться неплохого результата.

    Ещё вопрос: сколько примерно у вас источников получения резюме? Я к тому, что более высокой точности можно добиться, если делать парсеры для каждого источника отдельно. То есть, костяк один, а нюансы можно подстраивать. Если в одном источнике более-менее стандартизированная форма резюме, это может сработать.

  • Владимир Проектный Українські стартапи
    22 серпня 2022, 19:50 |

    Чаще всего подгружают резюме скачанные с LinkedIn, work.ua, rabota.ua, djinni. Но также довольно часто встречаются резюме самописные, так сказать, т.е. те, которые человек самостоятельно составляет.

  • Oleksii Fedchishyn
    22 серпня 2022, 20:01 |

    Понятно. Резюме с известных ресурсов можно парсить с довольно высокой точностью. "Самопальные" - крайне сложно. Там всегда будет погрешность.

    Также я видел у вас в примерах PDF-файлы. С этим вообще сложно. Не все ПДФ можно перевести в читаемый текст - некоторые парсятся сплошной строкой. Хотя, конвертировать в картинки, а потом распознавание изображений в текст подключить. 

    В общем, я бы взялся за данный проект, но мне крайне сложно прогнозировать, сколько времени это займёт. Поэтому могу предложить работу этапами: один источник - один этап. И оплату почасово за каждый этап. Остановимся, когда решите, что точность вас устраивает.

  • Владимир Проектный Українські стартапи
    23 серпня 2022, 17:39 |

    Здравствуйте. Насчёт поэтапной реализации парсинга резюме - посовещаюсь с командой и Вам отпишусь. Но, в целом, идея хорошая.
    Насчёт пдф: недавно тестировали вот это решение: https://github.com/chrismattmann/tika-python#airgap-environment-setup как промежуточный вариант для вытаскивания информации с разных форматов файлов.