Инженер ИИ/НЛП с сильным опытом обработки медицинских документов.
Мы ищем опытного инженера по ИИ/НЛП с сильным опытом обработки медицинских документов.
Наш проект включает в себя распознавание, парсинг и структурный анализ медицинских документов, особенно документов SNF / долгосрочного ухода и оценок MDS. Цель состоит в том, чтобы извлечь клиническую и административную информацию из отсканированных PDF-файлов, факсированных документов и цифровых медицинских записей, а затем преобразовать ее в валидированный структурированный JSON для нашей платформы здравоохранения.
Требуемый опыт:
* OCR и ИИ для документов для отсканированных PDF и медицинских записей
* Извлечение информации на основе LLM
* Клинический НЛП / НЛП в здравоохранении
* Классификация медицинских документов
* Извлечение таблиц и форм
* Извлечение схемы JSON
* Оценка уверенности и ссылки на источники
* Архитектура, соответствующая HIPAA
* Опыт работы с Python на серверной стороне
* Опыт работы с инструментами, такими как AWS Textract, Google Document AI, Azure AI Document Intelligence, LlamaParse, Tesseract, John Snow Labs, LangChain или LlamaIndex
Будет плюсом:
* Опыт работы с SNF, долгосрочным уходом, MDS 3.0, PDPM, документами EHR или медицинскими претензиями
* Опыт создания рабочих процессов с участием человека для проверки
* Опыт работы с деидентификацией PHI
Первая задача:
Мы предоставим небольшой набор деидентифицированных образцов документов. Кандидат должен создать прототип, который:
1. Распознает тип документа
2. Извлекает ключевые поля в JSON
3. Предоставляет оценки уверенности
4. Показывает ссылки на страницы/текст источника
5. Отмечает отсутствующие или неопределенные поля вместо того, чтобы догадываться
Пожалуйста, отправьте примеры аналогичных проектов ИИ / OCR / НЛП в области здравоохранения, которые вы создали.
-
2044 23 0 Привет! Вы уже используете готовые модели для классификации типов медицинских документов, или планируете обучать свою с нуля?
Сроки и бюджет точнее согласую в личной переписке.
Вот как я выполню этот проект:
1. Разверну OCR-пайплайн (AWS Textract или LlamaParse) для извлечения текста из PDF и факсов.
2. Применю LLM (например, LangChain) для парсинга клинических полей в структурированный JSON с оценкой уверенности.
3. Добавлю валидацию с ссылками на источники и автоматическим маркированием отсутствующих полей.
… Спасибо за рассмотрение моего предложения. Я с нетерпением жду возможности сотрудничества с вами!
-
196 у нас уже есть почти готовый ИИ-пipeline для здравоохранения, который можно быстро адаптировать для вашего POC, и я сейчас онлайн, чтобы обсудить набор образцов (:
для первой задачи я оцениваю 10 дней и 2500 долларов США за контролируемый POC - распознавание типа документа, OCR, извлечение полей в JSON, оценки уверенности, ссылки на исходные страницы и обработка отсутствующих полей без предположений.
аналогичная работа в области здравоохранения и ИИ
- https://business.ingello.com/rapport - автоматизация процессов здравоохранения и структурированная логика клинического рабочего процесса
- https://business.ingello.com/lita-doctor - медицинская платформа с опытом работы с рабочими процессами со стороны врача и структурированными записями
- https://business.ingello.com/vorfahr - случай автоматизации ИИ, актуальный для извлекающих пайплайнов и обработки на основе агентов
… Извлечение ИИ должно быть построено как отдельные слои - OCR, классификация документов, извлечение схем, валидация, оценка уверенности и обзор неопределенных полей.
Я бы использовал Python на серверной стороне, AWS Textract или Google Document AI, где это полезно, и извлечение LLM с жесткими схемами, привязкой к источнику и без свободных предположений.
Для обработки с учетом HIPAA я бы держал хранение, контроль доступа, журналы аудита и деидентификацию отдельно перед обработкой модели, где это необходимо.
два быстрых вопроса, прежде чем я более точно зафиксирую оценку
- сколько типов документов в наборе POC - MDS, факсированные заметки SNF, требования, планы ухода или что-то еще
- у вас уже есть целевые схемы JSON, или нам следует определить их на основе документов
наша страница FLH - https://systems-fl.ingello.com
я могу начать с архитектуры POC и первого прототипа извлечения после получения деидентифицированных образцов... небольшая заметка, клинический ИИ-документ обычно выглядит меньше на бумаге, чем становится в производстве =/
-
1510 10 0 Мы имеем опыт в обработке медицинских документов и реализации NLP-решений для извлечения структурированных данных из сложных отчетов, включая MDS и формы долгосрочного ухода. Реализуем это через кастомные пайплайны OCR и LLM-модели, настроенные под специфику медицинской терминологии для обеспечения высокой точности парсинга. Готовы обсудить детали интеграции в Вашу систему.
-
2506 20 0 Добрый день, готов выполнить ваше задание быстро и качественно. У меня большой опыт в создании различных парсеров. Напишите в личные сообщения, обсудим детали. С удовольствием помогу)
-
Задайте ваш вопрос заказчику