Конвертувати pdf в json
1000 UAHПривіт, є завдання, потрібно конвертувати 2 pdf файли в json. А саме на сторінці https://hsc.gov.ua/index/poslugi/vidacha-posvidchennya-vodiya/pitannya-ta-ispit-z-pdr/ в першому абзаці є Екзаменаційні питання та відповіді. От їх треба конвертувати в json.
Питання в json мають мати таку структуру:
{
"topics": [
{
"topicId": 1,
"topicTitle": "1. ЗАГАЛЬНІ ПОЛОЖЕННЯ",
"questions": [
{
"questionId": 1,
"text": "1. Трамвайна колія – елемент дороги, призначений для руху рейкових транспортних засобів, який обмежується по ширині:",
"image": "1_1.png",
"options": [
{
"optionId": 1,
"text": "1) Спеціально виділеним вимощенням трамвайної лінії."
},
{ "optionId": 2, "text": "2) Дорожньої розміткою." },
{
"optionId": 3,
"text": "3) Відповіді, зазначені в пунктах 1 та 2."
}
]
},
{
"questionId": 2,
"text": "2. Елемент дороги, призначений для руху рейкових транспортних засобів, який обмежується по ширині спеціально виділеним вимощеннямтрамвайної лінії або дорожньою розміткою це:",
"image": null,
"options": [
{
"optionId": 1,
"text": "1) Трамвайна колія."
},
{ "optionId": 2, "text": "2) Удосконалене покриття." },
{
"optionId": 3,
"text": "3) Смуга руху."
}
]
}
]
},
{
"topicId": 2,
"topicTitle": "2. ОБОВ'ЯЗКИ І ПРАВА ВОДІЇВ МЕХАНІЧНИХ ТРАНСПОРТНИХ ЗАСОБІВ",
"questions": [
{
"questionId": 1,
"text": "1. У разі, якщо неможливо вжити заходи для надання домедичної допомоги потерпілому та викликати бригаду екстреної (швидкої) медичної допомоги, а також якщо з місця ДТП немає можливості відправити потерпілого до лікувального закладу за допомогою інших осіб, водій зобов'язаний:",
"image": "2_1.png",
"options": [
{
"optionId": 1,
"text": "1) відповідь"
},
{ "optionId": 2, "text": "2) відповідь" },
{
"optionId": 3,
"text": "3) відповідь"
},
{
"optionId": 4,
"text": "4) відповідь"
}
]
}
]
}
]
}
Тобто нічого складного, повторити структуру з пдф, де є там 63 основні теми (з підтемами до прикладу 16, 16.1 і 16.2 може білье, підтеми в джейсоні не треба робити в тему 16, вони мають також йти як окрема тема, щоб потім правильно опрацювати.)
По фото. Фото це номер теми_номерпитання, алея 34 тема і 8 питання має фото, назва фото буде 34_8.png. Всі фото треба зберегити в одну папку "images" з відповідними назвами до прикладу 34_8.png щоб можна було з опрацьованого джейсону розмітити.
Важливо порядок всіх тем, питань і відповідей має зберегтись, так як в другому pdf в нас є відповіді, треба їх зробити в такому форматі:
{
"1": {
"1": 3,
"2": 1,
"3": 4
},
"2": {
"1": 2,
"2": 3
}
}
Тобто тема 1, перше питання буде мати відповідь 3, і т.д. Далі я вже буду опрацьовувати питання з відповідями. Тому структура і послідовність важлива!.
Якщо будуть питання, звертайтесь! По ціні теж можем обговорити. Проект не комерційний, а пет, тому в міру розумного)!
І прохання перед тим як відкликнутися на завдання, спробуйте чи ви зможете, щоб завдання не застоялось, дякую!
Результати роботи
Відгук замовника про співпрацю з Антоном Ц.
Конвертувати pdf в jsonДякую Антону за його допомогу, виконав завдання дуже швидко і якісно, з потрібним результатом!
Відгук фрилансера про співпрацю з Костянтином Буданковим
Конвертувати pdf в jsonЗамовник швидко перевіряв результати, надавав уточнення, а після фінального варіанту успішно закрив проект
-
Спаршу PDF і сконвертую в JSON за вашою структурою за допомогою Python-скрипта, зберігши всі зображення та правильну послідовність відповідей. Маю великий досвід у парсингу даних та автоматизації, зроблю все чисто і без помилок. Виконаю роботу за 2 дні, бюджет 1000 грн влаштовує.
Чи є у вас обмеження по роздільній здатності для витягнутих зображень .png?
-
1090 11 1 Можу зробити. Формат зрозумілий: 1-й PDF - topics/questions/options + поле image (topic_question.png), усі картинки в /images з назвами типу 34_8.png, підтеми (16.1/16.2/…) - як окремі topic, порядок тем/питань/варіантів зберігаю 1:1. 2-й PDF - окремий JSON з відповідями у вашій структурі { "topicId": { "questionId": correctOptionId } }. Перед стартом зроблю швидкий тест на 1–2 темах і покажу шматок JSON + 2–3 картинки з правильними назвами, щоб ви підтвердили, що все читається і збігається
-
5928 345 0 Погрався з PDF файлами, написав пробні скрипти, один витягує текст в структурованому вигляді (теми, питання і варіанти відповідей) і зображення в окремі файли з прив'язкою до теми і питання з PDF, інший перетворює все це в JSON. В деяких місцях PDF дещо кривий (а може я кривий, все може бути), звідси і робота в два етапи, між якими дещо перевіряється і виправляється руками, але все ж таки абсолютна більшість даних витягується коректно
-
580 11 0 Добрий день! Маю досвід, колись робила подібне завдання. Швидко виконаю!
-
3012 73 4 2 Вітаю! Можу зробити в такому форматі!!! Звертайтесь!!!!!!!!!
-
2556 38 0 Доброго дня! Ознайомився з завданням, зроблю швидко сьогодні. Вже був досвід конвертування в json з pdf.
-
184 Доброго дня!
Переглянув обидва PDF та структуру JSON. Готовий конвертувати питання і відповіді з повним збереженням порядку тем та нумерації.
Всі зображення винесу в окрему папку з коректними назвами файлів для подальшої розмітки.
Гарантую відповідність структури та послідовності даних.
Термін виконання — 2 дні.
-
1101 7 1 Привіт!
Маю досвід в обробці PDF файлів та їх конвертації в JSON. Нещодавно працював над проєктом, де конвертував документи в машиночитані формати за допомогою Python і бібліотеки PyPDF2 або pdfplumber.
Я реалізую парсинг PDF файлів, екстрагую інформацію та структурую її у формат JSON, як зазначено. Використаю бібліотеки для парсингу, щоб забезпечити точність даних, та збережу зображення в папці "images" з правильними іменами.
Моя робота гарантує зручність у подальшій обробці і правильний формат для вашого проекту. Готовий почати!
-
841 26 4 1 Розібрати вихідний документ можна, навіть цікаво, однак запропонована винагорода явно мала, не знаходите? Я б розібрав, перекодував. Ціна поки не реальна. Потрібно 3-5 днів, щоб кілька разів спробувати виконати завдання, успіх - передрешений.
-
654 2 0 Привіт!
Можу конвертувати PDF з сайту hsc.gov.ua у JSON з потрібною структурою, включно з картинками у папку images.
Точний порядок тем і питань збережу.
Виконання: 3–5 днів, вартість: 1000грн.
-
Привіт, Костянтине! Ваш проект виглядає цікавим і зрозумілим, а конвертація PDF у JSON має значення для будь-якого вашого майбутнього застосунку. Як досвідчений веб-дизайнер та фахівець з обробки різних форматів файлів, готовий застосувати свої знання для точного відтворення даних у потрібному форматі. Мій підхід передбачає дбайливе збереження порядку тем, питань та відповідей, що є критичним для подальшої роботи з ними. Давайте обговоримо, як я можу допомогти вам реалізувати ваш проект якісно та вчасно!
-
Доброго дня. Виконаю протягом декількох годин. Звертайтесь.
Приступлю одразу.
-
213 1 0 Вітаю! Зацікавив ваш проект.
Маю досвід автоматизації обробки великих обсягів даних. Для вашого завдання (539 сторінок питань + 11 сторінок відповідей) розробив спеціальний алгоритм на Python, який дозволяє:
Гарантувати 100% точність: виключити людський фактор при конвертації тисяч запитань.
Автоматично іменувати зображення: зберегти та прив'язати фото за маскою {topicId}_{questionId}.png точно за вашою структурою.
Зберегти ієрархію: коректно опрацювати всі теми та підтеми у вказаний JSON-формат.
Готовий безкоштовно виконати демо-версію (першу тему), щоб ви переконалися в якості та швидкості мого підходу. Якщо вам цікава автоматизована обробка з гарантованим результатом — буду радий обговорити деталі.
-
8495 38 0 1 можу перегнати через гпт ящо промт выдпрацюэ корректно то по каринцы повинно бути все гуд
-
1860 21 0 Доброго дня. Як ви і просили, заздалегідь спробував розібрати pdf. Вся складність тут саме у другому pdf (з відповідями), який не просто є сканом, але ще й поганим сканом, де навіть деякі цифри настільки не видно, що не можна візуально навіть відновити людиною. Будь у нас тільки перший pdf, вийшло б дешево і дуже швидко, але через другий pdf ціна стає значно вищою (десь 70% від усієї ціни це саме другий pdf з відповідями), але все виконавчо. Протягом дня можна зробити.
-
3356 70 1 Вітаю.
Ознайомився із PDF.
Займаюся написанням скриптів з нуля під певні задачі. Зможу викоанти проект.
-
10130 117 0 Вітаю.
Можу написати скрипт на NodeJS. Готовий взятися. Пишіть, обговоримо.
Актуальні фриланс-проєкти в категорії Веб-програмування
Модуль для Dle 19.1Потрібен модуль читалки книг у fb2 форматі для Dle 19.1, як на відео - https://www.youtube.com/watch?v=4F-hFe2XsGA Суть: При додаванні новини, в додаткове поле завантажується книга у fb2 форматі. У повній новині з'являється посилання на читання. Можна зробити точно такий же,… Веб-програмування ∙ 1 година 13 хвилин тому ∙ 8 ставок |
Підтримка при створенні лендінг-пейдж, магазин з підписками, збір електронних адресДоброго дня,шукаю людину для технічної підтримки при запуску веб-сайту: лендінг-пейдж з магазином та системою розсилки новин.Обсяг робіт включає:створення лендінг-пейдж / простої веб-сторінки,запуск магазину з можливістю продажу продуктів та підписки,допомога у виборі та… Веб-програмування ∙ 20 годин 5 хвилин тому ∙ 50 ставок |
Створення плагіну для інтеграції з POS-системою Syrve, C#Розробити плагін для POS-системи Syrve (on-premise), який встановлюється на сервер закладу. Плагін має: (1) передавати на наш сервер дані в режимі реального часу — замовлення, статуси столів, платежі, чеки; (2) приймати команди від Reservble — підтвердження бронювань, прив'язка… C#, Веб-програмування ∙ 21 година 32 секунди тому ∙ 11 ставок |
Розробка єдиного проекту на основі доопрацювання і обєднання 4 скріптівВітаю. Потрібно обєднати 4 скріпта різних авторів в єдине середовище. Состав - форум - відео портал - статейний портал - дошка оголошень. самі скріпти я надаю. Детальне тз в доданих файлах. Прошу продумати як за відносно невеликий кошт можно зібрати потрібний функціонал, зробит… PHP, Веб-програмування ∙ 1 день тому ∙ 27 ставок |
Не приходять заявки в ТГ ocStore (Опенкарт)Перестали приходити заявки з інтернет-магазина в Телеграм. Є 5 сайтів, які розташовані на одному хостингу, версія движка і модулів однакова, але кілька тижнів тому з усіх сайтів перестали приходити заявки в ТГ (ТГ боти і групи різні). На пошту приходять заявки. Версія ocStore… CMS, Веб-програмування ∙ 1 день тому ∙ 62 ставки |