Требуется написать парсер контента PDF/Word для Windows компьютера.
Приложение должно парсить текст и изображения с любого документа в формате PDF или Word с определением координат. Если символы в пределах одного слова разбиты на текстовые блоки, их необходимо объединить.
Языки программирования:
С# или С/С++ или Microsoft .NET
-
Добры день! Можно примеры файлов.
-

как то не совсем понятно:
- файлы PDF могут быть в картинке или в тексте (в последнем случае не нужно считывать - есть внутри тект)
- WORD имеет открытую струтктуру и его можно программно "читать"
В обоих случаях - что передаеться на сервер по АПИ:
- текст или картинки?
- что делать с таблицами?
ИМО смахивает на прогу-зловреда для ботнетов, чтоб пиздить контент
прошу пояснить целевое назначение ибо по хорошему это жалоба и бан на ресурсе -
Current freelance projects in the category C & C++
Reverse engineering of console utilities for querying SSD controllers (Flash ID)1. Purpose of the work Extraction of the application programming interface (API) for interaction with SSD/NVMe controllers from the provided set of console utilities (Phison, Silicon Motion, Realtek, Maxiotek, Marvell, JMicron, etc.). The result should be working code in C/C++… C & C++, Desktop Apps ∙ 3 days back ∙ 5 proposals |
Development of a Minecraft Java Seed Map / Seed Viewer for the websiteDevelopment of Minecraft Java Seed Map / Seed Viewer for the websiteProject Description A browser-based tool Minecraft Java Seed Map / Seed Viewer needs to be developed, which will work on our website and allow the user to enter a seed from Minecraft Java Edition and view an… C & C++, HTML & CSS ∙ 3 days 7 hours back ∙ 14 proposals |
Comparative analysis of the effectiveness of custom software (v2.2-field) and reference software (Meshtastic v2.x)
22 USD
Comparative analysis of the effectiveness of custom software (v2.2-field) and reference software (Meshtastic v2.x) on the identical hardware platform (ESP32 + SX1268, 2W) based on the criteria of range, throughput, link stability, and power consumption. Conduct tests with… C & C++, C# ∙ 7 days 14 hours back ∙ 2 proposals |
Consultation and audit of the current project on Odoo 19 Community EditionWe are looking for an Odoo Developer — a solo developer with experience in Odoo 19 Community Edition, including using Claude Code. We need a specialist who has successfully implemented projects in Odoo and practical experience in development using Claude Code. Important: we only… C & C++, Javascript and Typescript ∙ 10 days 16 hours back ∙ 8 proposals |
Software development for Arduino (RF modules 3–7.5 GHz, automatic frequency scanning)It is necessary to develop a system on Arduino for the automatic search of active analog video signals and the automatic tuning of the transmitter to the detected frequency.It is planned to use three separate transceiver modules: 3000–4200 MHz; 4900–6000 MHz; 6100–7500… C & C++, Embedded Systems & Microcontrollers ∙ 11 days 16 hours back ∙ 5 proposals |