Объединить данные из нескольких CSV файлов полуавтоматически
425 UAHС разных сайтов я спарсил "одно и то же". Колонки называются по разному, колонок разное количество. И данные могут разниться.
Мне нужна программа, скорее всего для windows - визуально чтобы, где я бы указал файлы для чтения из них данных, какие колонки объединять, и каким образом их объединять. Так же вместо url картинки показать картинку и её размеры.
И пользователю надо удобно выбирать спорные значения. Рядом с любым значением данные, скорее всего из первой ячейки своей строки.
А некоторые данные, необходимо нормализовать - привезти их к единому значению.
В итоге, в автоматическом режиме и с помощью пользователя, должен получиться объединенный файл на выходе.
Может уже есть подобная программа?
2. надо создать имена колонок, которым сопоставить имена колонок из разных csv
3. по условно уникальному полю артикул их необходимо склеить. и вот здесь и начинается канитель:
- некоторые строки надо расклеить
- некоторые строки надо утвердить
- некоторые строки имеют в ячейках несколько значений через сепаратор отличающийся от основного. и каждый из них по отдельности нужно объединить (автоматически), утвердить (вручную), отбросить (вручную), нормализовать (сделать замены слов) - привести к разрешенным значениям в этой ячейке (вручную, но оптом)
4. картинка - также показать пользователю все варианты, чтобы он щелкнул по нужной
Получилось всего 150 строк кода.
Заголовки стандартизировал с помощью ini файла рядом с каждым csv
Задача элементарная. Похожа на лабораторную в институте.
Это стоит не более 1000 руб.
Многие выдвинули такие цены..
-
76 4 0 1 Предлагаю свои услуги:
• Есть опыт распарсивания сложных артикулов (местами печальный)))
• Если софтом планируется пользоваться долго, можно автоматом создать профили под разные источники данных.
-
А по хорошему то я в свое время не так давно отказался от работы. В постановке задачи по парсингу была как раз похожая ситуация. Требовалось что б некоторые колонки имели названия, являющиеся фактическими данными. Тоже наверняка ребята пришли к такой же ситуации - как это потом совмещать, нормализовать и тд. Ну и что б меня не терзали потом переделываниями сказал что я этого не умею, не могу и не буду.
-
а вот вопрс что нужно нормализовать - постановку задачи в парсинге или результат потом это вопрос серьезный. обработка данных пожизненная потом в полуручном режиме тоже спорное удовольствие ))
-
Добрый день. Оправьте, пожалуйста, Ваши фпйлы в л.с., скайп или телеграм. Задача ясна, но нужно более детальное изучение там, где у Вас склеены данные и небходимо разделение. Остальные условия вроде переноса значения по клику или выбора колонок для склеивания легко реализуемы. Также уже есть выбор колонок из выпадающего списка. Эта программа в экселе в портфолио и последний отзыв заказчика тоже о ней.
Если очень важно, то можно и программу под видовс сделать. Но в экселе имхо проще.
-
«Это стоит не более 1000 руб.
Многие выдвинули такие цены.. »На к-во букв < 4 тебе путь, сынок.
-
Актуальні фриланс-проєкти в категорії C та C++
Реверс-інжиніринг консольних утиліт для опитування контролерів SSD (Flash ID)1. Мета роботиВиділення програмного інтерфейсу (API) взаємодії з контролерами SSD/NVMe з наданого набору консольних утиліт (Phison, Silicon Motion, Realtek, Maxiotek, Marvell, JMicron та ін.). Результатом має стати робочий код мовою C/C++ або точна документація структур для… C та C++, Десктопні додатки ∙ 12 днів 8 годин тому ∙ 6 ставок |
Розробка Minecraft Java Seed Map / Seed Viewer для сайтуРозробка Minecraft Java Seed Map / Seed Viewer для сайтуОпис проєкту Потрібно розробити browser-based інструментMinecraft Java Seed Map / Seed Viewer, який буде працювати на нашому сайті та дозволятиме користувачу ввести seed Minecraft Java Edition і переглянути інтерактивну… C та C++, HTML та CSS верстання ∙ 12 днів 15 годин тому ∙ 17 ставок |
