Объединить данные из нескольких CSV файлов полуавтоматически
425 UAHС разных сайтов я спарсил "одно и то же". Колонки называются по разному, колонок разное количество. И данные могут разниться.
Мне нужна программа, скорее всего для windows - визуально чтобы, где я бы указал файлы для чтения из них данных, какие колонки объединять, и каким образом их объединять. Так же вместо url картинки показать картинку и её размеры.
И пользователю надо удобно выбирать спорные значения. Рядом с любым значением данные, скорее всего из первой ячейки своей строки.
А некоторые данные, необходимо нормализовать - привезти их к единому значению.
В итоге, в автоматическом режиме и с помощью пользователя, должен получиться объединенный файл на выходе.
Может уже есть подобная программа?
2. надо создать имена колонок, которым сопоставить имена колонок из разных csv
3. по условно уникальному полю артикул их необходимо склеить. и вот здесь и начинается канитель:
- некоторые строки надо расклеить
- некоторые строки надо утвердить
- некоторые строки имеют в ячейках несколько значений через сепаратор отличающийся от основного. и каждый из них по отдельности нужно объединить (автоматически), утвердить (вручную), отбросить (вручную), нормализовать (сделать замены слов) - привести к разрешенным значениям в этой ячейке (вручную, но оптом)
4. картинка - также показать пользователю все варианты, чтобы он щелкнул по нужной
Получилось всего 150 строк кода.
Заголовки стандартизировал с помощью ini файла рядом с каждым csv
Задача элементарная. Похожа на лабораторную в институте.
Это стоит не более 1000 руб.
Многие выдвинули такие цены..
-
76 4 0 1 Предлагаю свои услуги:
• Есть опыт распарсивания сложных артикулов (местами печальный)))
• Если софтом планируется пользоваться долго, можно автоматом создать профили под разные источники данных.
-
А по хорошему то я в свое время не так давно отказался от работы. В постановке задачи по парсингу была как раз похожая ситуация. Требовалось что б некоторые колонки имели названия, являющиеся фактическими данными. Тоже наверняка ребята пришли к такой же ситуации - как это потом совмещать, нормализовать и тд. Ну и что б меня не терзали потом переделываниями сказал что я этого не умею, не могу и не буду.
-
а вот вопрс что нужно нормализовать - постановку задачи в парсинге или результат потом это вопрос серьезный. обработка данных пожизненная потом в полуручном режиме тоже спорное удовольствие ))
-
Добрый день. Оправьте, пожалуйста, Ваши фпйлы в л.с., скайп или телеграм. Задача ясна, но нужно более детальное изучение там, где у Вас склеены данные и небходимо разделение. Остальные условия вроде переноса значения по клику или выбора колонок для склеивания легко реализуемы. Также уже есть выбор колонок из выпадающего списка. Эта программа в экселе в портфолио и последний отзыв заказчика тоже о ней.
Если очень важно, то можно и программу под видовс сделать. Но в экселе имхо проще.
-
«Это стоит не более 1000 руб.
Многие выдвинули такие цены.. »На к-во букв < 4 тебе путь, сынок.
-
Актуальные фриланс-проекты в категории C и C++
Реверс-инжиниринг консольных утилит для опроса контроллеров SSD (Flash ID)1. Цель работы Выделение программного интерфейса (API) взаимодействия с контроллерами SSD/NVMe из предоставленного набора консольных утилит (Phison, Silicon Motion, Realtek, Maxiotek, Marvell, JMicron и др.). Результатом должно стать рабочий код на языке C/C++ или точная… C и C++, Десктопные приложения ∙ 7 дней 10 часов назад ∙ 6 ставок |
Разработка карты семян Minecraft Java / просмотрщика семян для сайтаРазработка карты семян Minecraft Java / Seed Viewer для сайтаОписание проекта Необходимо разработать браузерный инструмент Minecraft Java Seed Map / Seed Viewer, который будет работать на нашем сайте и позволит пользователю ввести семя Minecraft Java Edition и просмотреть… C и C++, HTML и CSS верстка ∙ 7 дней 16 часов назад ∙ 15 ставок |
Сравнительный анализ эффективности кастомного ПО (v2.2-field) и эталонного ПО (Meshtastic v2.x)
1000 UAH
Сравнительный анализ эффективности кастомного ПО (v2.2-field) и эталонного ПО (Meshtastic v2.x) на идентичной аппаратной платформе (ESP32 + SX1268, 2W) по критериям дальности, пропускной способности, стабильности линка и энергопотребления. Провести тесты с замерами с учетом… C и C++, C# ∙ 12 дней назад ∙ 2 ставки |
