Обработка CSV фалов на Python с созданием новых
386 UAHДоброго. Есть потребность в скрипте, который работает с файлами. Суть примерно следующая:
Есть два входных файла CSV UTF-8 разделитель – точка с запятой. В первом файле находятся адреса страниц (URL), идут в качестве заголовков столбцов, под каждым URL идут фразы в столбец. Второй файл набор небольших текстов, каждый текст в своей строке. Для первого файла необходимо дополнить столбцы всеми возможными комбинациями фраз, которые есть в данном столбце, например, в первом столбце есть фраза «мама мыла» и «папа чинил велосипед», к ним добавится «мыла мама», «папа велосипед чинил», «чинил папа велосипед», «чинил велосипед папа», «велосипед папа чинил», «велосипед чинил папа», т.е. просто все возможные перестановки слов во фразе, фразы добавляются в тот же столбец, в качестве результата этой операции можно сформировать третий файл (в заголовках адреса страниц, под каждым все входные фразы и их вариации с перестановкой слов). Далее начинаем искать точное вхождение фраз из третьего файла во втором, результатом такого поиска становится четвертый файл, в первом столбце которого идет фраза из третьего файла, во втором адрес страницы (берется из заголовка столбца к которому относится фраза), в третьем столбце идет один первый текст в котором найдена фраза, если для фразы есть несколько текстов, то фраза и адрес страницы повторяются в первом и втором столбцах для каждого текста, в четвертом столбце идет текст из третьего столбца, только он содержит теги, сам текст находится в тегах <p></p>, а фраза, из столбца один в тексте выделена тегами <a href=””>ФРАЗА ФРАЗА</a>, где фраза является анкором, а в качестве адреса страницы в href=”” подставляется заголовок столбца (он же URL) к которому данная фраза относится. Если фраза из третьего файла не найдена во втором, то ее никуда не добавляем.
Данный скрипт должен работать для любого языка, даже если какая-то часть в текстах идет на английском, часть на французском, а часть на арабском. Скрипт должен быть регистронезависимым.
Примеры файлов прилагаю, для тестов могу скинуть файлы побольше.
Приложения 4
Отзыв заказчика о сотрудничестве с Євгеном Домерецьким
Обработка CSV фалов на Python с созданием новыхВсе сделано великолепно. Результатом больше чем доволен.
![]()
Отзыв фрилансера о сотрудничестве с заказчиком
Обработка CSV фалов на Python с созданием новыхПриятно сотрудничать, заказчик выходит на контакт быстро и ясно формулирует задачи)
-
Здравствуйте.
Готов сделать на Python.Есть опыт в разработке
Готов сделать быстро и качественно
Учту Ваши пожелания
Пишите лс ваш тг обсудим детали
-
470 12 1 1 Здравствуйте!
Задание не из тяжёлых, если имеются нормальные файлы. Но, после некоторых анализов, обнаружил, что среди файлов, которые вы предоставили, есть местами застарелая кодировка и на множествах устройств будут отображаться неправильно. Но все же, это не большая проблема, а так, нехитрые препятствия.
Итак, имею 2 года опита на python, и обработка csv файлов это одно из самих легких заданий. Идея понятная, интересует только максимальное количество слов в строке для перестановок. Потому что 10+ к примеру, ведет к большой затрате ресурсов с каждым словом в списке.
Напишу скрипт на Python, будет хорошо ранится на любых языках, и независимость регистра это большое упрощение к самому делу, так что это регистронезависимость по любому будет.
-
5235 29 1 1 Здравствуйте Дмитрий,
С легкостью выполню поставленную задачу, +- за день, если цена вас устраивает, хотелось бы уточнить детали.
буду рад сотрудничеству
-
Добрый день.
Бюджет окончательный ? -
Актуальные фриланс-проекты в категории Python
Рассылка по группам
1500 UAH
Нужен софт который будет подключаться к телеграмм сессии, будет заходить в телеграмм группы и отправлять сообщения которое ему скажут Python, Разработка ботов ∙ 10 часов 27 минут назад ∙ 21 ставка |
Построить модель классификации клиентов1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python. AI и машинное обучение, Python ∙ 1 день 13 часов назад ∙ 30 ставок |
ИТ Автоматизация ведения VAT-отчетности
10 000 UAH
Необходимо разработать систему для автоматизации переноса данных о продажах из CRM в бухгалтерскую систему Wafeq. Система должна импортировать банковские и платежные отчеты, автоматически сверять платежи с инвойсами, формировать инвойсы для VAT-отчетности и минимизировать ручную… AI и машинное обучение, Python ∙ 1 день 18 часов назад ∙ 40 ставок |
Инструмент сверки счетов с банком, картами и бухгалтеромТехническое задание: инструмент сверки счетов с банком, картами и бухгалтеромОбщая цель Нужен локальный инструмент (скрипт/небольшое приложение на Python), который запускается вручную раз в 1-2 месяца на моём компьютере и делает сверку между: Счетами, которые я выставил клиентам… Python, Десктопные приложения ∙ 2 дня 7 часов назад ∙ 39 ставок |
Автоматическая публикация видео в социальные сети по расписаниюТехническое задание (ТЗ) Автоматическая публикация видео в социальные сети по расписаниюОписание проекта Нужен скрипт/бот (Python предпочтительно, либо любое другое решение на ваш выбор — главное стабильность и простота поддержки), который автоматически публикует видео из папки… Python, Разработка ботов ∙ 2 дня 19 часов назад ∙ 58 ставок |