Обработка CSV фалов на Python с созданием новых
386 UAHДоброго. Есть потребность в скрипте, который работает с файлами. Суть примерно следующая:
Есть два входных файла CSV UTF-8 разделитель – точка с запятой. В первом файле находятся адреса страниц (URL), идут в качестве заголовков столбцов, под каждым URL идут фразы в столбец. Второй файл набор небольших текстов, каждый текст в своей строке. Для первого файла необходимо дополнить столбцы всеми возможными комбинациями фраз, которые есть в данном столбце, например, в первом столбце есть фраза «мама мыла» и «папа чинил велосипед», к ним добавится «мыла мама», «папа велосипед чинил», «чинил папа велосипед», «чинил велосипед папа», «велосипед папа чинил», «велосипед чинил папа», т.е. просто все возможные перестановки слов во фразе, фразы добавляются в тот же столбец, в качестве результата этой операции можно сформировать третий файл (в заголовках адреса страниц, под каждым все входные фразы и их вариации с перестановкой слов). Далее начинаем искать точное вхождение фраз из третьего файла во втором, результатом такого поиска становится четвертый файл, в первом столбце которого идет фраза из третьего файла, во втором адрес страницы (берется из заголовка столбца к которому относится фраза), в третьем столбце идет один первый текст в котором найдена фраза, если для фразы есть несколько текстов, то фраза и адрес страницы повторяются в первом и втором столбцах для каждого текста, в четвертом столбце идет текст из третьего столбца, только он содержит теги, сам текст находится в тегах <p></p>, а фраза, из столбца один в тексте выделена тегами <a href=””>ФРАЗА ФРАЗА</a>, где фраза является анкором, а в качестве адреса страницы в href=”” подставляется заголовок столбца (он же URL) к которому данная фраза относится. Если фраза из третьего файла не найдена во втором, то ее никуда не добавляем.
Данный скрипт должен работать для любого языка, даже если какая-то часть в текстах идет на английском, часть на французском, а часть на арабском. Скрипт должен быть регистронезависимым.
Примеры файлов прилагаю, для тестов могу скинуть файлы побольше.
Приложения 4
Отзыв заказчика о сотрудничестве с Євгеном Домерецьким
Обработка CSV фалов на Python с созданием новыхВсе сделано великолепно. Результатом больше чем доволен.
![]()
Отзыв фрилансера о сотрудничестве с заказчиком
Обработка CSV фалов на Python с созданием новыхПриятно сотрудничать, заказчик выходит на контакт быстро и ясно формулирует задачи)
-
360 12 1 1 Здравствуйте!
Задание не из тяжёлых, если имеются нормальные файлы. Но, после некоторых анализов, обнаружил, что среди файлов, которые вы предоставили, есть местами застарелая кодировка и на множествах устройств будут отображаться неправильно. Но все же, это не большая проблема, а так, нехитрые препятствия.
Итак, имею 2 года опита на python, и обработка csv файлов это одно из самих легких заданий. Идея понятная, интересует только максимальное количество слов в строке для перестановок. Потому что 10+ к примеру, ведет к большой затрате ресурсов с каждым словом в списке.
Напишу скрипт на Python, будет хорошо ранится на любых языках, и независимость регистра это большое упрощение к самому делу, так что это регистронезависимость по любому будет.
-
5235 29 1 1 Здравствуйте Дмитрий,
С легкостью выполню поставленную задачу, +- за день, если цена вас устраивает, хотелось бы уточнить детали.
буду рад сотрудничеству
-
4807 67 0 Здравствуйте.
Готов сделать на Python.Есть опыт в разработке
Готов сделать быстро и качественно
Учту Ваши пожелания
Пишите лс ваш тг обсудим детали
-
Добрый день.
Бюджет окончательный ? -
Актуальные фриланс-проекты в категории Python
Необходимо создать бота в ТГ для оплаты подписки.
2000 UAH
Необходимо создать бота в телеграме, где пользователь сможет оформить подписку на доступ к веб-камерам, которые находятся во дворе. Организовать в боте оплату двух видов подписок (на месяц и на один день). Бот должен автоматически проверять оплату и после выдавать ссылку-доступа. Python, Разработка ботов ∙ 10 часов 17 минут назад ∙ 62 ставки |
Python / Network Engineer: Сетевая оптимизация бота (WAF, Connection Pooling, Asyncio)Упрощенный вариант! Прошу откликнуться только тех, кто понимает и разбирается. О проекте: Автоматизированный бот для снайпинга. Базовая бизнес-логика (парсинг, авторизация, сборка JSON/XML пакетов) уже готова и работает на Python. Целевое окружение — Linux (Ubuntu). Текущая… Python, Парсинг данных ∙ 12 часов 46 минут назад ∙ 14 ставок |
Парсинг и классификация большого массива изображенийНеобходимо реализовать проект по сбору и структурированию большого массива архитектурных изображений из открытых веб-источников.Задача включает: автоматизированный сбор изображений; загрузка файлов в максимально доступном качестве; классификацию изображений по категориям:… Python, Парсинг данных ∙ 17 часов 16 минут назад ∙ 30 ставок |
Бизнес-логикa платформы: подтверждение занятий, контроль посещаемости-и история уроков (DjangoДоработка бизнес-логики образовательной платформы: подтверждение занятий, контроль посещаемости и история уроков (Django + React) Необходимо реализовать полноценную систему подтверждения уроков, контроля посещаемости и хранения истории подтверждений. Важно Перед началом… Python ∙ 2 дня 22 часа назад ∙ 29 ставок |
Доработка административной панели образовательной платформы (Django + React)Доработка административной панели образовательной платформы (Django + React) Описание проекта: Есть действующая образовательная платформа (marketplace, аналог Preply), разработанная на Django + React. Требуется доработать существующую административную панель и реализовать… Python, Веб-программирование ∙ 4 дня 19 часов назад ∙ 58 ставок |