Обробка CSV фальсів в Python з створенням нових
Є два вхідні файли CSV UTF-8 розділитель - точка з запітом.У першому файлі знаходяться адреси сторінок (URL), йдуть як заголовки стовпів, під кожним URL йдуть фрази в стовпи.Другий файл набір дрібних текстів, кожен текст у своєму рядку.Для першого файлу необхідно доповнити стовпчики усіма можливими комбінаціями фраз, які є в даному стовпчику, наприклад, у першому стовпчику є фраза «мама мила» і «папа зробив велосипед», до них додається «мила мама», «папа велосипед зробив», «чинил папа велосипед», «чинил велосипед папа», «чинил велосипед папа», «чинил велосипед папа», «чинил велосипед папа», тобто.Просто всі можливі перестановки слів у фразі, фрази додаються в той же стовп, в результаті цієї операції можна сформувати третій файл (у заголовках адреси сторінок, під кожним всі вхідні фрази і їх варіанти з перестановкою слів).Потім починаємо шукати точне введення фрази з третього файлу в другий, результатом такого пошуку стає четвертий файл, у першому стовпці якого йде фраза з третього файлу, у другому адресі сторінки (береться з заголовку стовпця до якого відноситься фраза), у третьому стовпці йде один перший текст, в якому знайдена фраза, якщо для фрази є кілька текстів, то фраза і адреса сторінки повторюються в першому і другому стовпцях для кожного тексту, у четвертому стовпці йде текст з третього стовпця, тільки він містить теги, сам текст знаходиться в тегах , а фраза, з стовпця один в текст виділена тегами ФРАЗА ФРАЗА, де фраза є анкором, а в якостіЯкщо фраза з третього файлу не знайдена у другому, то її ніде не додаємо.Цей скрипт повинен працювати для будь-якої мови, навіть якщо якась частина в текстах йде англійською, частина французькою, а частина арабською.Скрипт повинен бути реєстронезалежним.Приклади файлів додаю, для тестів можу скачати файли більше.
Додатки 4
Відгук замовника про співпрацю з Євгеном Домерецьким
Обробка CSV фальсів в Python з створенням новихВсе зроблено чудово. Результатом більше, ніж задоволений.
![]()
Відгук фрилансера про співпрацю з замовником
Обробка CSV фальсів в Python з створенням новихПриємно співпрацювати, клієнт виходить на контакт швидко і чітко формулює завдання)
-
360 12 1 1 Здравствуйте!
Задание не из тяжёлых, если имеются нормальные файлы. Но, после некоторых анализов, обнаружил, что среди файлов, которые вы предоставили, есть местами застарелая кодировка и на множествах устройств будут отображаться неправильно. Но все же, это не большая проблема, а так, нехитрые препятствия.
Итак, имею 2 года опита на python, и обработка csv файлов это одно из самих легких заданий. Идея понятная, интересует только максимальное количество слов в строке для перестановок. Потому что 10+ к примеру, ведет к большой затрате ресурсов с каждым словом в списке.
Напишу скрипт на Python, будет хорошо ранится на любых языках, и независимость регистра это большое упрощение к самому делу, так что это регистронезависимость по любому будет.
-
5235 29 1 1 Здравствуйте Дмитрий,
С легкостью выполню поставленную задачу, +- за день, если цена вас устраивает, хотелось бы уточнить детали.
буду рад сотрудничеству
-
4796 67 0 Здравствуйте.
Готов сделать на Python.Есть опыт в разработке
Готов сделать быстро и качественно
Учту Ваши пожелания
Пишите лс ваш тг обсудим детали
-
Добрый день.
Бюджет окончательный ? -
Актуальні фриланс-проєкти в категорії Python
Створення Human AI Assistant для Telegram-групп### 1.1. Ключова концепція системи Система повинна виконувати дві основні функції: #### 1. Аналіз клієнтської комунікації AI-асистент має автоматично аналізувати всю комунікацію в Telegram-групах та розуміти контекст спілкування. Зокрема система повинна: - визначати… AI та машинне навчання, Python ∙ 6 годин 6 хвилин тому ∙ 15 ставок |
Чорна Україна (RP-проект на базі MTA)
51 525 UAH
|
Необхідно створити букмекерську контору! З ДОСВІДОМПотрібно розробити betting-платформу / букмекерський продукт на базі готового шаблону. Основне завдання — адаптувати шаблон під повноцінну букмекерську контору: підключити парсинг спортивних подій і коефіцієнтів, реалізувати особистий кабінет користувача, баланс, ставки, історію… Python, Веб-програмування ∙ 6 годин 43 хвилини тому ∙ 16 ставок |
Автоматизація розсилки повідомлень у чати TelegramПотрібно розсилати в телеграм чати повідомлення. Щоб не було банів. Чатів кілька сотень. Щоб налаштовувати періодичність і варіативність текстів. Python, Розробка ботів ∙ 6 годин 54 хвилини тому ∙ 21 ставка |
Розробка програмного забезпечення з ШІПотрібно розробити програмне забезпечення для автоматичного виявлення, захоплення та супроводження об'єкта за допомогою відеокамери та поворотного механізму.Вихідні дані: Відеокамера з оптикою. Поворотний пристрій по двох осях (азимут/кут місця). Сервоприводи з керуванням через… AI та машинне навчання, Python ∙ 1 день 13 годин тому ∙ 16 ставок |