Розъединить большой md файл
Есть 2 файла формата .md, размер каждого ~140 МБ. Необходимо разделить каждый файл на 6 частей, примерно равных по размеру, сохраняя корректность структуры Markdown (заголовки, списки, абзацы). Результат: 12 файлов с названиями fileX_partY.md
Описание задачи:
Есть файл occupations.csv (~3000 строк, 13 колонок). Важные поля:
CODE,PREFERREDLABEL,ALTLABELS,ISCOGROUPCODE,DESCRIPTION.
Нужно:
Корректно обработать CSV с учётом
\nвнутри ячеек (нельзя «резать по строкам»).Разбить профессии на 6 частей по логике ISCO (группировка по первым двум цифрам
ISCOGROUPCODE).Для каждой записи сгенерировать Markdown-блок строго по шаблону:
## {CODE} — {PREFERREDLABEL}
- ISCO: {ISCOGROUPCODE}
- Synonyms:
- {ALTLABELS}
- SourceID: {ID}
- OriginURI: {ORIGINURI}
### Description
{DESCRIPTION | "—"}
### Responsibilities
<!-- пусто -->
### Requirements
<!-- пусто -->
В каждом файле — TOC (оглавление) со ссылками-якорями на профессии.
Сохранить 6 файлов
occupations_partX.md+summary.md(таблица распределения).Прикрепить рабочий скрипт (Python/pandas) для воспроизводимости.
Требования:
Кодировка UTF-8 без BOM.
Экранировать спецсимволы Markdown.
Сверка количества строк и уникальности
CODE.
Больше информации в файле ТЗ
Описание задачи:
Есть файл occupations.csv (~3000 строк, 13 колонок). Важные поля:
CODE,PREFERREDLABEL,ALTLABELS,ISCOGROUPCODE,DESCRIPTION.
Нужно:
Корректно обработать CSV с учётом
\nвнутри ячеек (нельзя «резать по строкам»).Разбить профессии на 6 частей по логике ISCO (группировка по первым двум цифрам
ISCOGROUPCODE).Для каждой записи сгенерировать Markdown-блок строго по шаблону:
## {CODE} — {PREFERREDLABEL}
- ISCO: {ISCOGROUPCODE}
- Synonyms:
- {ALTLABELS}
- SourceID: {ID}
- OriginURI: {ORIGINURI}
### Description
{DESCRIPTION | "—"}
### Responsibilities
<!-- пусто -->
### Requirements
<!-- пусто -->
В каждом файле — TOC (оглавление) со ссылками-якорями на профессии.
Сохранить 6 файлов
occupations_partX.md+summary.md(таблица распределения).Прикрепить рабочий скрипт (Python/pandas) для воспроизводимости.
Требования:
Кодировка UTF-8 без BOM.
Экранировать спецсимволы Markdown.
Сверка количества строк и уникальности
CODE.
Приложения 1
Отзыв заказчика о сотрудничестве с Артемом Плахой
Розъединить большой md файлВсе вчасно та за домовленостями.
Отзыв фрилансера о сотрудничестве с Яной Корсак
Розъединить большой md файлЗавершили небольшой проект с паней Яной, немного не поняли на уровне ТЗ, но все обсудили и решили. Рекомендую к сотрудничеству
-
Добрый день. Нужно обсудить детали, так как если разделять просто по строкам, то может быть повреждение структуры. Буду рад сотрудничеству.
-
9340 20 0 1 Добрый день
Я ознакомился с вашим заданием и готов его выполнить. Я разработаю скрипт на Python, который корректно разделит ваши файлы, а также обработает CSV и сгенерирует Markdown-блоки согласно вашим требованиям.
-
3305 70 1 Здравствуйте.
Смогу это сделать, согласно ТЗ и шаблону в описании, что привели
-
97052 1277 1 10 Привет. Работаю с Python. Готов реализовать скрипт. Обращайтесь. Буду рад сотрудничеству.
-
2208 18 3 Добрый день, Яна. У меня есть опыт с похожими кейсами, выполню с использованием Python, по желанию могу предоставить Вам и сам скрипт для дальнейшего использования. Если заинтересовало - пишите, с радостью обсудим детали.
-
Готов помочь вам после уточнения ТЗ
Вы написали разделить на 6 частей, но в результате написали 12 файлов
-
Привет, я работал над проектом "Folder", где разделял файлы по 120 МБ на равные части с корректным Markdown, обработал 8 таких файлов. Есть ли у ваших файлах сложные вложения списков или таблиц? ✨
Предлагаю связаться, я бесплатно проконсультирую вас с технической стороны и составим план разработки + расскажу о моей команде!
-
311 Добрый день. Готов выполнить ваш проект. У меня большой опыт в реализации подобных скриптов. Больше деталей предлагаю обсудить в личных сообщениях
-
351 1 0 Добрый день, есть опыт работы с большими json, txt, md, xlsx файлами, присылайте, разобью по частям, форматировку сохраню. Сделаю для вас скрипт, который сможете сами запустить и разбить в будущем любой вам нужный файл такого формата
-
116 Добрый день, Яна.
Меня заинтересовало ваше задание.
Пишите для обсуждения деталей.
-
3350 148 4 1 Добрый день.
Смогу вам написать код для обработки файла. Сами сможете его запускать, когда вам нужно.
Если у вас есть вопросы, можете написать мне в ЛС.
-
667 8 0 Добрый день, Яна.
Меня заинтересовало ваше задание.
Пишите для обсуждения деталей.
Актуальные фриланс-проекты в категории Python
Разработка программного обеспечения для управления iPhone через USB-кабель с ПК
10 000 UAH
Необходимо разработать программу для Windows, которая позволяет подключать iPhone с jailbreak через USB-кабель и управлять им с компьютера. Основной функционал: Подключение iPhone через USB. Программа должна быстро распознавать подключенный iPhone и работать через кабель,… C и C++, Python ∙ 1 день 10 часов назад ∙ 17 ставок |
BuzzPost автоматизация Facebook под ИзраильПроект уже есть и он работает - задача решить вопрос по ограничению фб, при количестве постов в час более 3-4 (с 7 утра до 12 ночи) аккаунты клиентов ограничиваются фб. сайт - https://buzzpost.co.il/ Также поискать дыры в логике и в самом проекте и поправить их, опять же логика… Python, Работа с клиентами ∙ 2 дня 7 часов назад ∙ 15 ставок |
AI Commenting Platform для TikTok и Instagram.Цель проекта Разработать систему, которая позволяет управлять большим количеством аккаунтов TikTok и Instagram и автоматически публиковать релевантные комментарии под выбранными видео с использованием ИИ. Основной функционал1. Управление аккаунтами Необходимо реализовать… AI и машинное обучение, Python ∙ 6 дней 9 часов назад ∙ 23 ставки |
Построить модель классификации клиентов1. Есть данные клиентов в Mongo/SQL (примерно 20 000 записей с сырыми данными). 2. Необходимо на их основе построить фичи и модель классификации клиентов на поведенческие группы. 3. Проект выполнить на Python. AI и машинное обучение, Python ∙ 8 дней 3 часа назад ∙ 46 ставок |
ИТ Автоматизация ведения VAT-отчетности
10 000 UAH
Необходимо разработать систему для автоматизации переноса данных о продажах из CRM в бухгалтерскую систему Wafeq. Система должна импортировать банковские и платежные отчеты, автоматически сверять платежи с инвойсами, формировать инвойсы для VAT-отчетности и минимизировать ручную… AI и машинное обучение, Python ∙ 8 дней 9 часов назад ∙ 52 ставки |