Данило Немченко
Рейтинг
Резюме
1. Робочий алгоритм виконання (Checklist)
Щоб робота була монотонною, але точною, дійте за таким циклом:
Пошук джерела: Використовуйте спеціалізовані агрегатори, крім звичайного Google. Часто посилання на GTFS лежать у:
Mobility Database (найкращий ресурс для GTFS).
Відкриті портали даних міст (Open Data Portals).
Офіційні сайти перевізників (розділ «Developer API» або «Open Data»).
Валідація посилання:
Натисніть на знайдене посилання. Якщо файл почав завантажуватися (формат
.zip) — це воно.Важливо: Перевірте дату останнього оновлення в
feed_info.txtвсередині архіву (якщо є), щоб переконатися, що це не дані 2020 року.
Внесення в таблицю:
Копіюйте пряме посилання (яке веде на
.zip).Додайте статус (Активно/Не знайдено).
2. Як оптимізувати процес (Поради)
Інструмент: Використовуйте Google Sheets. Якщо у вас є 110 перевізників, створіть стовпці: Назва перевізника, Країна, Посилання на GTFS, Дата перевірки, Статус.
Перевірка посилань: Щоб не відкривати 110 вкладок, можна використовувати плагін для браузера типу «Check My Links» або простий Python-скрипт (якщо ви вмієте), який перевіряє, чи повертає посилання код
200 OKі чи має воно типapplication/zip.Складні випадки: Якщо для перевізника немає GTFS (буває часто у малих автобусних компаній), позначайте це як «Not Available» — це теж результат роботи.
3. Технічні нюанси GTFS
Шукайте саме Schedule feeds (розклад), а не Realtime (дані в реальному часі).
Якщо сайт перевізника пропонує API (наприклад, через платформу Trapeze або HAFAS), шукайте сторінку «Open Data», де часто публікують статичні файли розкладу.
Чи потрібна вам допомога з:
Складанням формул у таблиці для автоматичної перевірки статусів?
Списком надійних ресурсів-агрегаторів (крім Mobility Database), де можна шукати GTFS по Європі?
Якщо ви будете виконувати це завдання для клієнта, не забудьте узгодити з ним, що робити з перевізниками, для яких GTFS-файли взагалі не передбачені (чи залишати клітинку порожньою, чи писати "No data").