Парсинг данных Python
2000 UAHДобрый день.
Нужно спарсить данные с Википедии, для магистерской работы.
Вот проблематика :
Zero-Shot Learning refers to the prediction of classes for which a classifier did not see samples during training. Typically, this is achieved by embedding samples and classes and assigning them. Some research has already been done in the image domain, but less in the text domain. Many documents also have a network structure (e.g. quotations). However, the availability of evaluation data records with both modalities (network + text) is limited. Knowledge diagrams such as DBpedia offer the potential to create such data sets because they often contain textual descriptions of nodes.
The aim of the paper is to extract a data set from DBpedia that allows zero-shot approaches to be evaluated that include both modalities. The evaluation should be possible on a small and large scale and the work should provide the basis for the data set.
Задача :
To do the main part with the data set extraction from Wikipedia and to log all problems and procedures, as well as source code.
Only the data record extraction and the logging in addition. Introduction, etc, I do of course myself
-
Много разных сайтов парсил на Питоне, olx, booking, сайти с обоями и т.д. Но не очень понятно что нужно сделать. Просто спарсить какую-то категорию?
Python - это простой и понятный язык. У меня прога написана на windows, а работает даже на андроиде без правок.
-
Актуальные фриланс-проекты в категории Парсинг данных
OpenCart — каталог аренды спецтехники
6000 UAH
OpenCart — каталог аренды спецтехникиНеобходимо запустить каталог аренды спецтехники на OpenCart.Тематика:экскаваторыавтовышкипогрузчикигенераторыкраныстроительные лесадругая строительная техника.Желательно, чтобы у вас уже был готовый шаблон или наработки под спецтехнику,… Веб-программирование, Парсинг данных ∙ 15 часов 53 минуты назад ∙ 42 ставки |
Перенести программу - слетел сервер, где была программа (официальный разрешенный парсинг гос данных)
2066 UAH
Добрый! У меня у клиента произошел данный кейс описанный ниже. Нужно помочь перенести на новый сервер и оттестировать программу. Лучше программист, который разбирается в парсинге. Настройка ПО и серверов, Парсинг данных ∙ 19 часов 46 минут назад ∙ 25 ставок |
Парсинг и классификация большого массива изображенийНеобходимо реализовать проект по сбору и структурированию большого массива архитектурных изображений из открытых веб-источников.Задача включает: автоматизированный сбор изображений; загрузка файлов в максимально доступном качестве; классификацию изображений по категориям:… Python, Парсинг данных ∙ 20 часов 14 минут назад ∙ 30 ставок |
Парсинг Резюме Work.ua та Rabota.uaНеобходимо загрузить в формате Excel базу актуальных резюме с Work.ua и Работа.ua. Желательно, чтобы файл Excel содержал следующие столбцы: Имя Номер телефона (в формате +380...) Электронная почта Должность (профессия) Должности, которые рассматривает Категория сферы… Поиск и сбор информации, Парсинг данных ∙ 1 день 19 часов назад ∙ 18 ставок |
Парсинг сайтаТребуется реализация 4 парсеров (сайты каталоги) Есть тз, есть пример кода как референс . В задачи входит: Написать парсер Прикрутить прокси Логика дедубликации (перенести логику из примера) Логика хешированя по 3 полям Парсер должен работать как пайплайн с логикой что… Парсинг данных ∙ 2 дня 12 часов назад ∙ 42 ставки |