Parsing data using Deep Learning and Natural Language Understanding
23 USDУниверситетский проект. Нужно написать код, чтобы парсились данные из сайта . "Примечание: есть начало проекта, которое нужно доделать и желательно ничего не изменять. Надеюсь это поможет в работе).
На русском:
1. Получите текстовые данные либо от семантического исследователя, либо от arXiv.org для всех статей, в которых цитируется BERT (прямое цитирование, группа 1) или цитируется статья, которая сама цитирует BERT (косвенное цитирование, первый уровень, группа 2). o Получите аннотацию в качестве данных «основного текста» и следующие метаданные ▪ Авторы, название, дата публикации, конференция или журнал, где указано ▪ Принадлежность авторов и ключевые слова (теги), если они указаны ▪ Статьи, которые цитировались (ссылки ))
2. Используйте задачи глубокого обучения и понимания естественного языка, чтобы узнать о следующем (подсказка: не каждый отдельный аспект будет присутствовать в каждом реферате) o Категория (либо одна, либо несколько в статье), например, путем классификации. или кластеризация o Название модели и язык, на котором обучается представленная модель (например, статья «Следующая языковая модель Германии» цитирует BERT, но обучает Electra на немецких данных, статья «Об анализе вьетнамских настроений: метод трансферного обучения»). ”обучает BERT на вьетнамских данных) o Область применения, например, юридические данные, медицинские данные, научные статьи, … o Задача машинного обучения, к которой относится статья, например, ответы на вопросы, анализ настроений, нейронный машинный перевод, … o производительность модели на стандартизированных тестовых данных, например, SQuAD 2.0, GLUE, … (BLEU, оценка F1, точность и полнота, все, что упоминается в аннотации)
3. Поместите всю извлеченную информацию в базу данных neo4j. o Подумайте о хорошей модели графа, отражающей данные (например, узлы: статья, автор, организация, мл-задача, мл-модель, язык и ребра: является автором, связан с, применяется). -к, ...)
Оригинал:
1. Acquire text data from either semantic scholar or arXiv.org for all papers that cite BERT (direct cites, group1) or cite a paper that itself cites BERT (indirect cites, first level, group2). o Acquire the abstract as the “main text” data and the following metadata ▪ The authors, title, publishing date, conference, or journal, where stated ▪ The authors’ affiliation and keywords (tags) if stated ▪ Papers that were cited (references)
2. Use deep learning and natural language understanding tasks to find out about the following (hint: not every single aspect will be present in every abstract) o A category (either a single one or multiple ones per paper), e.g., by doing classification or clustering o The name of the model and the language that the presented model is trained on (e.g., the paper “Germany’s next language model” cites BERT but trains Electra on German data, the paper “On Vietnamese Sentiment Analysis: A Transfer Learning Method” trains BERT on Vietnamese data) o The application domain, e.g., legal data, medical data, scientific articles, … o The machine learning task, the paper deals with, e.g., question answering, sentiment analysis, neural machine translation, … o The performance of the model on standardized test data, e.g., SQuAD 2.0, GLUE, … (BLEU, F1 score, precision and recall, whatever is mentioned in the abstract)
3. Put all extracted information into a neo4j database.
o Think of a good graph model to reflect the data (e.g., the nodes: paper, author,
organization, ml-task, ml-model, language and the edges: is-author-of, is-affiliated with,
is-applied-to, …)
Current freelance projects in the category Python
Development of software with AIIt is necessary to develop software for automatic detection, capturing, and tracking of an object using a video camera and a rotating mechanism.Output data: Video camera with optics. Rotating device on two axes (azimuth/elevation angle). Servomotors controlled via Modbus… AI & Machine Learning, Python ∙ 23 hours 38 minutes back ∙ 13 proposals |
Technical Specification for Refinement of AI Bot for Generating Personalized SongsTECHNICAL TASK FOR IMPROVING THE AI PERSONAL SONG GENERATOR BOTMAIN GOAL Create a stable premium product that: generates the highest quality personal songs; does not fabricate facts about the client; works stably under load; is easily scalable; allows for analysis and… Python, Bot Development ∙ 1 day back ∙ 30 proposals |
Automation of processes through API and PythonBelow I described the current process and the result I would like to achieve. I also attach files of the real process to better understand how it looks in reality Current process Currently, the entire process is performed manually: uploading/downloading files, transferring… AI & Machine Learning, Python ∙ 1 day 4 hours back ∙ 43 proposals |
A bot needs to be created in Telegram for subscription payment.
45 USD
A bot needs to be created in Telegram where users can subscribe for access to the webcams located in the yard. Organize payment for two types of subscriptions (monthly and daily) in the bot. The bot should automatically check the payment and then provide access links. Python, Bot Development ∙ 1 day 17 hours back ∙ 78 proposals |
Business logic of the platform: class confirmation, attendance control, and lesson history (DjangoRefinement of the business logic of the educational platform: lesson confirmation, attendance control, and lesson history (Django + React) A complete system for lesson confirmation, attendance control, and storage of confirmation history needs to be implemented. Important… Python ∙ 4 days 5 hours back ∙ 30 proposals |