Новости партнеров
Новости

ИИ сможет самообучаться на текстах без помощи человека

11.04.2024 08:00|ПсковКомментариев: 0

Ученые МФТИ создали технологию для автоматической подготовки нейросетями текстовых данных, необходимых для обучения искусственного интеллекта. Теперь эту операцию смогут выполнять большие языковые модели, самая известная из которых — ChatGPT.

Такую обязательную подготовительную работу называют разметкой. До последнего времени ее мог выполнять только человек — аннотатор либо специально подобранный краудсорсер (сотрудники из внешней команды, которые улучшает работу ИИ).

Эти специалисты тщательно разбирают большое количество примеров, из которых машина должна выявлять закономерности. Данные нужно правильно подготовить, чтобы ИИ сделал верные выводы. Но это монотонная работа, на которую уходит до нескольких месяцев. С помощью ИИ этот процесс можно завершить в три раза быстрее и в два раза дешевле, чем раньше. Однако полностью не зависеть от людей машинам пока не удастся — им нужна будет помощь с построением иерархии.

«С помощью большой языковой модели можно добиться высокого качества обработки информации. Однако для этого потребовалось создать многоступенчатую иерархическую схему для разметки. В таком случае в процессе обучения эксперты требуются только для этой работы», — сказала исследователь и аналитик лаборатории нейронных систем и глубокого обучения МФТИ Мария Молчанова.

При разработке системы специалистам удалось с помощью ChatGPT сымитировать человеческую разметку лингвистических данных для обучения моделей. Теперь методологию можно широко использовать для разметки текстов, пишут «Известия».

ПЛН в телеграм
 

 
опрос
Где будете отдыхать на майских праздниках?
В опросе приняло участие 186 человек
Лента новостей