Диссертация
Большина Ангелина Сергеевна
Кандидат наук
Статус диссертации
Доктор наук
Доктор наук
Зацман Игорь Моисеевич
Доктор наук
Ляшевская Ольга Николаевна
Кандидат наук Профессор
филологические науки
Трансляция — https://youtu.be/ugaKuKNvQ_M . Диссертация посвящена исследованию методов автоматической генерации семантически размеченных обучающих коллекций. Актуальность обусловлена необходимостью разрешения лексической неоднозначности в условиях недостатка или отсутствия аннотированных данных. Целью работы является разработка метода автоматического сбора и разметки корпуса русского языка для задачи разрешения лексической многозначности. В рамках настоящего исследования рассматривается подход, основанный на однозначных родственных словах. Теоретическая значимость состоит в дальнейшей разработке метода генерации обучающих коллекции на основе однозначных родственных слов для русского языка. Практическая значимость определяется возможностью применения разработанного подхода к автоматической генерации и разметке обучающих коллекций для задачи снятия лексической неоднозначности, а также для других задач, где требуется семантическая разметка текстов. Предложенная система способна обеспечивать подавляющее большинство многозначных слов и их значений из тезауруса RuWordNet обучающими примерами. Она также обладает компонентом фильтрации, повышающим релевантность примеров, добавляемых в обучающую коллекцию.
# | Название | Размер |
---|