№2(5), 2016 - Рубрики и аннотации
Автоматическая обработка текста
Дыбо А.В., Шеймович А.В.
Аппарат автоматического морфологического анализа для корпуса хакасского языка
В статье освещается работа по созданию корпуса текстов хакасского языка и снабжению его научным аппаратом, а именно — инструментами морфологического анализа. Основное внимание уделяется созданию компьютерно ориентированной модели хакасской словоформы. Работа ведется в рамках масштабного проекта по созданию корпусных ресурсов языков народов России, в частности корпусов на малых тюркских языках РФ. Алгоритм автоматического морфологического аннотирования базируется на словаре, учитывающем фонетическое чередование внутри основы, и на компьютерной модели словоформы. В настоящей работе представлена попытка создания такой модели и определения набора фонетических правил, которые ограничивают выбор компонентов словоформы.
Ключевые слова: корпус языка, морфологическая разметка, морфологический анализатор, словоизменение, компьютерно ориентированная модель словоформы, система StarLing
Читать статью целиком...
Бахтоваршоев А.Ш.
Транслитерация памирских языков
В статье рассмотрен вопрос о преобразовании (транслитерации) алфавитов некоторых памирских языков (шугнанского и рушанского) с кириллицы на латиницу и наоборот. Предложена и проанализирована конкретная таблица преобразования алфавитов по системам А и Б. Показано, что предложенная таблица сохраняет естественную частоту появления символов на данных языках и может быть использована в практической работе.
Ключевые слова: информационные технологии, транслитерация, памирские языки, шугнанский язык, рушанский язык
Читать статью целиком...