• Вы здесь

    Каков объём Национального корпуса русского языка и как он структурирован?

    Нейро

    Ответ создан на основе результатов поиска

    Объём Национального корпуса русского языка составляет свыше 70 тысяч текстов общим объёмом свыше 150 миллионов словоупотреблений 5.
    Корпус структурирован следующим образом:
    • Основной корпус 12. Самый большой, в него включены тексты с XVIII по XXI век 1. Основной корпус можно подразделить на два главных массива: современные письменные тексты (середина XX — начало XXI века) и ранние тексты (середина XVIII — середина XX века) 2.
    • Корпус диалектных текстов 2. Включает записи диалектной речи в орфографии, приближенной к стандартной 2.
    • Акцентологический корпус 2. Включает тексты, несущие информацию об истории русского ударения 2.
    • Газетный корпус (корпус современных СМИ) 2. Охватывает статьи из средств массовой информации 2000-х годов 2.
    • Корпус поэтических текстов 2. Включает стихотворные произведения от XVIII века до современности 2.
    • Мультимедийный корпус 2. Включает фрагменты кинофильмов 1930–2000-х годов 2. Они представлены в виде параллельных видеоряда, аудиоряда и текстовой расшифровки звучащей речи, а также наблюдаемых в кадре жестов 2.
    • Корпус устной речи 2. Включает в себя расшифровки магнитофонных записей публичной и частной устной речи, а также транскрипты кинофильмов 2.
    • Обучающий корпус русского языка 2. Небольшой корпус со снятой омонимией, ориентированный на преподавание русского языка в школе 2.
    На основе 10 источников: