В. П. Захаров Корпусная лингвистика


Скачать 0.5 Mb.
Название В. П. Захаров Корпусная лингвистика
страница 3/5
Тип Учебно-методическое пособие
rykovodstvo.ru > Руководство эксплуатация > Учебно-методическое пособие
1   2   3   4   5

Collocation Sampler



Type in your word:

Select a significance score to be calculated:

Mutual Information
T-score

To get collocations, press this button:

Note that output from this demo facility will be restricted to 100 collocates. These
will be the statistically most significant ones according to the score you have selected.


Collocation for ‘CORPUS’

Collocate

Corpus Freq

Joint Freq

Significance

the

2313407

189

5.540490

erm

84143

26

4.294184

million

15796

19

4.182154

christi

27

17

4.122786

spoken

1542

17

4.104865

er

98042

23

3.798765

a

973489

81

3.724491

habeas

12

12

3.463933

word

7972

11

3.199393

mm

73646

16

3.102023

software

1216

9

2.980231

based

7749

9

2.874020

Рис. 4. Интерфейс для вычисления коэффициента совместной встречаемости и образец выдачи в корпусе COBUILD

Приложение 2

Метаданные текстов в «Национальном корпусе
русского языка» (НКРЯ)


Метаописание в НКРЯ состоит из двух блоков, первый из которых включает следующие признаки:

1) Автор текста: имя, пол, дата рождения (или примерный возраст);

2) Название текста;

3) Время создания текста (точно или приблизительно);

4) Объем текста: для художественных произведений принято, что обычная длина рассказа — менее 5 тыс. слов; обычная длина повести — от 5 до 15 тыс. слов; обычная длина романа — более 15 тыс. слов.

Второй блок содержит параметры метаописания трех основных массивов текстов корпуса: а) художественных текстов; б) нехудо-жественных текстов; в) драматургии.

Для художественных текстов предлагаются следующие параметры:

1) Жанр текста: нежанровая проза, автобиографическая проза, детектив, детская литература, историческая проза, криминальная литература, приключения, фантастика, юмор и сатира;

2) Тип текста: автобиографическая проза, ассоциативная проза, очерк, литературное письмо, повесть, пьеса, рассказ, роман, сказка, эссе;

3) Хронотоп текста (приблизительное указание на место и время описываемых в тексте событий; включается также помета «хронотоп не определен»). Реально предлагается следующее: древний Восток; Россия XVII в.; Россия XVIII в.; Россия XIX в.; Россия/СССР: советский период в целом; Россия, советский период – Германия 1920–1940-е; Россия/СССР – Европа 1960–1980-е; Россия/СССР: перестройка; Россия/СССР: советский и постсоветский период; Америка: современная жизнь; Америка: 1960–1980-е; Израиль: современная жизнь; Средняя Азия: современная жизнь; ирреальный мир и некоторые другие.

Для нехудожественных текстов установлены следующие параметры:

1) Тип текста: автобиография, дневник, договор, документ, закон, заметка, заявление, инструкция, информационное сообщение, кодекс, комментарий, объявление, отзыв, отчет, очерк, письмо, проповедь, резюме, рецензия, рецепт, сочинение, справочник, статья, учебник, характеристика, хроника, эссе, юридический документ (включается также помета «тип не определен») и пр. (всего 62 параметра).

2) Тематика текста: (открытый список в 5 подмножествах): бизнес, коммерция, экономика, финансы; война и вооруженные конфликты; дом; здоровье и медицина; досуг; искусство; криминал; наука (по разделам и отраслям); политика и общественная жизнь; право; производство; сельское хозяйство; спорт; природа; частная жизнь и т.п.

Помимо названной, в «Национальном корпусе» существует еще служебная или «имплицитная» метаразметка, которая не выносится на открытый доступ для широкого пользователя. К этой метаразметке относятся:

1) «текст-стиль», при этом выделяются академический, научно-популярный, официально-деловой, нейтральный, сниженный, сниженный с элементами грубого просторечия и жаргона, архаизованный, индивидуально-авторский, диалектный и пр. (всего 21);

2) аудитория-возраст;

3) аудитория-уровень образования;

4) аудитория-размер.

1   2   3   4   5

Похожие:

В. П. Захаров Корпусная лингвистика icon Образовательная программа: «Прикладная и экспериментальная лингвистика»...
Кластеризация языковых выражений в корпусе текстов на основе стохастического ранжирования
В. П. Захаров Корпусная лингвистика icon Образовательная программа: «Прикладная и экспериментальная лингвистика»...
Задачи и методы их решения, общие для корпусной лингвистики, машинного перевода и компьютерной лексикографии 8
В. П. Захаров Корпусная лингвистика icon Программа дисциплины «Литература стран изучаемого языка» для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов, обучающихся по направлению...
В. П. Захаров Корпусная лингвистика icon Учебно-методический комплекс дисциплина: квантитативная лингвистика...
Программа дисциплины «квантитативная лингвистика и новые информационные технологии» 4
В. П. Захаров Корпусная лингвистика icon Паспорт программы дисциплины Область применения программы рабочая...
Лингвистика профиль (45. 03. 02. 02 Перевод и переводоведение) в соответствии с фгос впо по направлению подготовки 45. 03. 02 лингвистика...
В. П. Захаров Корпусная лингвистика icon Программа практики (производственной) по направлению 031100. 62 «Лингвистика»
Программа практики (производственной), для студентов, обучающихся по направлению 031100. 62 «Лингвистика». М.: Ноу впо мгта, 2012....
В. П. Захаров Корпусная лингвистика icon Программа дисциплины Теоретическая и прикладная лексикография для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и бакалавров направления подготовки 035800....
В. П. Захаров Корпусная лингвистика icon Захаров А. И. "Дневные и ночные страхи у детей". Спб.: Издательство "Союз", 2004
Источник: Захаров А. И. "Дневные и ночные страхи у детей". Спб.: Издательство "Союз", 2004
В. П. Захаров Корпусная лингвистика icon Инструкция по пользованию. Цветная Корпусная видеокамера «День/Ночь»
Внимательно изучите инструкцию по применению и эксплуатации камеры и сохраните её для дальнейшего использования
В. П. Захаров Корпусная лингвистика icon Захаров Валерий Михайлович
Почтовый адрес: 662200, Красноярский край, г. Назарово, Микрорайон Березовая роща, д. 31
В. П. Захаров Корпусная лингвистика icon Протокол
Н., Матвеев П. М., Малолеткова И. С., Инжутов И. С., Козинов Г. Л., Шайдуров Г. Я.,Шилов Н. С.,Баранов А. М., Антонов Н. М., Шиманский...
В. П. Захаров Корпусная лингвистика icon Программа научно-исследовательской практики (2 курс) Направление...

В. П. Захаров Корпусная лингвистика icon Образовательная программа "Прикладная лингвистика"
Современные тенденции изменения датской произносительной нормы на примере гласного «шва»
В. П. Захаров Корпусная лингвистика icon Iv корпусная Научная практическая конференция «Первые шаги в науку...
В результате средние дозы облучения человека достигают удвоенного естественного фона. Поэтому в современных условиях недопустимо...
В. П. Захаров Корпусная лингвистика icon Основная образовательная программа магистратуры по направлению подготовки...
Федеральное государственное бюджетное образовательное учреждение высшего образования
В. П. Захаров Корпусная лингвистика icon Основная образовательная программа бакалавриата по направлению подготовки...
Федеральное государственное бюджетное образовательное учреждение высшего образования

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск