Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему по иностранному языку Лингвистический корпус как дидактический ресурс

Актуальность темыЛюбое исследование, осуществляемое лингвистом, должно быть ориентировано, по меньшей мере, на следующие этапы деятельности: 1) выбор принципов и оснований («эталонов») классификации изучаемых объектов; 2) процесс распределения объектов по классам в соответствии с этими основаниями («эталонами»); 3)
Лингвистический корпус как дидактический ресурс Актуальность темыЛюбое исследование, осуществляемое лингвистом, должно быть ориентировано, по меньшей мере, на Что такое лингвистический корпусКорпусная лингвистика появилась в 60-е гг. ХХ в., преимущественно Корпусная лингвистика как раздел языкознанияКорпусная лингвистика как отдельный раздел языкознания окончательно сформировалась Основные свойства корпуса Классификация корпусов Лингвистические корпуса русского языка Лингвистические корпуса английского языка Лингвистические корпуса немецкого языка Доступность корпусовСущественным критерием выступает доступность корпуса текстов в электронном виде. Все существующее Разметка корпусаСледующим существенным признаком лингвистического корпуса текстов является наличие или отсутствие разметки, Репрезентативность корпусаПрежде всего, речь идет о так называемой репрезентативности корпуса текстов. По Простота корпусаНемаловажным критерием при определении корпуса выступает также и простота его использования, Благодарю за внимание!
Слайды презентации

Слайд 2 Актуальность темы
Любое исследование, осуществляемое лингвистом, должно быть ориентировано,

Актуальность темыЛюбое исследование, осуществляемое лингвистом, должно быть ориентировано, по меньшей мере,

по меньшей мере, на следующие этапы деятельности:
1) выбор принципов

и оснований («эталонов») классификации изучаемых объектов;
2) процесс распределения объектов по классам в соответствии с этими основаниями («эталонами»);
3) осмысление, интерпретация, истолкование результатов распределения объектов по классам, объяснение причин такого распределения [Мельников, 2003. С. 29].
При этом первый этап данной деятельности подразумевает наличие «изучаемых объектов», т. е. сбор эмпирического материала для построения назавершающем этапе исследования теории.
В настоящее время все большую популярность при сборе и анализе практического материала приобретает корпусная лингвистика. И это естественный шаг в лингвистике вслед за стремительным развитием информационных технологий.


Слайд 3 Что такое лингвистический корпус
Корпусная лингвистика появилась в 60-е

Что такое лингвистический корпусКорпусная лингвистика появилась в 60-е гг. ХХ в.,

гг. ХХ в., преимущественно на материале английского языка, но

очень быстро начали возникать корпуса на базе и других языков. В Брауновском Бниверситете США в 1963 г. учеными У. Н. Френсисом и Г. Кучерой был создан первый корпус текстов на электронном носителе (Брауновский корпус, свободный доступ с сайта университета Лидс: http://corpus.leeds.ac.uk/ protected/).
В нем содержалось 500 текстов 15 самых популярных жанров англоязычной прозы США по 2 000 слов в каждом. К корпусу прилагались указатель частотности и алфавитно-частотный указатель, а также некоторые статистические распределения.
Корпусом считается собрание текстов одного или нескольких языков, связанных между собой определенными параметрами.
Корпус представляет собой собрание письменных и устных высказываний. Данные корпуса, как правило, оцифровываются, т. е. хранятся на компьютерах и доступны в электронном виде. При этом составные части корпуса, тексты, состоят из данных, а также, возможно, из метаданных, описывающих эти данные, и из лингвистических аннотаций, которые эти данные упорядочивают.


Слайд 4 Корпусная лингвистика как раздел языкознания
Корпусная лингвистика как отдельный

Корпусная лингвистика как раздел языкознанияКорпусная лингвистика как отдельный раздел языкознания окончательно

раздел языкознания окончательно сформировалась в первой половине 90-х гг.

ХХ в. В это же время начал оформляться и понятийный аппарат. Так, Дж. Синклер описывает корпус как «a collection of naturally-occurring language text, chosen to characterize a state of variety of a language» [Sinclair, 1991. P. 171].
В данном определении подчеркивается один из основополагающих принципов при выборе текстов для построения корпуса – речь идет о неотредактированных текстах, т. е. язык представлен в том виде, в котором он проявил себя в речи (будь то речь устная или письменная). Кроме того, в корпусе представлены не существующие «образцы» и «предписания» для правильного построения сообщения, а как можно большее количество «вариантов» языка, пусть некоторые из них и находятся на периферии языковой системы.
В последующие годы понятие «корпус» все больше конкретизируется: На наш взгляд, наиболее полное определение понятия «корпус» можно найти у В. П. Захарова. Исследователь говорит о корпусе как о большом, представленном в электронном виде, структурированном и размеченном, филологически представительном массиве языковых данных, предназначенных для решения определенных лингвистических задач (см.: [Захаров, 2005. С. 3]). Данное определение можно охарактеризовать как «функциональное», в общих чертах описывающее лингвистическую направленность упорядоченных массивов текстов.



Слайд 5 Основные свойства корпуса

Основные свойства корпуса

Слайд 6 Классификация корпусов

Классификация корпусов

Слайд 7 Лингвистические корпуса русского языка

Лингвистические корпуса русского языка

Слайд 8 Лингвистические корпуса английского языка

Лингвистические корпуса английского языка

Слайд 9 Лингвистические корпуса немецкого языка

Лингвистические корпуса немецкого языка

Слайд 10 Доступность корпусов
Существенным критерием выступает доступность корпуса текстов в

Доступность корпусовСущественным критерием выступает доступность корпуса текстов в электронном виде. Все

электронном виде. Все существующее множество корпусов текстов можно разделить

на три обширные категории:
1) находящиеся в свободном доступе;
2) находящиеся в частичном доступе
3) коммерческие.
К первой категории относится довольно ограниченное количество из существующих на данный момент корпусов текстов. Наиболее обширным (общим объемом более 500 млн слов) является Национальный корпус русского языка (www.ruscorpora.ru).
Большинство из существующих корпусов относится ко второй категории, однако для решения конкретных лингвистических задач такой частичный доступ является чаще всего достаточным. Так, в Британском национальном корпусе (http://www.natcorp.ox.ac.uk/) выдача результата ограничена 50 случайными примерами, кроме того, отсутствуют многие возможности поискового интерфейса, поставляемого вместе с полной (платной) версией корпуса.
Наряду с этим существует некоммерческая версия данного корпуса (http://corpus.byu.edu/bnc/), доступная после несложной процедуры регистрации, в которой для поиска представлено 100 млн слов в текстах 1980–1993 гг. Довольно представительная подборка из Мангеймского корпуса немецкого языка (http://www.ids-mannheim.de/kl/projekte/korpora/) доступна также после процедуры регистрации
и установки специальной программы (оболочки COSMAS II). К третьей группе можно отнести, например, Банк английского языка (Bank of English) с возможностью пробной бесплатной подписки на один месяц для получения доступа в Collins Wordbanks Online (553 млн слов) (http://www.collinslanguage.com/ content-solutions/wordbanks), после чего необходимо приобрести платную версию корпуса.



Слайд 11 Разметка корпуса
Следующим существенным признаком лингвистического корпуса текстов является

Разметка корпусаСледующим существенным признаком лингвистического корпуса текстов является наличие или отсутствие

наличие или отсутствие разметки, так как для решения лингвистических

задач наличия простого массива текстов недостаточно.
Под разметкой понимается приписывание текстам и их компонентам специальных меток: внешних, экстралингвистических, структурных и собственно лингвистических, описывающих лексические, грамматические и прочие характеристики элементов текста [Захаров, 2005. С. 6]. Метаразметка включает в себя сведения об авторе и о самом тексте. Рассмотрим собственно лингвистические виды разметки на примере некоторых из существующих корпусов. Остановимся, прежде всего, на морфологической (или частеречной) разметке. Данный вид разметки является наиболее распространенным в существующих корпусах, при этом учитывается не только признак части речи, но и признаки грамматических категорий.
Морфологическая разметка осуществляется с помощью специальных программ автоматического морфологического анализа. Например, в небольшой части Национального корпуса русского языка (объемом 6 млн словоупотреблений) произведено ручное снятие морфологической омонимии и дополнительная коррекция результатов работы программы автоматического морфологического анализа. «Эта часть образует так называемый корпус со снятой омонимией, который может служить удобным полигоном для тестирования различных программ поиска, морфологического анализа и автоматической обработки текстов, а также для исследований современной русской морфологии, требующих повышенной точности поиска» (см.: [http://ruscorpora.ru/corporastructure. html]).
В Британском национальном корпусе, как и в Банке английского языка, также представлены метатекстовая и морфологическая разметки. В Мангеймском корпусе немецкого языка морфологическая разметка присутствует в основном в подкорпусах публицистических текстов. Среди других видов разметки особо следует выделить синтаксическую, которая представлена не во всем массиве корпуса (Национального корпуса русского языка, Мангеймского корпуса немецкого языка), а только в его небольшой части, так как данный вид разметки, подразумевающий указание синтаксической структуры для каждого предложения, осуществляется фактически вручную и требует огромных временных затрат.
Кроме того, в корпусе могут присутствовать и другие виды разметки, такие как семантическая, просодическая, анафорическая, графематическая и др. – все это во многом позволяет облегчить процесс непосредственного сбора материала исследователем при условии правильно заданных критериев поиска.
Однако, чтобы созданный корпус текстов удовлетворял различным лингвистическим задачам, стоящим перед исследователем языка, он должен также обладать еще по меньшей мере двумя признаками.


Слайд 12 Репрезентативность корпуса
Прежде всего, речь идет о так называемой

Репрезентативность корпусаПрежде всего, речь идет о так называемой репрезентативности корпуса текстов.

репрезентативности корпуса текстов. По мнению А. Е. Кибрика, М.

М. Брыкиной, А. П. Леонтьева и А. Н. Хитрова, репрезентативность можно оценить «по изменению относительной частоты рассматриваемого явления при увеличении выборки. Если относительная частота явления от рибавления каждого последующего фрагмента текста будет изменяться все меньше и меньше, то это означает, что корпус в целом репрезентативен» [Кибрик и др., 2006. С. 21].
При этом хоть и отмечается невозможность при определения репрезентативности корпуса текстов. В целом, вопрос определения репрезентативности того или иного корпуса текстов является по сей день актуальным, однако, к сожалению, недостаточно разработанным.
Именно репрезентативность превращает обычный набор разнообразных текстов непосредственно в корпус текстов, пригодный для проведения лингвистического исследования. Однако языковая деятельность человека настолько разнообразна, что чрезвычайно трудно объективно отразить все существующие «варианты» языка, о которых мы уже упоминали выше.
Вследствие этого вопрос репрезентативности корпуса текстов является скорее вопросом из области объективности любого научного исследования. Здесь следует опираться на здравый смысл самого исследователя, если речь идет о пользовательском корпусе (создается самим исследователем в зависимости от целей его исследования), либо группы исследователей, если речь идет о создании корпуса, претендующего на всеохватность языковых явлений, стилей, жанров и т. п. (например, национального корпуса определенного языка).


Слайд 13 Простота корпуса
Немаловажным критерием при определении корпуса выступает также

Простота корпусаНемаловажным критерием при определении корпуса выступает также и простота его

и простота его использования, другими словами, корпус должен быть

обеспечен специализированной поисковой системой, которая должна быть (в идеальном случае) довольно понятна и проста в использовании.
Так, предлагаемая поисковая система в Мангеймском корпусе немецкого языка довольно сложна в использовании, в то время как при использовании Национального корпуса русского языка, Британского национального корпуса и Банка английского языка особых трудностей не возникает.
Корпус должен сокращать количество времени, необходимое на поиск конкретного явления, а не предлагать сложный алгоритм этого поиска, ознакомление с основными пунктами которого требует от исследователя-лингвиста подчас чисто технических и математических знаний.


  • Имя файла: prezentatsiya-po-inostrannomu-yazyku-lingvisticheskiy-korpus-kak-didakticheskiy-resurs.pptx
  • Количество просмотров: 136
  • Количество скачиваний: 0