Основы научных исследований
Дисциплина «Основы научных исследований» входит в общенаучный модуль профессиональной образовательной программы магистратуры по направлению 45.04.02 Лингвистика (профиль «Иностранные языки и межкультурный диалог») и представляет собой вид учебных занятий, непосредственно ориентированных на профессионально-практическую подготовку обучающихся.
Дисциплина реализуется на факультете иностранных языков кафедрой теоретической и прикладной лингвистики ДГУ.
Содержание дисциплины охватывает круг вопросов, связанных с актуальными направлениями лингвистических исследований; формированием и совершенствованием навыков создания научного текста; выработкой умения работы с теоретической базой исследования; обработкой материала из разнообразных источников (словарей, электронных баз материала, текстов и др.); знанием основных методов лингвистического анализа материала; составлением представления о разнообразии типов научных работ; ознакомлением магистрантов с требованиями, предъявляемыми к структуре и композиции магистерской работы.
Дисциплина нацелена на формирование следующих компетенций выпускника: универсальных - УК-1 , УК-5, общепрофессиональных - ОПК-6, ОПК-7.
Преподавание дисциплины предусматривает проведение следующих видов учебных занятий:
- лекции,
- практические занятия,
- самостоятельная работа.
Рабочая программа дисциплины предусматривает проведение следующих видов контроля успеваемости в форме контрольной работы и коллоквиума, промежуточный контроль в форме зачета.
Объем дисциплины - 4 зачетные единицы, в том числе в академических часах по видам учебных занятий.
Общее языкознание
Тема 4. ЛИНГВОСТАТИСТИЧЕСКИЕ МЕТОДЫ.
ГЛОТТОХРОНОЛОГИЯ.
Лексикостати́стика — статистический метод, используемый в лингвистике для определения степени родства языков. Заключается в сравнении наиболее устойчивой части лексического фонда и определении количества слов, имеющих в родственных языках общее происхождение. Лексикостатистика является одним из основных методов построения генетической классификации языков.
В основе статистической лингвистики лежит предположение, что некоторые численные характеристики и функциональные зависимости между ними, полученные для ограниченной совокупности текстов, характеризуют язык в целом или его функциональные стили. Наиболее изученной числовой характеристикой является частота употребления различных лингвистических единиц (букв, фонем, слогов, слов, синтаксических конструкций), их классов (например, гласных, согласных, частей речи) и сочетаний (например, последовательностей из n букв).
Данные о частоте слов (иногда словосочетаний) отражаются в частотных словарях. Накопленные данные используются для дешифровки исторических письменностей, а также выявления особенностей стиля отдельных авторов и атрибуции текстов.
Появление самой глоттохронологии относится к середине XX века (см. статьи Лис, 1953; Сводеш, 1955, 1972).
Глоттохронология основана на гипотезе, согласно которой в каждом языке особой стабильностью и устойчивостью к изменениям во времени обладает некоторое количество одинаковых для всех языков понятий. Эти понятия относят к так называемой «ядерной лексике». Существуют списки Сводеша для «ядерной лексики»: 200-словный, 100-словный и 30-словный. В этих списках вычисляется процент родственных слов (слов, имеющих общее происхождение). Чем больше процент родственных слов, тем меньше времени назад предположительно разделились два сравниваемых языка.
Основные принципы глоттохронологии
1. В словаре каждого языка можно выделить специальный фрагмент, который называется основной, или стабильной, частью.
2. Можно указать список значений, которые в любом языке обязательно выражаются словами из основной части. Эти слова образуют основной, или опытный, список.
3. Доля слов из основного списка, которые сохранятся (не будут заменены другими словами) на протяжении интервала времени t, постоянна.
4. Все слова, составляющие основной список, имеют одинаковые шансы сохраниться (или не сохраниться, «распасться») на протяжении этого интервала времени.
5. Вероятность для слова из основного списка праязыка сохраниться в основном списке одного языка-потомка не зависит от его вероятности сохраниться в аналогичном списке другого языка-потомка.
Основная математическая зависимость глоттохронологии вычисляется по формуле:
N(t)= N{0}e-{l}t
t - время, прошедшее от начала момента развития до некоторого последующего момента (тыс. лет)
N{0} - исходный основной список
{l} - "скорость выпадения" слов из N{0}
N(t) - доля слов исходного ОС, сохранившихся к моменту t
e - вероятность сохранения слова.
Метод Сводеша
Согласно Сводешу, наиболее «устойчивым» к историческим изменениям из всех уровней оказывается лексический. Однако устойчива к изменениям не любая, а только так называемая «базисная» лексика — набор таких слов, которые обнаруживаются почти во всех языках мира, т. е. определяют универсальные концепты и в целом не сильно зависят от социального, культурного или технологического уровня развития языковых носителей.
Для того чтобы придать этой гипотезе практическое наполнение, Сводеш составил на основании собственного опыта изучения разных языковых семей экспериментальный список, в который включил 200 слов. Впоследствии оказалось, что для конкретных исследований удобнее пользоваться сокращенным вариантом из 100 слов).
Нетрудно догадаться, что туда, например, входят такие слова, как части тела (ʽголоваʼ, ʽглазʼ, ʽухоʼ, ʽносʼ и т. д.); небесные тела и природные явления (ʽсолнцеʼ, ʽлунаʼ, ʽветерʼ, ʽводаʼ, ʽогоньʼ, ʽземляʼ и т. д.); самые общие, конкретные и естественные признаки и процессы (ʽбольшойʼ, ʽмаленькийʼ, ʽдлинныйʼ, ʽкороткийʼ, ʽестьʼ, ʽпитьʼ, ʽспатьʼ, ʽсидетьʼ, ʽстоятьʼ и т. д.); числительные ʽодинʼ и ʽдваʼ (ʽтриʼ в стословный вариант не входит); личные и вопросительные местоимения (ʽяʼ, ʽтыʼ, ʽктоʼ, ʽчтоʼ) и некоторые другие слова.
Если взять какую-нибудь маленькую группу языков, например, уровня славянской, и проанализировать, как устроен стословный список в славянских языках, то окажется, что примерно 80-85% слов из этого списка между любыми двумя славянскими языками будут всегда совпадать («совпадать» не в том смысле, что будут абсолютно одинаковы по форме, а в том смысле, что восходят к общему предку — например, русское слово птица и польское ptak «совпадают», поскольку оба восходят к праславянскому *pъta).
Если взять языки из двух разных подгрупп индоевропейской семьи, то в них будет уже гораздо меньше совпадений — обычно порядка 30-35% совпадений в стословном списке. Например, русское ʽдеревоʼ и английское ʽtreeʼ — это лексико-статистические совпадения, они оба отражают праиндоевропейский корень *derw-; а вот русское слово ʽглазʼ и английское слово ʽeyeʼ не восходят к общему предку — в русском языке английскому слову ʽeyeʼ родственно слово око, которое для нас является архаизмом.
Таким образом, общее правило формулируется очень просто: чем выше процент совпадений между базисной лексикой сравниваемых языков, тем «ближе» они друг к другу, т. е. тем ближе к нашему времени распался на части их общий предок.
Вторая идея Сводеша: базисная лексика в языках изменяется с относительно постоянной скоростью. Этот вывод Сводеш сделал, сопоставив данные по тем языкам, историю которых мы можем фактически проследить на расстоянии в несколько тысяч лет (например, от латыни к романским языкам, от древнегреческого к современному, от санскрита к современным индоарийским). По его наблюдениям получалось, что из 100-словного списка за 1 тысячу лет в среднем «выбывает», то есть замещается другими словами, около 14 слов.
Таким образом, у лексики оказывается свой собственный «период полураспада», и, значит, скорость изменения лексики можно измерять той же формулой, которая применяется в процедуре радиоуглеродного анализа, а из этого следует, что с помощью такого анализа можно не только определять степень близости языков относительно друг друга, но даже прикинуть примерную абсолютную дату распада их общего предка.
Например, если между русским и английским 34% общей лексики в 100-словном списке, это означает, что их общий предок (какой-то из древних диалектов праиндоевропейского) распался на славянскую и германскую ветви примерно 4000 лет тому назад. Такая разновидность применения лексико-статистического метода называется глоттохронологией.
Первоначальный энтузиазм вокруг глоттохронологии (в начале 1950-х гг.) довольно быстро развеялся, когда оказалось, что «правило Сводеша» работает далеко не на всем объеме доступного языкового материала. С чисто теоретических позиций очень трудно поверить в то, что в языке есть что-то вроде «глотто-часов» (во всяком случае, лингвистам; биологи, в частности, к этой идее относятся гораздо спокойнее).
Вышло несколько «разгромных» публикаций, и на какое-то время глоттохронология оказалась похоронена. Новый всплеск интереса к этой методике в западной академической среде начался относительно недавно — на волне применения статистических и вероятностных методов, разработанных в рамках естественных наук, к гуманитарным областям.
Сегодня западные ученые используют в своих исследованиях гораздо более сложные модели, чем простая формула Сводеша, но общие принципы (идея устойчивости базисной лексики, представление об измеряемости скорости распада списка и тому подобное) остаются теми же самыми.
Лингвисты «традиционной» закалки, с трудом преодолевают скептическое отношение к такому анализу. У нас в стране наиболее значительный вклад в развитие лексикостатистики и глоттохронологии внес Сергей Анатольевич Старостин (1953-2005). Он, во-первых, внес в формулу Сводеша несколько важных поправок, которые позволили получать более точные и достоверные результаты, во-вторых, сумел разрешить одну из самых сложных проблем метода, предложив разграничивать между «внутренними» лексическими заменами, когда базисное слово заменяется на другое, уже существовавшее в языке, но имевшее другое значение.
Например, русское брюхо вытесняется животом, т. е. ʽжизньюʼ и «внешними», то есть заимствованиями. Оказывается, что постоянная скорость изменений характерна для внутренних замен, а не внешних, поскольку объем заимствований зависит от конкретных непредсказуемых исторических и географических условий. Для того, чтобы непрерывно и медленно текли «внутренние» замены, никаких контактов с другими языками не требуется. Старостин предложил снизить «коэффициент» Сводеша с 14 выпадающих слов до 5 из ста за 1000 лет.
Сегодня в рамках Московской школы компаративистики активно функционирует специальный проект «Глобальная лингвистическая база данных», где занимаются тщательным выверением старых и составлением новых «списков Сводеша» с тем, чтобы создать единую, хорошо отлаженную, унифицированную систему лексических данных, к которым можно будет применить несколько разных вариантов. Эта система — фундамент для будущей общей генеалогической классификации всех языковых семей мира.
В тех случаях, когда удаётся проследить историю языка на протяжении одного или нескольких тысячелетий (например, латинский язык в его отношении к романским), за одно тысячелетие сохраняется в среднем не менее 80% словаря (для списка в 200 слов —81%, для списка в 100 слов — 86%). Сопоставив процент сохранившихся родственных слов в основных списках двух языков одной семьи, можно определить наименьшее время их разделения t по формуле t = logC : 2log r, где C — доля совпадающих слов в основном списке, r — коэффициент, характеризующий степень сохранности основного списка за интервал времени (принимаемый за r = 81 или 86%).
Как составлять список Сводеша
В стандартный список Сводеша на любом языке следует включать только наиболее простое, базовое, современное значение слова, например «глаз», но не «око»; «мокрый», но не «влажный»; «далёкий», но не «дальний», «удалённый», «ребёнок», но не более архаичное «дитя». При этом следует избегать лишних синонимов и пытаться свести выбор к максимально простому, базовому значению слова. Следует максимально точно установить исходное значение лексемы. Необходимо тщательно проверять точное значение слова по словарю.
Полностью исключить явления синонимии оказывается невозможным, и синонимы так или иначе неизбежно попадают в список. В этом случае рекомендуется сопровождать запись кратким уточнением значения для будущих исследователей, например «зола» (костра), «пепел» (сигареты); «кусать» (однократно), «грызть» (долго). Таким образом, изучающие список смогут точнее разобраться в нём и добавить или исключить лишние значения, избежав двусмысленности при сравнении языков.
При составлении списка не следует намеренно подбирать «ложных друзей переводчика» или искажать семантическое значение слова в пользу его фонологического сближения с другим языком, так как это в последующем исказит степень родства языков при их сравнении. Например, пол. «dobry»: рус. «хороший» («качественный предмет» как более простое базовое значение), но не «добрый» в значении «добрый человек». В спорных случаях рекомендуется просто указать оба синонима с соответствующими пометками для последующих уточнений.
В особо сложных случаях допускается просто опустить лексему, значения которой неясны или неизвестны, так как простое сокращение списка на несколько пунктов не повлияет на его общую статистическую устойчивость.
Возражения против глоттохронологии
1. Универсальный «список», пригодный для всех языков мира, составить невозможно.
2. Метод, как правило, применяется к одной паре близкородственных языков
3. Практически во всех случаях датировки исторически документированных лингвистических событий наблюдается один и тот же результат – сильное "умоложение" дат.
Введение в языкознание
1. Целью освоения дисциплины «Введение в языкознание» является формирование системы знаний, умений и навыков, в области языкознания как базы для развития универсальных компетенций и основы для формирования профессиональных компетенций.
2. Место дисциплины в структуре ОПОП бакалавриата.
В соответствии с «Федеральным государственным образовательным стандартом высшего профессионального
образования по направлению подготовки 45.03.01 – Филология» настоящая дисциплина включена в базовую часть
ООП бакалавра. Базу для его изучения составляют компетенции, полученные в общеобразовательной школе. В свою
очередь овладение компетенциями в рамках курса «Введение в языкознание» оказывается необходимым при освоении курсов введение в славянскую филологию, современного русского языка, современного родного языка, общего
языкознания, риторики и при написании выпускной квалификационной работы. Данная дисциплина предваряет циклы дисциплин общепрофессиональных и профессиональных, ориентирует студентов на написание курсовых работ,
связанных с исследованием объектов профессиональной деятельности филолога.
Содержание дисциплины охватывает круг вопросов, связанных с формированием у студентов основных понятий о языке, его структуре и функциях, взаимодействии языков, закономерностях их развития, принципах классификации языков, методах изучения языка.
Данная дисциплина способствует формированию следующих компетенций, предусмотренных ФГОС-3+ по направлению подготовки бакалавров 45.03.01 - Филология: УК-1,ОПК-1, ОПК-2, ОПК-4, ПК-1, ПК-2, ПК-5.
Преподавание дисциплины предусматривает проведение следующих видов учебных занятий: лекции, практические занятия, самостоятельная работа.
Рабочая программа дисциплины предусматривает проведение следующих видов контроля успеваемости в форме контрольной работы и коллоквиума и промежуточный контроль в форме зачета.
Объем дисциплины 4 зачетные единицы, в том числе в академических часах по видам учебных занятий
- Teacher: Магомедова Патимат Ариповна
Лексикография и фразеография
Задача данного курса– обобщить достижения последних лет в области теоретической и практической лексикографии, проанализировать различные типы словарей, наметить тенденции развития словарного дела.
Человеку, профессионально занимающемуся языком, приходится постоянно обращаться к словарям самых разных типов, поэтому современный филолог, лингвист должен свободно ориентироваться во всем многообразии словарной продукции.
Кроме того, включение данной дисциплины в учебный план обусловлено требованиями многих современных работодателей, желающих иметь в кадровом составе специалиста, обладающего в полной мере лексикографической компетенцией.