Характеристика трагедии У. Шекспира «Гамлет» на основе статистического анализа текста

Тип работы:
Реферат
Предмет:
Кибернетика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УДК 008: 311
А. В. Волошинов, Ю.С. Дараганова
ХАРАКТЕРИСТИКА ТРАГЕДИИ У. ШЕКСПИРА «ГАМЛЕТ»
НА ОСНОВЕ СТАТИСТИЧЕСКОГО АНАЛИЗА ТЕКСТА
Предлагается метод статистического анализа речевого объема (числа произнесенных слов) и речевого потока (числа произнесенных реплик) персонажей драматургических произведений, позволяющий провести широкую гамму эмпирических исследований. Метод иллюстрируется на примере шедевра мировой драматургии — трагедии У. Шекспира «Гамлет». Представлены результаты различных аппроксимаций частоты слов и реплик персонажей, произведена оценка характеристик пьесы с помощью принципа Парето, реализованы разбиения множества реплик главных героев по правилу Брэдфорда.
Статистический анализ, драматургический текст, частотность слов, речевой объем, речевой поток, длина реплики, аппроксимация, принцип Парето, разбиение множества реплик
A. Voloshinov, Y. Daraganova
CHARACTERIZATION SHAKESPEARE'-S TRAGEDY «HAMLET»
USING STATISTICS FOR TEXT ANALYSIS
The authors propose to use statistical analysis for the speech volume (number of words) and speech flow (number of remarks) of the characters of dramas which allows conducting a wide range of empirical research. The method has been applied to Shakespeare'-s tragedy «Hamlet». The results of the analysis include various approximations for the frequency of words and remarks used by the characters, estimation of the various analyses of the play using the Pareto principle, breaking the numerous remarks of the main characters according to the Bradford principle.
Statistical analysis, texts of dramas, word frequency, speech volume, speech flow, length of remark, approximation, Pareto principle, partition of remarks
Хотя попытки применения количественных методов к различным видам и аспектам искусства имеют давнюю традицию и связаны с такими блестящими именами как Пифагор (закон консонансов в музыке [1]), Леонардо да Винчи и Альбрехт Дюрер (пропорция золотого сечения и теория перспективы в живописи [2]), Ле Корбюзье (гармоническая шкала — модулор — в архитектуре [3]), академики РАН математик А. Н. Колмогоров и филолог М. Л. Гаспаров (статистический анализ ритмики стиха в поэзии [4, 5]), конструктор космической техники академик РАН Б. В. Раушенбах (общая теория перспективы в живописи [6]), тем не менее, каждая попытка приложения математики к искусству воспринимается настороженно, если не сказать в штыки. И хотя мост между естествознанием и гумани-таристикой вроде бы построен в конце XX в. отцами-основателями синергетики Г. Хакеном [7], И. Пригожиным [8] и С. П. Курдюмовым [9], хотя главный редактор журнала «Вопросы философии»
В. А. Лекторский уже в XXI в. недвусмысленно подтвердил, что интеграция гуманитарных и естественных наук возможна [10], тем не менее эти две сферы культуры продолжает разделять пропасть,
о которой еще в середине XX в. писал Ч. Сноу [11].
Настоящая работа представляет собой попытку приложения точных методов к исследованию драматургических текстов. Идейными и методологическими ориентирами для нас являлись концепция точного литературоведения Б. И. Ярхо [12] и методология количественных методов в искусство-158
знании В. М. Петрова [13]. В качестве примера, на котором апробируется наша методика, взят шедевр мировой литературы трагедия У. Шекспира «Гамлет». Мы пользовались русским переводом «Гамлета» М. Лозинского, хотя, как будет ясно из дальнейшего, ни перевод, ни язык оригинала драматургического произведения значимого влияния на результаты не оказывают.
Системный подход подразумевает изучение сложных структур через декомпозицию их на более простые элементы, комбинации которых в рамках таких сложных систем как драматургические произведения создают возможности проведения широкой гаммы эмпирических исследований [13]. Выбрав в качестве подобных элементов слова героев драматургических произведений и их различные комбинации в виде реплик, монологов, диалогов и др., можно получить целый ряд статистических характеристик, позволяющих приблизиться к ответам на актуальные вопросы: каково внутреннее устройство драматургического произведения и в чем сила его воздействия на зрителя? какие характеристики отличают произведения, ставшие классикой драматургии? существуют ли объективные критерии, характеризующие «почерк» того или иного автора? существует ли, наконец, «идеальная пьеса» с точки зрения тональности жизни, отличающей одну историческую эпоху от другой?
Введем в рассмотрение две количественные характеристики драматургического текста: речевой объем — число слов, произнесенных героем пьесы, и речевой поток — число реплик, в которые укладываются произнесенные слова. Понятно, что речевой объем является более точной числовой характеристикой, чем речевой поток, ибо ему прямо пропорционально время, которое актер говорит на сцене. Со своей стороны речевой поток указывает на то, как часто герой говорит на сцене (герой может говорить мало слов, но часто вступать в разговор, и, наоборот, за одну-две реплики произнести все слова). Отношение речевого объема к речевому потоку дает среднюю длину реплик героя, т. е. характеризует его «многословность». Данные по названным трем количественным характеристикам текста трагедии Шекспира «Гамлет» представлены в табл. 1, где упорядочение героев трагедии произведено по убыванию речевого объема.
Из табл. 1 легко видеть, что Гамлет является подлинным главным героем трагедии: его речевой объем почти в 4 раза больше, а речевой поток в 3 раза больше, чем у его ближайшего партнера по диалогу Клавдия. Табл. 1 выделяет также 7 главных героев трагедии (Гамлет, Клавдий, Полоний, Горацио, Лаэрт, Офелия, Гертруда), которые имеют наибольшие речевой объем и речевой поток. Далее речевой поток героев трагедии падает в 2 раза, что и служит ступенью, отделяющей главных героев от героев второго плана.
Как видно из табл. 1, упорядочение героев по речевому объему не влечет упорядочения по речевому потоку, однако при переходе к упорядочению по речевому потоку первая семерка главных героев остается неизменной, хотя и несколько меняет свою последовательность (см. рис. 1, 2). Мы видим, что Горацио, как и подобает истинному другу, чаще других вступает с Гамлетом в диалог (у него второй после Гамлета речевой поток). Однако сообразно своему социальному статусу Горацио менее многословен, чем Г амлет, Клавдий и Полоний. А вот прожженный царедворец Полоний неотступно следует за королем Клавдием и в речевом объеме, и в речевом потоке. Брат и сестра Лаэрт и Офелия, дети Полония, имеют удивительно близкие речевые характеристики, а средняя длина их реплик просто совпадает. Средняя длина реплик является достаточно красноречивой речевой характеристикой, и к ее анализу мы еще вернемся.
В дальнейшем от абсолютных речевых характеристик будет полезно перейти к относительным: введем относительный речевой объем как долю слов, произнесенных героем, в процентах от общего числа слов в пьесе и относительный речевой поток как долю реплик героя в процентах. На рис. 1, 2 представлены в порядке убывания относительные речевые характеристики героев трагедии «Гамлет». Легко видеть, что графики относительных речевых характеристик носят качественно идентичный характер, так что при необходимости вместо числа слов можно пользоваться числом реплик, что гораздо проще, ибо эти числа отличаются на порядок. Ясно также, что речевой поток (абсолютное число реплик) в различных переводах и на языке оригинала будет одним и тем же, а речевой объем (абсолютное число слов) в различных вариантах текста будет изменяться незначительно и на поведение относительных характеристик влияния не окажет.
Таблица 1
Речевой объем, речевой поток и средняя длина реплик действующих лиц трагедии «Гамлет»
№ п/п Персонажи Речевой объем (число произнесенных слов) Речевой поток (число произнесенных реплик) Средняя длина реплик (в словах)
1 Гамлет, сын покойного и племянник царствующего короля 9559 381 25,09
2 Клавдий, король Датский 2581 110 23,46
3 Полоний, ближний вельможа 1989 87 22,86
4 Г орацио, друг Г амлета 1454 113 12,87
5 Лаэрт, сын Полония 1038 63 16,48
6 Офелия, дочь Полония 925 57 16,23
7 Гертруда, королева Датская, мать Гамлета 740 69 10,72
8 Первый могильщик 615 34 18,09
9 Розенкранц 536 47 11,4
10 Призрак 499 14 35,64
11 Марцелл 322 38 8,47
12 Озрик 315 24 13,13
13 Г ильденстерн 278 32 8,69
14 Актер-король 267 4 66,75
15 Первый актер 255 8 31,88
16 Актер-королева 185 5 37
17 Бернардо 157 23 6,83
18 Фортинбрас, принц Норвежский 133 6 22,17
19 Вольтиманд 107 2 53,5
20 Второй могильщик 81 12 6,75
21 Первый дворянин 69 2 34,5
22 Священник 63 2 31,5
23 Рейнальдо, слуга 56 13 4,31
24 Вельможа 56 3 18,67
25 Второй дворянин 55 1 55
26 Капитан 55 8 6,88
27 Франсиско 39 8 4,88
28 Первый моряк 33 2 16,5
29 Гонец 31 2 15,5
30 Актер-Луциан 30 1 30
31 Английские послы 28 1 28
32 Актер-Пролог 10 1 10
33 Слуга 9 1 9
34 Корнелий 8 1 8
Всего: 22 578 1175 19,22
Рис. 1. Относительный речевой объем действующих лиц трагедии «Гамлет»
Л. й і. ?Ї 31 5 & lt-
Рис. 2. Относительный речевой поток действующих лиц трагедии «Гамлет»
Найдем аналитические аппроксимации полученных эмпирических зависимостей. Пусть х -номер героя пьесы в порядке убывания соответствующей речевой характеристики (х = 1, 2, 3, 34),
у (х) — относительная речевая характеристика (речевой объем или речевой поток). Ясно, что для
наших данных наилучшими будут аппроксимации экспоненциальной у = ае Ьх или степенной у = сх~й функциями. Значения аппроксимационных констант а, Ь, с, й, найденные методом наименьших квадратов, приведены в табл. 2. Для каждого случая подсчитаны также коэффициенты достоверности аппроксимации И2, которые близки к 1.
Таблица 2
Аппроксимационные константы речевых характеристик трагедии «Гамлет»
Элементы драматургического текста Экспоненциальная аппроксимация Степенная аппроксимация Среднее число на один персонаж
а Ь с d
Слова 13,15 0,168 95,08 1,886 664,1
Реплики 15,65 0,17 104,04 1,867 34,56
Средняя длина реплики действующего лица пьесы «Гамлет» 19,22
Анализ табл. 2 приводит к следующим выводам. При экспоненциальной и степенной аппроксимации показатели степени Ь и й остаются практически неизменными для слов и реплик, что говорит об одинаковой «скорости убывания» основных речевых характеристик. Мультипликативные коэффициенты, а и с отличаются соответственно для экспоненциальной аппроксимации на 16,0% и для степенной на 8,6%. Таким образом, «начальные точки» при экспоненциальной и степенной аппроксимациях речевого объема и речевого потока отличаются, что вполне естественно, но отличаются не принципиально. Это еще раз подтверждает наш вывод о том, что при необходимости вместо речевого объема можно рассматривать речевой поток.
то --------------------------------------------------------------------------------------
Рис. 3. Средняя длина реплик действующих лиц трагедии «Гамлет»
Построим диаграмму средних длин реплик, сохраняя упорядочение героев трагедии по речевому объему. Как видно, вместо монотонно убывающей функции (рис. 1) мы получаем весьма хаотичную диаграмму (рис. 3). Неожиданным результатом является тот факт, что главные герои трагедии не так уж многословны в своих репликах. Многословием отличаются герои второго плана, которые говорят редко, но много. Самым многословным, как и положено, оказался актер-король, который за 4 реплики проговаривает 267 слов (средняя длина его реплики — 66,75). И вновь мы убеждаемся в том, насколько точно у Шекспира характер героя проявляется в его речевой характеристике. Не намного отстоят от актера-короля второй дворянин и Вольтиманд, произносящие одну и две реплики соответственно. Надо успеть сказать в этих репликах побольше слов, чтобы запечатлеть свой образ у зрителя. Собственные слова Вольтиманда «здесь, как во всем, мы явим наше рвенье» как нельзя лучше подходят для этой ситуации. Вообще, можно предположить, что данная диаграмма является уникальной характеристикой всего произведения в целом.
Если упорядочить главных героев по средней длине реплик, получится вполне регулярная диаграмма, хорошей аппроксимацией для которой является линейная зависимость (рис. 4). Относительно небольшой угол наклона аппроксимирующей прямой снова свидетельствует о мастерстве Шекспира, который делает всех главных героев относительно равноправными, хотя и выделяет явно первую тройку главных героев. И снова мы замечаем, как даже в средней длине реплик Полоний раболепно следует за Клавдием, приближаясь к нему вплотную, но не обгоняя его. Брат и сестра Лаэрт и Офелия имеют фактически одинаковую среднюю длину реплик, а самой немногословной среди главных героев остается королева Гертруда — в ее положении и в самом деле лучше всего молчать.
Проверим, соблюдается ли в речевых характеристиках «Гамлета» известный принцип Парето или принцип 20/80. Этот эмпирический закон, обнаруженный итальянским социологом Вильфредо Парето, проявляется в самых различных сферах бытия — распределении доходов у населения (часто его называют законом Матфея, ибо в Евангелии от Матфея (Мф 25: 29) сказано: «ибо всякому имеющему дастся и приумножится, а у неимеющего отнимется и то, что имеет»), распределении городов по численности населения или распределении фирм по количеству сотрудников (закон Мандельброта), распределении научной продукции по числу ученых (закон Лотки) и т. д. В общем виде принцип Парето можно сформулировать так: 20% усилий дают 80% результата, а остальные 80% усилий -только 20%результата.
В нашем контексте принцип Парето будет звучать так: 20% героев проговаривают 80% текста, а остальные 80% героев произносят только 20% текста. В «Гамлете» 34 героя, 20% от этого числа дает 6,8, т. е. 7 героев. Заметим, что это в точности число главных героев, которое мы определили ранее. Пользуясь данными табл. 1, легко подсчитать, что эти 20% героев произносят 75% реплик. Переходя к более точной речевой характеристике — речевому объему (числу произносимых слов), получаем, что 20% героев произносят 81% слов. Как видим, принцип Парето в «Гамлете» выполнен с удивительной точностью. Еще раз отметим, что эти 20% составляют все главные герои трагедии, т. е. соотношение общего числа действующих лиц и главных героев выбрано Шекспиром так, как будто он знал закон Парето!
Гамлет Клавдий Полоний Лаэрт Офелия Горацио Королева
Рис. 4. Средняя длина реплик главных героев трагедии «Г амлет»
В конце списка действующих лиц «Гамлета» у Шекспира стоит фраза: «вельможи, дамы, офицеры, солдаты, моряки, гонцы и другие слуги». Все они не произносят ни слова, их число Шекспиром не уточняется, поэтому нами они рассматривались как «живая декорация» к спектаклю и в список действующих лиц «Гамлета» (табл. 1) они включены не были. Если бы они произнесли хотя бы по одному слову, их следовало бы включить в список действующих лиц. Но что произойдет в этом случае? Если увеличить число действующих лиц с 34 до 48 (добавить по два вельможи, две дамы и т. д.), то группу в 20% будут составлять 10 человек, которые произнесут 83% реплик и 88,3% слов. В группу главных героев попадут болтливый первый могильщик, несимпатичный Розенкранц, имеющий тайный приказ короля извести Гамлета, и призрак. Закон Парето будет выполняться значительно хуже и вся «семерка» главных героев трагедии разрушится. Таким образом, принцип Парето
может служить инструментом для определения оптимального количества действующих лиц на сцене. Как это «заведено» у гениев, Шекспир точно определил это число интуитивно.
Мы видели, что даже такая речевая характеристика как средняя длина реплики позволяет сделать определенные качественные выводы о характерах героев драматургического произведения. Но всякая средняя величина по своей природе может ввести в заблуждение — классическим примером тому служит средняя температура по больнице. Более содержательной речевой характеристикой может служить продолжительность реплики: какими репликами говорит герой — малыми, средними или большими? Интуитивно это понятно, но какие реплики считать малыми, какие средними, а какие большими? В этом вопросе изначально присутствует некоторая нечеткость. Попробуем математически точно решить задачу разбиения множества реплик на три класса, опираясь на закон рассеяния С. Брэдфорда [14].
Выделим множество реплик героя и произведем ранжирование реплик по объему (числу слов) в порядке убывания. Тогда, согласно закону рассеяния Брэдфорда, это упорядоченное множество можно разбить на три подмножества так, что количество реплик в соответствующих подмножествах будут относиться друг к другу как члены геометрической прогрессии
1: q: 42, (1)
где q — некоторое число, большее единицы (коэффициент Брэдфорда).
На практике правило Брэдфорда, как и любая информетрическая модель, редко выполняется математически точно. Поэтому можно выбирать различные значения для размера зон Брэдфорда и коэффициента Брэдфорда q и получать более или менее хорошие разбиения на зоны, в большей или меньшей степени удовлетворяющие закону.
Результаты разбиения множества реплик главных героев «Гамлета» на малые, средние и большие реплики по правилу Брэдфорда представлены в табл.3.
Таблица 3
Разбиение реплик главных героев по группам малого, среднего и большого размера
Герой Количество реплик по группам q- 81/82 q- 82/83 Размер реплики
81 (малые) 82 (средние) 83 (большие) малая средняя большая
Гамлет 156 125 100 1,25 1,25 1:7 8: 25 & gt-=26
Клавдий 64 31 15 2,065 2,067 1: 11 12: 55 & gt-=56
Полоний 31 29 27 1,069 1,074 1:5 6: 18 & gt-=19
Лаэрт 36 18 9 2 2 1:9 10: 29 & gt-=30
Офелия 27 18 12 1,5 1,5 1:7 8: 21 & gt-=22
Горацио 62 33 18 1,879 1,833 1:5 6: 14 & gt-=15
Королева 27 23 19 1,174 1,21 1:4 5: 11 & gt-=12
Анализируя табл. 3, можно сделать вывод о том, что коэффициент Брэдфорда q в какой-то мере характеризует темперамент героя. При низких значениях q ^ ~ 1) параметры речевого потока героя не отличаются разнообразием: герой произносит практически одинаковое число малых, средних и больших реплик, он лишен бурных эмоций, влияющих на продолжительность его речи. Таковы Полоний и Гертруда — первый, как и положено царедворцу, настороженно-скован, вторая скована в своем кровосмесительном грехе. Напротив, при высоких значениях q ^ ~ 2) герой произносит мало больших и много малых реплик. Герой импульсивен, он часто вступает в короткий диалог. Таковы Клавдий, Лаэрт и Горацио, что опять-таки соответствует их характеру и их роли в трагедии: Клавдий борется сам за себя и с собственной совестью, Лаэрт — за погибшую сестру, Горацио — за униженного друга. Промежуточное положение здесь занимают Гамлет и Офелия.
Отобразим на графике данные табл. 3, относящиеся только к малым репликам. По оси Х отложим максимальный размер малой реплики (в словах), а по оси У — коэффициент Брэдфорда q. Каждому герою в этих координатах будет соответствовать свое местоположение. Получается весьма красноречивая картина:
— влюбленная пара Гамлет и Офелия оказываются рядом и в центре событий-
— напротив, король и королева наиболее удалены от Гамлета и это опять-таки соответствует положению дел в трагедии — родная мать и приемный отец стали для Гамлета чужими-
— одновременно Клавдий и Гертруда оказываются наиболее удалены друг от друга, что опять-таки соответствует их внутренней драме: Гертруда хоть и стала женою Клавдия, но в своем грехе они оба предельно далеки друг от друга-
— наиболее близким к Гертруде оказывается Полоний: лживое положение обоих сближает их-
— Горацио и Лаэрт равноудалены от Гамлета и Офелии, но на незначительном расстоянии, как и положено другу и брату-
— наконец, Клавдий находится на максимальном расстоянии от всех — он действительно одинок в своем тайном преступлении.
-0- 1. 5
•в-
-S-
Лаэрт ^ Клавдий ¦
Горацио ¦ Офелия Ў
Ў
Королева ¦ Полоний ¦ Гамлет ¦


0,5
4 6 8
Размер множества малых реплик (количество слов)
10
12
Рис. 5. Характеристики главных героев трагедии «Гамлет» на основе малых реплик и коэффициента Брэдфорда
Выводы
1. Статистический анализ текстов драматургических произведений является универсальным инструментом для проведения широкой гаммы эмпирических исследований.
2. Объектом анализа явились слова и реплики действующих лиц трагедии У. Шекспира «Гамлет». Осуществлена степенная и экспоненциальная аппроксимации частотности слов и реплик героев пьесы. Показано, что по мере уменьшения общего числа произносимых слов разброс средней длины реплики персонажей увеличивается. Получаемая зависимость является уникальной характеристикой произведения в целом.
3. Показано, что принцип Парето выполняется в «Гамлете» с высокой точностью и для речевого потока (число реплик), и для речевого объема (число слов). Принцип Парето позволяет также выделить группу главных героев драматургического произведения.
4. Получены характеристики главных героев пьесы «Гамлет» на основе разбиения множества реплик по правилу Брэдфорда. Оценка героев на основе найденных зависимостей отражает характер героев и основные сюжетные линии трагедии.
ЛИТЕРАТУРА
1. Волошинов А. В. Пифагор: Союз истины, добра и красоты / А. В. Волошинов. 3-е изд. М.: Кн. дом «ЛИБРОКОМ», 2010. 224 с. (Из наследия мировой философской мысли: великие философы).
2. Волошинов А. В. Математика и искусство / А. В. Волошинов. 2-е изд., дораб. и доп. М.: Просвещение, 2000. 400 с.
3. Ле Корбюзье. Модулор / Ле Корбюзье. М.: Стройиздат, 1976. 240 с.
4. Колмогоров А. Н. К основам русской классической метрики / А. Н. Колмогоров, А. В. Прохоров // Содружество наук и тайны творчества. М.: Искусство, 1968. С. 397−432.
5. Гаспаров М. Л. Очерк истории русского стиха: Метрика, ритмика, рифма, строфика / М. Л. Гаспаров. М.: Наука, 1984. 319 с.
6. Раушенбах Б. В. Системы перспективы в изобразительном искусстве. Общая теория перспективы / Б. В. Раушенбах. М.: Наука, 1986. 255 с.
7. Хакен Г. Синергетика как мост между естественными и социальными науками / Г. Хакен // Синергетическая парадигма. Человек и общество в условиях нестабильности. М.: Прогресс-Традиция, 2003.С. 106−122.
8. Пригожин И. Новый союз науки и культуры / И. Пригожин // Курьер ЮНЕСКО. 1988. № 6.
С. 9−13.
9. Курдюмов С. П. Основания синергетики. Режимы с обострением, самоорганизация, темпо-миры / Е. Н. Князева, С. П. Курдюмов. СПб.: Алетейя, 2002. 414 с.
10. Лекторский В. А. Возможна ли интеграция естественных наук и наук о человеке? / В. П. Кохановский, В. А. Лекторский // Вопросы философии. 2004. № 3. С. 44−49.
11. Сноу Ч. П. Две культуры / Ч. П. Сноу. М.: Прогресс, 1973. 141 с.
12. Ярхо Б. И. Методология точного литературоведения / Б. И. Ярхо. М.: Языки славянских культур, 2006. 927 с.
13. Петров В. М. Количественные методы в искусствознании / В. М. Петров. М.: Академический Проект, 2004. 429 с.
14. Bradford S.C. Documentation / S.C. Bradford. L.: Crosly Lockwood, 1948. 156 p.
Волошинов Александр Викторович —
доктор философских наук, профессор, заведующий кафедрой «Культурология»
Саратовского государственного технического университета имени Гагарина Ю. А.
Дараганова Юлия Сергеевна —
аспирант кафедры «Культурология» Саратовского государственного технического университета имени Гагарина Ю. А.
Aleksandr V. Voloshinov —
Dr. Sc., Professor,
Head: Department of Culturology,
Gagarin Saratov State Technical University
Yuliya S. Daraganova —
Postgraduate,
Department of Culturology,
Gagarin Saratov State Technical University
Статья поступила в редакцию 28. 02. 12, принята к опубликованию 02. 03. 12

ПоказатьСвернуть
Заполнить форму текущей работой