Генерация слов> перед Вами появится диалоговое окно, состоящее из трех страниц. На второй и третьей странице окна Вы можете выбрать тот набор характеристик, которым, по Вашему мнению, должно обладать слово.
После указания этих характеристик следует ввести на первой странице окна шаблон для порождения псевдослов. Нажимая на кнопки <С> и <Г> следует указать очередность вхождения согласных и гласных букв в слово. Выбирая в открывающемся списке отдельные буквы, Вы можете фиксировать отдельные вхождения. Для исправления шаблона можно использовать дополнительную кнопку, которых стирает последний введенный символ. Длина шаблона не может превышать десяти символов. По вашему выбору вы можете установить флаг Псевдорусские. В этом случае слов порождается меньше, но по фонетической структуре они более похожи на слова русского языка.
После ввода шаблона следует нажать кнопку <Генерировать>. Начнется порождение слов, удовлетворяющих желаемым характеристикам. Слова будут выводиться в окно слева. Число уже порожденных слов указывается внизу. Нажатием на кнопку <Прервать> всегда можно остановить этот процесс до того, как будут проверены все комбинации. При нажатии на кнопку <Сохранить> будет предложено ввести имя файла, в который будет сохранен список порожденных слов. Файл имеет текстовый формат в кодировке Windows. По умолчанию списки порожденных слов хранятся в директории ...\VAAL\Protocol.
Выбор характеристик
При генерации псевдослов вы будете заинтересованы в том, чтобы эти слова обладали требуемым эмоциональным воздействием на подсознание. В диалоговом окне выбора характеристик Вы можете установить желаемые характеристики по двум наборам шкал.
Для выбора характеристик по биполярным шкалам переключитесь на вторую страницу. Вы можете быть заинтересованы в следующем:
чтобы в слове был выражен признак левой половины шкалы;
чтобы в слове был выражен признак правой половины шкалы;
чтобы в слове значение по данной шкале было нейтральным;
любое значение шкалы Вам подходит.
В первом случае установите курсор мыши на имени признака в крайнем левом столбце и щелкните левой кнопкой мыши. Имя признака будет выделено красным цветом.
Во втором случае установите курсор мыши на имени признака во втором столбце и щелкните левой кнопкой мыши. Имя признака будет выделено синим цветом.
В третьем случае установите курсор мыши в строке напротив имени признака в третьем столбце на слове нейтральная и щелкните левой кнопкой мыши. Слово признака будет выделено темно-серым цветом.
В четвертом случае установите курсор мыши в строке напротив имени признака в четвертом столбце на слове любая и щелкните левой кнопкой мыши. Если до этого в строке уже имелось выделение, оно исчезнет. По умолчанию принимается именно четвертый случай.
При выборе желаемых характеристик по монополярным шкалам вы можете быть заинтересованы в следующем:
чтобы в слове данный признак был выражен;
чтобы в слове данный признак был подавлен;
чтобы в слове данный признак был нейтральным;
любое значение признака вам подходит.
В первом случае установите курсор мыши на имени признака в крайнем левом столбце и щелкните левой кнопкой мыши. Имя признака будет выделено красным цветом.
Во втором случае установите курсор мыши на имени признака во втором столбце и щелкните левой кнопкой мыши. Имя признака будет выделено синим цветом.
В третьем случае установите курсор мыши в строке напротив имени признака в третьем столбце на слове нейтральная и щелкните левой кнопкой мыши. Слово признака будет выделено темно-серым цветом.
В четвертом случае установите курсор мыши в строке напротив имени признака в четвертом столбце на слове любая и щелкните левой кнопкой мыши. Если до этого в строке уже имелось выделение, оно исчезнет. По умолчанию принимается именно четвертый случай.
Эмоциональное воздействие текстов
Диалоговое окно оценки текста состоит из пяти страниц. Оно содержит гистограммы оценок текста по биполярным и монополярным шкалам, гистограммы профилей оценок по биполярным и монополярным шкалам и гистограмму звуко-цветовой оценки текста. Для перехода к нужной странице следует установить на нее указатель мыши и нажать левую кнопку.
Также окно содержит:
кнопки: <Протокол>, <База данных>, <Печать>, <Помощь> и <Выход>;
флаг <Нормализованные оценки>;
строку состояния.
В строке состояния указан текущий жанр.
Е
сли вы хотите сохранить оценки текста в файл для последующего использования, то нажмите кнопку <Протокол>. В появившемся окне вам необходимо указать имя файла. Если указано имя уже существующего файла, то данные добавляются в его конец. Для хранения протоколов по умолчанию используется специальная директория ...\VAAL\Protocol.
В ряде случаев возникает задача вторичной математической обработки результатов оценки текстов. Для сохранения и накопления результатов оценки вы можете воспользоваться кнопкой <База данных>. При нажатии на нее вам будет предложено сохранить оценки текста в файле. Если указано имя уже существующего файла, то данные добавляются в его конец. Накопив в одном файле оценки текстов, вы можете затем их подвергнуть либо визуализации с использованием соответствующего модуля системы ВААЛ, либо более изощренным видам анализа с использованием таких известных систем как Statistica и SPSS. Файлы данных хранятся в специальной директории ...\VAAL\Data. Система сохраняет данные по биполярным и монополярным шкалам в файлах с разными расширениями. Для биполярных шкал используется расширение dtb а для монополярных - dtm. Вам не нужно беспокоиться о правильном расширении файла. Система сделает это за Вас.
Если Вам необходимо оценить очень короткий текст (например рекламный слоган) или сравнить два текста разной длины, весьма полезным может оказаться использование флага <Нормализованные оценки>. Дело в том, что на оценку воздействия текста влияет его длина. Если Вы попробуете оценить текст состоящий всего лишь из одного предложения или размножите это предложение на целую страницу и оцените ее, то результаты получатся разные. Установление флага <Нормализованные оценки> приводит к тому, что система сохраняет частоты встречаемости различных звуков исходного текста, но считает, что он имеет длину 3000 символов. В этом и заключается смысл нормализации.
Биполярные и монополярные шкалы (оценка текста)
При оценке по биполярным шкалам каждая шкала представлена с помощью пары антонимичных прилагательных русского языка, числовой оценки и цветной полосы синего или красного цвета. Длина полосы пропорциональна величине числовой оценки.
В
сего используется 24 встроенных биполярных шкалы: хороший - плохой, красивый - отталкивающий, радостный - печальный, светлый - темный, легкий - тяжелый, безопасный - страшный, добрый - злой, простой - сложный, гладкий - шероховатый, округлый - угловатый, большой - маленький, грубый - нежный, мужественный - женственный, сильный - слабый, холодный - горячий, величественный - низменный, громкий - тихий, могучий - хилый, веселый - грустный, яркий - тусклый, подвижный - медлительный, быстрый - медленный, активный - пассивный.
Два антонима представляют как бы два противоположных полюса оценки. Если в тексте преобладает оценка левого антонима, рисуется красная полоска влево от центральной числовой оценки. Если преобладает оценка правого антонима, рисуется синяя полоска вправо от центральной числовой оценки. Если же оценка отличается от нейтральной в пределах погрешности измерений, то она представлена темно-серым цветом. Нажимая на кнопки полосы скроллинга вы можете просмотреть все оценки.
При оценке по монополярным шкалам каждая шкала представлена с помощью прилагательного русского языка, числовой оценки и цветной полосы синего или красного цвета в зависимости от знака числовой оценки. Длина полосы пропорциональна абсолютной величине числовой оценки. Это позволяет наглядно изобразить распределение оценок по всем шкалам.
Всего используется 20 встроенных монополярных шкал: прекрасный, светлый, нежный, радостный, возвышенный, бодрый, яркий, сильный, стремительный, медлительный, тихий, суровый, минорный, печальный, темный, тяжелый, тоскливый, угрюмый, устрашающий, зловещий.
Если оценка по конкретной шкале положительна (красный цвет), то это означает, что соответствующий признак, представленный названием шкалы, в тексте выражен. Если оценка отрицательна (синий цвет), соответствующий признак в тексте подавлен. Если же оценка отличается от нейтральной в пределах погрешности измерений, то она представлена темно-серым цветом.
Профиль оценок текста
С
истема ВААЛ позволяет не только оценить весь текст, но и представить, как изменялись те или иные оценки на протяжении текста. Для этого текст разбивается на 25 примерно равных кусков и вычерчивается соответствующая гистограмма. Оценки могут быть пошаговыми и накопленными.
При накопленной оценке первый столбик гистограммы оценивает первый кусочек текста, второй столбик гистограммы оценивает вместе первые два кусочка текста, третий столбик гистограммы оценивает вместе первые три кусочка текста и т.д.
При пошаговой оценке первый столбик гистограммы оценивает первый кусочек текста, второй столбик гистограммы оценивает отдельно второй кусочек текста, третий столбик гистограммы оценивает отдельно третий кусочек текста и т.д.
Для получения пошаговой или накопленной оценки следует просто установить требуемый тип профиля.
Профиль оценок позволяет определить те места в тексте, которые требуют, например, дополнительного редактирования. Для этого установите курсор мыши на столбик гистограммы с интересующей вас оценкой и дважды щелкните левой кнопкой мыши. Окно закроется и курсор редактирования текста будет установлен в начале того кусочка текста, который вы выбрали.
В списке шкал вы можете выбрать интересующую вас шкалу и посмотреть ее профиль по тексту.
Звуко-цветовые оценки текста
Данная страница содержит гистограмму оценок звуко-цветовой окраски текста и оценку звуко-цветовой окраски всего текста.
С
истема ВААЛ позволяет не только оценить весь текст, но и представить, как изменялись те или иные оценки на протяжении текста. Для этого текст разбивается на 25 примерно равных кусков и вычерчивается соответствующая гистограмма. Оценки могут быть пошаговыми и накопленными.
При накопленной оценке первый столбик гистограммы оценивает первый из кусочек текста, второй столбик гистограммы оценивает вместе первые два кусочка текста, третий столбик гистограммы оценивает вместе первые три кусочка текста и т.д.
При пошаговой оценке первый столбик гистограммы оценивает первый из кусочек текста, второй столбик гистограммы оценивает отдельно второй кусочек текста, третий столбик гистограммы оценивает отдельно третий кусочек текста и т.д.
Для получения пошаговой или накопленной оценки следует просто установить требуемый тип профиля.
Звуко-цветовая окраска всего текста представлена цветной полосой, в которую может входить до 6 цветов - желтый, зеленый, красный, синий, фиолетовый, коричневый. С гласными звуками русского языка люди ассоциируют цвета: а,я - красный; о - желтый; э,е - зеленый; и,й - синий; у,ю - темно-синий, лиловый, сиреневый; ы - темно-коричневый или черный. Цветовая окраска текста проявляется лишь в том случае, если соответствующие звуки встречаются в тексте чаще, чем в обычной речи. Гистограмма показывает, как менялась звуко-цветовая окраска на протяжении текста.
Ритмический коэффициент представляет среднюю длину слова в слогах в анализируемом тексте. По мнению некоторых лингвистов, средняя длина слова в слогах обратно пропорциональна ритмичности высказывания. Для русского языка ритмический коэффициент равен 2.8. Для диалоговой речи он снижается до 2.0. Это означает, что диалоговая речь более ритмична.
Коррекция текста
Когда текст набран, вы можете произвести его коррекцию для достижения требуемого воздействия на читателя или слушателя. Для этого выберите пункт меню <Коррекция текста>.
Сначала появится окно выбора характеристик, в котором вы сможете задать требуемые характеристики текста. Затем система соберет статистику встречаемости в тексте плохих слов и предложит вам выбрать порог оценок, определяющих эти плохие слова. Лишь после этого начнется перебор плохих слов. Они будут выводиться в специальном диалоговом Окне коррекции текста. В нем вы можете воспользоваться словарем синонимов для подходящей замены слова или ввести свой собственный вариант. При этом вовсе не обязательно заменять каждое плохое слово, но в большинстве случаев замены следует произвести.
При использовании системы ВААЛ для составления текста вы будете заинтересованы в том, чтобы получившийся текст обладал требуемым эмоциональным воздействием на подсознание. В данном диалоговом окне вы можете установить желаемые характеристики по шкалам. Они будут в дальнейшем использованы для поиска слов, противоречащих желаемому воздействию. Коррекция может одновременно производиться по биполярным и монополярным шкалам.
Для выбора характеристик по биполярным шкалам переключитесь на другую страницу. Вы можете быть заинтересованы в следующем:
чтобы был выражен признак левой половины шкалы;
чтобы был выражен признак правой половины шкалы;
чтобы значение по данной шкале было в тексте нейтральным;
любое значение шкалы вам подходит.
В первом случае установите курсор мыши на имени признака в крайнем левом столбце и щелкните левой кнопкой мыши. Имя признака будет выделено красным цветом.
Во втором случае установите курсор мыши на имени признака во втором столбце и щелкните левой кнопкой мыши. Имя признака будет выделено синим цветом.
В третьем случае установите курсор мыши в строке напротив имени признака в третьем столбце на слове нейтральная и щелкните левой кнопкой мыши. Слово признака будет выделено темно-серым цветом.
В
четвертом случае установите курсор мыши в строке напротив имени признака в четвертом столбце на слове любая и щелкните левой кнопкой мыши. Если до этого в строке уже имелось выделение, оно исчезнет. По умолчанию принимается именно четвертый случай.
При выборе желаемых характеристик по монополярным шкалам вы можете быть заинтересованы в следующем:
чтобы данный признак был в тексте выражен;
чтобы данный признак был в тексте подавлен;
чтобы данный признак был в тексте нейтральным;
любое значение признака вам подходит.
В первом случае установите курсор мыши на имени признака в крайнем левом столбце и щелкните левой кнопкой мыши. Имя признака будет выделено красным цветом.
Во втором случае установите курсор мыши на имени признака во втором столбце и щелкните левой кнопкой мыши. Имя признака будет выделено синим цветом.
В третьем случае установите курсор мыши в строке напротив имени признака в третьем столбце на слове нейтральная и щелкните левой кнопкой мыши. Слово признака будет выделено темно-серым цветом.
В четвертом случае установите курсор мыши в строке напротив имени признака в четвертом столбце на слове любая и щелкните левой кнопкой мыши. Если до этого в строке уже имелось выделение, оно исчезнет. По умолчанию принимается именно четвертый случай.
При выборе более чем одной шкалы для поиска плохих слов используется интегральный показатель. Например, если вы установили для монополярных шкал красный фон шкалы Бодрый и синий фон шкалы Темный, это означает, что вы хотите, чтобы текст был бодрым и не был темным. Если теперь оценить слово ВААЛ, оно получит оценку 40 по шкале Бодрый и оценку 5 по шкале Темный. По второй шкале данное слово противоречит желаемой характеристике, так как оценка по ней положительна. В случае же интегральной оценки бодрость этого слова значительно перевешивает его темноту и потому оно считается хорошим.
Если вы хотите просто выделить в тексте слова, которые противоречат желаемым характеристикам, вы можете установить один из переключателей опции Выделение. По умолчанию установлен переключатель Заменой. В этом случае при нахождении каждого плохого слова оно выводится в Окно коррекции текста. При установлении переключателей Цветом, Курсивом или Подчеркиванием плохое слово не выводится в Окно коррекции текста, а просто выделяется в редактируемом документе соответственно синим цветом, курсивом или подчеркиванием.
Для того, чтобы продолжить работу с выбранным набором характеристик, нажмите на кнопку <Принять>. Система соберет статистику распределения плохих слов в тексте и предложит выбрать порог оценок слов.
Выбор порога оценок плохих слов
О
чевидно, что разные слова вносят различный вклад в окончательное звучание и впечатление от текста. Довольно часто для коррекции текста достаточно выбрать лишь самые плохие по звучанию слова и заменить их. Для этого и служит определение порога оценок плохих слов, которые должны быть подвергнуты замене.
В окне представлена гистограмма распределения плохих слов. По горизонтали представлены оценки слов, а по вертикали - количество слов с этими оценками. Передвигая движок внизу окна, вы можете выбрать порог для оценок плохих слов. Изначально движок стоит в крайней правой позиции. Передвигая его влево, вы изменяете порог оценок. Это находит отражение в изменении цвета столбиков гистограммы. Синие столбики соответствуют плохим словам, которые не будут подвергнуты коррекции, а красные столбики - словам которые должны быть подвергнуты коррекции. Внизу окна в статусной строке указано общее количество плохих слов в тексте и количество слов, которые выбраны для коррекции.
Окно коррекции текста
Диалоговое окно коррекции текста похоже на окно оценки слова. Исчезли кнопки <Протокол>, <База данных> и <Печать>, но появилась кнопка <Продолжить>. При нажатии на нее система переходит к следующему слову.
Изначально, когда появляется окно замены синонимов, в строке ввода содержится слово, противоречащее желаемым характеристикам текста, а на гистограммах дана оценка этого слова.
Вы можете воспользоваться словарем синонимов, нажав кнопку <Синонимы>. Если для данного слова имеются синонимы, то они будут выведены в окне. Подбор синонимов производится путем подбора наиболее похожих слов. Выбрав подходящий синоним, нажмите кнопку <Оценить>. Все оценки будут обновлены для данного слова. При необходимости подкорректируйте синоним для согласования с другими словами предложения.
Чтобы произвести замену найденного слова на другое, введите в строке ввода новое слово, нажмите кнопку <Оценить>, посмотрите, является ли его оценка лучше, чем у предыдущего. Если новое слово кажется вам более подходящим, то нажмите кнопку <Заменить>. В противном случае нажмите кнопку <Продолжить> и продолжите поиск плохих слов.
Если вы хотите остановить выполнение процедуры поиска и замены, нажмите кнопку <Выход>.
Жанры
При оценке текстов большое значение имеет понятие нормальной частоты встречаемости тех или иных его характеристик. Это могут быть частоты звуков языка, отдельных слов, групп слов и пр. Эти характеристики различны для языка ребенка, языка политического деятеля, канцелярского языка и языка художественной прозы.
Жанры в системе ВААЛ как раз и служат для хранения таких норм.
Выбор пункта меню <Создать новый жанр> позволяет вам расширить число жанров, с которыми вы хотите работать.
Допустим, вы парламентарий и заинтересованы в том, чтобы активно влиять на других парламентариев. Для этого вы должны, например, взять стенограмму некоторых заседаний парламента и перенести ее на компьютер. Чем больше объем текста, тем лучше.
После этого вам следует воспользоваться выбором пункта меню <�Создать новый жанр>. Тем самым вы настроите систему на людей - носителей такого типа лексики. Все остальное система сделает сама и сохранит необходимую информацию о новом жанре в трех файлах с тем же именем, что и текст, но с расширениями jct, jem и jfn, которые находятся в установочном каталоге системы ...\VAAL\Janr. Система готова к работе с новым жанром.
Еще один пример эффективного применения жанров мог бы заключаться в следующем. Пусть вас привлекли к участию в предвыборной кампании на стороне одного из кандидатов в депутаты. У вас есть сильный соперник. Вы собираете листовки, которые распространяют от имени вашего соперника, собираете газетные статьи, напечатанные им или людьми его команды, собираете стенограммы его выступлений по радио и телевидению. Дальше вводите весь этот материал в компьютер, создаете на его основе жанр и в дальнейшем готовите статьи, листовки, тексты выступлений вашего кандидата, оценивая их относительно вновь созданного жанра. Если по требуемым показателям подготовленные вами материалы будут лучше, чем материалы конкурента, ваша кампания будет проведена более эффективно.
При последующих сеансах работы вам уже нет надобности создавать тот же самый жанр. Достаточно лишь загрузить его с диска.
Выбор пункта меню <Загрузить жанр> позволяет вам загрузить с диска созданный ранее жанр. По умолчанию все жанры хранятся в директории ...\VAAL\Janr.
В
ыбор пункта меню <Показать текущий жанр> информирует вас о текущем жанре.
Следует сделать одно важное замечание. В системе ВААЛ пользователь получил возможность самому изменять набор рабочих категорий при контент-анализе текста. Может случиться так, что жанр будет создан для одного набора категорий, а использоваться станет для другого набора. Или же могут быть изменены словарные составы самих категорий. В этих случаях не все оценки текста, вычисляемые относительно нормы, будут правильными. Необходимо быть внимательными, чтобы не допускать таких ошибок.
КОНТЕНТ-АНАЛИЗ
Система ВААЛ включает в себя ряд модулей, позволяющих проводить полноценный контент-анализ текстов. Некоторые из этих модулей уникальны, так как реализуют методы, не представленные ни в одной из коммерческих систем для компьютерного контент-анализа.
В отличие от предыдущих версий в настоящей версии системы ВААЛ возможности контент-анализа значительно расширены. В ней учтены многие пожелания, которые поступили к нам от пользователей.
Мы столкнулись с тем, что очень немногие знакомы с методами контент-анализа и умеют ими пользоваться для решения конкретных задач. В нашей системе образования некоторое представление об этих методах получают лишь социологи. Для всех остальных остается лишь заниматься самообразованием в данной области. К сожалению, на этом пути возникает много трудностей, так как на русском языке нет практически никаких серьезных работ, в которых излагались бы методы контент-анализа. В давно ушедшие годы было издано тоненькое учебное пособие по контент-анализу, но лишь им дело и ограничилось. В некоторых книгах имеются небольшие главки, посвященные контент-анализу, в социологических журналах появляются статьи с отчетами о проведенной работе. И это все.
С появлением Интернета стали доступны многочисленные зарубежные сайты, имеющие отношение к контент-анализу. На этих сайтах можно найти методические материалы, программное обеспечение. Просто введите в любой поисковой системе два слова content analysis и Вы увидите, как много материалов по этой теме имеется в Интернете.
Из истории метода контент-анализа
Передача опыта от человека к человеку, от поколения к поколению происходит посредством языка. Естественный язык, будучи необычайно сложным образованием, тесно связанным с мышлением, отличает нас от всего прочего животного мира. Язык, кодируя вещи, отношения между вещами, различные состояния, позволяет нам оперировать внешним миром в идеальном плане. Не совершая угона машины, мы можем в идеальном плане, пользуясь языком, смоделировать это и рассмотреть все негативные последствия такого поступка.
Помимо благ, которые несет язык человеку, в нем сокрыто и множество ловушек, которые активно используются. Сила и коварство языковых технологий заключается в том, что от них практически невозможно защититься. Люди просто вынуждены ежедневно вступать в языковое взаимодействие. В этом взаимодействии они частично раскрывают себя - свои психологические черты, свое видением мира, свои оценки различных явлений. Сознательные попытки не сказать лишнего далеко не всегда приводят к желаемому результату, так как многие особенности употребления языка имеют бессознательную природу. Контент-анализ является тем инструментом, который позволяет приоткрыть многие тайны, связанные с использованием языка.
Трудно датировать появление контент-анализа. Еще в девятнадцатом веке производили подсчет количества упоминаний в книгах имени Иисуса Христа и делали на этом основании определенные выводы об авторах. Эту работу с полным основанием можно отнести к количественному контент-анализу. К сожалению, многие социологи в крупных социологических агентствах до сих пор по прошествии более ста лет сводят весь контент-анализ к одному лишь подсчету упоминаний в прессе имен различных политиков. Предлагаем заглянуть на соответствующие сайты в Интернете и убедиться в справедливости сказанного.
В начале двадцатого века различные слова стали группировать по тем или иным содержательным основаниям в категории и подсчитывать частоту употребления в тексте не слов, а категорий. За этим стояла простая мысль. Чтобы оценить, какой из двух авторов чаще употребляет оскорбительные слова, вовсе не нужно сравнивать их по количеству употреблений слова негодяй. Может оказаться, что этого слова вообще нет в лексиконе одного из них. Необходимо составить категорию (словарь, тезаурус) слов с оскорбительным смыслом и подсчитывать частоту употребления слов этой категории как целого. При этом возникает проблема критерия для отбора слов в такую категорию.
В ходе дальнейших исследований стали учитывать нормальную частоту употребления слов носителями данного языка. Дело в том, что различные слова употребляются с различной частотой, есть даже эмпирически определенные нормы употребления различных слов. Исходя из нормальных частот употребления слов аналогичные нормы могут быть сопоставлены и категориям. Что это дает?
Зная нормальную частоту употребления слов данной категории в русском языке, мы можем подсчитать, реже или чаще нормы употребляются слова этой категории конкретным человеком, в конкретном издании и пр. Из этого можно извлечь очень много полезной информации. Вспомним поговорку – что у кого болит, тот о том и говорит. Если категория слов представляет некоторую тему, то частота ее употребления может говорить о внимании к теме. Если же к этому добавить еще и динамику изменения такого внимания, то мы получим хорошо известный метод разведки, когда основное внимание обращают на уменьшение упоминания каких-то тем в прессе противника и на этом основании судят об их актуальности. Категория может представлять собой слова, характеризующие определенный психологический тип личности. В этом случае сравнивая с нормой частоту употребления слов этой категории конкретным человеком, мы можем судить о принадлежности его к этому психологическому типу. Следует особо подчеркнуть, что для обоснованности таких выводов обязательно необходимо учитывать норму среднеязыкового употребления слов данной категории.
Норма частоты употребления слов или категорий не всегда должна быть среднеязыковой. Представим, что мы подсчитали норму употребления негативно окрашенных слов в конкретном печатном издании, в конкретной рубрике, конкретным автором. После этого мы начинаем сравнивать эту норму с частотой употребления в том же издании, рубрике, у того же автора негативно окрашенных слов в статьях на конкретную тему, о конкретном человеке и пр. И вдруг выясняем, что в этих статьях частота значительно превышает норму. Отсюда легко сделать вывод о негативном отношении к теме, человеку и пр. Если к этому добавить и временную динамику, то получим хорошо знакомую ситуацию из области предвыборных информационных войн.
В середине прошлого века стали обращать внимание на совместное употребление слов различных категорий. Оказалось, что можно ввести оценки силы связи (расстояния, близости) между категориями. Эти оценки отличаются друг от друга для различных людей, различных печатных изданий и пр. Представим себе, что у нас имеется набор категорий, среди которых есть оценочные категории (негатив, позитив, агрессивность), психологически нагруженные категории, категории, представляющие различные явления окружающей нас действительности. Оценив силу связи между этими категориями у конкретного человека, мы реконструируем его видение мира и позиционирование себя в этом мире. Считая, что чем сильнее связь, тем меньше расстояние между категориями, мы можем даже графически представить взаиморасположение этих категорий в некотором пространстве. Интересно то, что связи между категориями очень часто не осознаются теми, у кого они имеются, и потому являются весьма ценными с точки зрения косвенной диагностики.
По мере развития контент-анализа его методы становились все более и более трудоемкими. В настоящее время обходиться без помощи компьютера просто невозможно. Это связано и с большими объемами обрабатываемой информации и с изощренностью используемых методов.
Интересным и весьма полезным в контент-анализе является метод выявления контекстов (collocations) категорий. Представим, что у нас есть некоторая категория и мы интересуемся словами, которые употребляются с ней в одних контекстах. Например, если у нас есть категория, состоящая из одного слова змея, то уже очевидно, что в одних с ней контекстах чаще, чем во всем тексте, будут употребляться слова укус, яд, ползти… Получается, что отслеживая контексты потребления категорий, мы можем получать о них дополнительную информацию. Если же учесть, что такие контексты являются некоторыми четко определенными выборками из основного текста и к ним в свою очередь применим контент-анализ, то мы можем извлечь из них гораздо больше полезной информации.
Иногда при анализе текстов бывает трудно определить, каким должен быть набор рабочих категорий. В этом случаем определенную помощь могут оказать методы автоматической категоризации текстов. Эти методы позволяют автоматически выделять категории, специфичные для конкретного текста. Их можно также назвать темами, затронутыми в данном тексте.
Краткий обзор истории развития количественных методов контент-анализа ни в коем случае не является исчерпывающим. Он просто призван хоть немного ознакомить пользователя с теми методами, которые реализованы в системе ВААЛ.
Создание словаря (словарный анализ)
Система ВААЛ позволяет по любому тексту составить его словарь и провести некоторый анализ. Кроме этого словарь может быть использован при формирования категорий.
Вы имеете возможность установить следующие параметры обработки текста при формировании словаря:
нормализовать слова;
сохранять словарь в файл или не сохранять его.
Нормализация слов означает приведение их к основной форме. Для существительных это именительный падеж единственного числа, для прилагательных - именительный падеж единственного числа мужского рода, для глаголов, причастий и деепричастий - инфинитив. Если Вы откажетесь от нормализации, уберете галочку, то слова будут заноситься в словарь именно в том виде, в котором они встречаются в тексте.
Если слова приводятся к нормальной форме, то иногда результат может быть неоднозначным. Например слово дома можно привести к именительному падежу единственного числа дом, а можно посчитать наречием дома. В таких случаях в словарь заносятся оба варианта.
При занесении в словарь все буквы слов переводятся в нижний (строчный) регистр.
Кнопки:
<Принять> - начало обработки текста;
<Помощь> - вызов контекстной справки;
<Отказ> - отказ от обработки текста и закрытие окна.
Результаты словарного анализа
Окно содержит:
редактрируемое поле;
четыре кнопки <Протокол>, <Печать>, <Помощь> и <Выход>;
статусную строку.
В редактируемом поле выведены результаты анализа:
число слов в тексте
число лексем - число нормальных форм
лексическое разнообразие - отношение числа лексем к числу слов, норма 0.37
средняя длина слова - в буквах, норма 6
средняя длина предложения - в словах
грамматическая сложность текста - отношение числа запятых и других знаков препинания внутри предложения к числу слов в предложениии
Также в редактируемом поле содержится информация об имени словаря и директории, в которую он сохранен.
Вы имеете возможность внести в редактируемое поле свои комментарии.
Кнопки:
<Протокол> - сохранение содержимого редактируемого поля в текстовом файле в директории …VAAL\Protocol;
<Печать> - распечатывание содержимого редактируемого поля на принтере;
<Помощь> - контекстная система помощи;
<Выход> - закрытие окна и выход.
Формирование категорий
Одним из наиболее ответственных подготовительных моментов контент-анализа является формирование категорий. От того, насколько удачно выбраны категории и насколько качественно они составлены, зависят результаты анализа текстов. Давать здесь какие-либо рекомендации весьма затруднительно. Все зависит от целей и задач, которые стоят перед исследователем, а также от его понимания сути метода контент-анализа.
Система ВААЛ позволяет формировать категории двух типов - простые и сложные.
|