Скачать 6.22 Mb.
|
ГЛАВА 3 ПСИХОМЕТРИЧЕСКИЕ ОСНОВЫ ПСИХОДИАГНОСТИКИ 3.1. РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМ Основные статистические принципы построения тестов достаточно полно освещены в появившейся в начале 80-х годов на русском языке литературе по дифференциальной психометрике (Аванесов В. С., 1982; Анастази А" 1982; Гайда В. К., Захаров В. П., 1982). Тем не менее в указанных руководствах центральная проблема психометрики те- стов - вопрос о тестовых нормах - еще не получила последователь- ного освещения. Прежде всего это относится к руководству известной представительницы американской тестологии А. Анастази. В руководстве Анастази не получают достаточного критического об- суждения две основополагающие предпосылки традиционной западной тестологии: вопрос о применении статистических норм (квантилей рас- пределения баллов) в качестве диагностических норм и вопрос о све- дении всех эмпирических распределений к нормальной модели. Здесь эти предпосылки будут проанализированы в контексте краткой рекон- струкции системы основных понятий дифференциальной психометрики. Статистическая природа тестовых шкал. Типичный измерительный тест в психодиагностике - это последовательность кратких заданий, или пунктов, дающая в результате ее выполнения испытуемым последо- вательность исходов, которая затем подвергается однозначной количе- ственной интерпретации. Примеры интерпретации в интеллектуальных тестах, состоящих из отдельных задач: <�правильное решение>, <�оши- бочное решение>, <�отсутствие ответа> (пропуск задачи из-за нехватки времени). Примеры интерпретации в случае личностных опросников, состоящих из высказываний, предлагаемых для подтверждения испы- туемым: <�подтверждение> (ответ <�верно>), <�отвержение> (ответы <�не согласен>, <�неверно>). Суммарный балл по тесту подсчитывается с помощью ключа: ключ устанавливает числовое значение исхода по каждому пункту. Напри- мер, за правильное решение задания - <+1>, за неправильное или пропуск - <�О>. Тогда балл буквально выражает количество правиль- ных ответов. Исход по отдельному заданию подвержен воздействию не только со стороны измеряемого фактора - способности или черты испытуемого, но и побочных шумовых факторов, которые являются иррелевантными по отношению к задаче измерения. Примеры случайных факторов: ко- лебания внимания, вызванные неожиданными отвлекающими события-- ми (шум на улице, стук в дверь и т. п.), трудности в понимании смыс- ла задания (вопроса), вызванные особенностями опыта данного кон- кретного испытуемого, и т. п. Последовательность исходов оказывает- ся последовательностью событий, содержащей постоянный и случайный компоненты. Как известно, основным приемом, позволяющим устранить искажающее влияние случайных факторов на результат (суммарный балл), является балансирование этого влияния с помощью повторе- ния. При этом фактически предполагается, что повторение обеспечива- ет рандомизацию (случайное варьирование) неконтролируемого фак- 53 STR.54 тора, в результате чего при суммировании исходов положительные и негативные эффекты случайных факторов взаимопоглощаются (о ме- ханизме рандомизации см.: Готтсданкер P., 1982). В оптимальном тесте набор и последовательность заданий органи- зуются таким образом, чтобы повысить долю постоянного компонента и сократить долю случайного в величине суммарного балла. Тем не ме- нее, несмотря на различные статистические ухищрения, суммарный балл в психологических измерениях содержит несравненно большугс долю случайного компонента, чем в обычных физических измерениях. В силу этого суммарный балл оказывается определенным лишь в из- вестных пределах, заданных ошибкой измерения. Для того чтобы оценить эффективность, дифференциальную цен- ность всей процедуры измерения, необходимо соотнести размеры ошиб- ки измерения с размерами разброса суммарных баллов, вызванных ин- дивидуальными различиями в измеряемой характеристике между испы- туемыми. В терминах статистики речь идет о сравнении так называе- мой <�истинной> дисперсии распределения суммарных баллов с диспер- сией <�ошибки>. Именно этим обусловлен необходимый интерес психо- метристов к распределению суммарных баллов. Поэтому анализ рас- пределения необходим не только при использовании статистически?! норм, но и в случае абсолютных и критериальных норм. Как известно, частотное распределение суммарных баллов имее1 удобную графическую иллюстрацию в виде кривых распределений: ги- стограммы и кумуляты (см., в частности, удачное популярное введе- ние в описание распределений в книге: Кимбл Г., 1982, с. 55-70) В случае гистограммы по оси абсцисс откладываются <�сырые очки> - первичные показатели суммарных баллов, возможных для данного те- ста, по оси ординат -- относительные частоты (или проценты) встреча емости баллов в выборке стандартизации (Анастази А., 1982, с. 66) Как известно, для <�колоколообразной> кривой нормального распреде ления дисперсия визуализируется как параметр, ответственный з; <�распластанность> графика плотности вероятности (теоретического ана лога эмпирической кумуляты) вдол] оси X. Чтобы визуализировать дис Частота персию ошибки измерения, нужно бы ло бы многократно провести тест одним испытуемым и построить гра фическое распределение частот ег <�персональных> баллов. В результат получится схема, представленная н рис. 1. Очевидно, что дифференцирующая способность теста сводится к нулк если кривые, иллюстрирующие <�и( Суммарный Ват ТИННуЮ> И <�ошибочную> ДИСПерСИ1 совпадают. Как видим, анализ ра( Рис. 1. Графическая иллюстрация пределения тестовых баллов необхс соотношений индивидуальной и меж- дим уже для анализа надежност индивидуальной (общей) вариации теста (СМ. 3.2). тестовых баллов Проблема, меры в психометр1 ке и свойства пунктов теста. В физ1 ческих измерениях калибровка шкалы производится на основе контр ля за равномерным варьированием измеряемого свойства эталоннь объектах. Носителем меры является эталон - физический объект, ст. бильно сохраняющий заданную величину измеряемого свойства. В дис STR.55 ференциальной психометрике такие физические эталоны отсутствуют: мы не располагаем индивидами, которые были бы постоянными носи- телями заданной величины измеряемого свойства. Роль косвенных эта- лонов в психометрике выполняют сами тесты: в том смысле, в каком трудность задач можно рассматривать как величину, прямо пропорцио- нально сопряженную со способностью (чем труднее задача, тем выше должен быть уровень способности, требуемый для ее решения). Анало- гом понятия <�трудность> для <�ли-вопросов> опросника является <�си- ла>: более <�сильные> высказывания (в логическом смысле) вызывают подтверждение (согласие) у меньшего числа испытуемых. Ни труд- ность, ни силу пунктов теста нельзя выявить иначе, чем с помощью про- ведения теста. Операциональным определением трудности оказывает- ся <�процентильная мера>: процент испытуемых, справившихся с зада- нием теста (или ответивших <�верно> на <�ли-вопрос>). Чем меньше про- цент, тем выше трудность. Кривая распределения тестовых баллов отражает свойства пунктов, из которых составлен тест. Если кривая имеет правостороннюю асим- метрию, то значит в тесте преобладают трудные задания; если кривая имеет левостороннюю асимметрию, то значит большинство пунктов в тестер-легкие (слабые) (рис. 2). Тесты типа а) плохо дифференцируют испытуемых с низким уров- нем способностей: все эти испытуемые получают примерно одинаковый низкий балл. Тесты типа б), наоборот, хуже дифференцируют испытуе- мых с высоким уровнем способностей. Если пункты обладают оптимальным уровнем трудности (силы), то кривая распределения зависит от того, насколько пункты однородны. Если пункты разнородны (исход по одному пункту не предопределя- ет исход по другому), то мы получаем тест в виде последовательности независимых испытаний Бернулли. Как известно из математической статистики, при достаточно большом количестве независимых испыта- ний с двумя разновероятными исходами кривая биномиального распре- деления (кривая суммарного балла) автоматически по закону боль- ших чисел приближается к кривой нормального распределения (цент- ральная предельная теорема Муавра - Лапласа). Если тест содержит такие разнородные задания примерно равного уровня трудности (имен- но такие задания и подбираются для измерения интегральных свойств ПраИмторанняп патжчтельнм ассчиеприя kTX Рис. 2. Графики, иллюстрирующие асимметрию распределения тестовых баллов Рис. 3. Графики, иллюстрирующие положительный (а) и отрицательный (а, б) эксцесс распределения тесто- ,вых баллов личности - с широкой областью применения), то нормальность рас- пределения суммарных баллов возникает автоматически - как арте- факт самой процедуры подсчета суммарных баллов. При этом, конеч- <�Ли.-вопросы>-это вопросы, содержащие высказывания, с которыми испытуе- мый должен либо согласиться, либо не согласиться. 55 STR.56 но, форма кривой распределения баллов не позволяет говорить о ре- альной форме распределения измеряемого свойства, каким оно являет- ся само по себе - в широкой популяции испытуемых. Нормальность распределения есть артефакт, прямое следствие направленного отбора пунктов с заданными свойствами. Если подбираются пункты, тесно положительно коррелирующие между собой (испытания не являются статистически независимыми), то в распределении баллов возникает отрицательный эксцесс (рис. 3, а). Максимальных величин отрицательный эксцесс достигает по мере воз- растания вогнутости вершины распределения - до образования двух вершин - двух мод (с <�провалом> между ними - рис. 3, б). Бимо- дальная конфигурация распределения баллов указывает на то, что вы- борка испытуемых разделилась на две категории (с плавными пере- ходами между ними): одни справились с большинством заданий (со- гласились с большинством <�ли-вопросов>), другие - не справились. Такая конфигурация распределения свидетельствует о том, что в ос- нове пунктов лежит какой-то один оощий им всем признак; соответс- твующий определенному свойству испытуемых: если у испытуемых есть это свойство (способность, умение, знание), то они справляются с большинством пунктов, если нет этого свойства - то не справляются, В некоторых редких ситуациях пункты могут отрицательно коррелиро- вать друг с другом. В этом случае на кривой возникает положитель- ный эксцесс (рис. 3, в): вся масса эмпирических точек скучивается вблизи среднего значения. Такое возможно в двух случаях: когда ключ составлен неверно - объединены при подсчете отрицательно связан- ные признаки, которые обусловливают взаимоуничтожение баллов; во- вторых, когда испытуемые применяют, разгадав направленность опрос- ника, специальную тактику <�медианного балла> - искусственно ба- лансируют ответы <�за> и <�против> одного из полюсов измеряемого ка- чества. Итак, когда в качестве единственного эталона измерения психоди- агностами рассматривается сам тест, то в качестве меры измеряемого свойства выступает местоположение балла на кривой распределения. Применяется процентильная шкала. В качестве универсальной меры, пригодной для разных (по своей качественной направленности и ко- личеству пунктов) тестов, используется <�процентильная мера>. 77/70- центиль - процент испытуемых из выборки стандартизации, которые получили равный илц более низкий балл, чем балл данного испытуе- мого. Таким образом, в качестве источника данной меры выступает нормативная выборка (выборка стандартизации), на которой построе- но нормативное распределении тестовых баллов. Процентильные шка- лы лежат в основе всех традиционных шкал, применяемых в тестоло- гии (Т-очки ММР1, баллы IQ, стены 16 PF я др.). Подчеркнем, что с точки зрения теории измерений процентильные шкалы относятся к порядковым шкалам: они дают информацию, у ко- го из испытуемых сильнее выражено измеряемое свойство, но ничего не позволяют говорить о том, насколько или во сколько раз сильнее. Для того, чтобы строить на базе таких шкал количественный прогноз, нужно повысить уровень измерения (популярное изложение представ- лений о теории измерений GM.I в книге: Клигер С. А. и др., 1978). Пе- реход к шкалам интервалов производят либо на базе эмпирического распределения, л,ибо на базе произвольной модели теоретического рас- пределения. В абсолютном большинстве случаев в роли такой теоре- тической модели оказывается модель нормального распределения (хо- тя в общем случае может быть использована любая модель). STR.57 В целом кроме статистических, процентильных шкал следует отли- чать нередко используемые в дифференциальной психсметрике еще 2 вида шкал (и соответственно 2 вида тестовых норм). Это, во-первых, то, что можно условно назвать <�абсолютными тестовыми нормами> - в роли шкалы для вынесения диагноза выступает сама шкала <�сырых> очков, во-вторых, <�критериальные> тестовые нормы, применение таких норм можно считать оправданным в двух случаях: 1) когда сама те- стовая <�сырая> шкала имеет практический смысл (например, студент, изучающий иностранный язык, должен знать как можно больше слрв этого языка, и сырой показатель лексического теста имеет практиче- ский смысл); 2) когда применяются <�критериальные> тестовые нормы: сырой балл по тесту в результате эмпирических исследований связыва- ется с заданной вероятностью успешности какой-то практической дея- тельности (вероятность успеха <�критериальной> деятельности, какой .для упомянутого выше примера может быть синхронный перевод мо- нолога в течение 30 минут). Процентильная нормализация шкалы. Выше показано, что нор- мальность распределения достигается искусственным подбором пунк- тов теста с заданными статистическими свойствами. Опишем еще ряд процедур, которые также широко используются для искусственной нор- мализации. 1. Нормализация пунктов. Ключ для данного пункта корректирует- ся на базе нормальной модели. Если среди нормативной выборки с дан- ным заданием справились только 16% испытуемых, то данному пункту на интервальной шкале <�трудности> (при условии априорного приня- |
Общая биология Костерин О. Э. Общая биология: Курс лекций для психологов. Учебное пособие. – 2-е изд., испр и доп. / Новосибирск: Новосиб гос ун-т.,... |
Учебное пособие по дисциплине «медицина катастроф» Учебное пособие подготовили доценты Астапенко В. П., Кудинов В. В., Волкодав О. В., Кобец Ю. В |
||
Учебное пособие по дисциплине «медицина катастроф» Учебное пособие подготовили доценты Астапенко В. П., Кудинов В. В., Волкодав О. В., Кобец Ю. В |
Учебное пособие Медицинская подготовка командного состава судов: Учебное пособие. М.: Мортехинформреклама, 1993. 152с |
||
Учебное пособие Учебное пособие составлено с учетом требований Государственного образовательного стандарта высшего профессионального образования... |
Учебное пособие тема: «профилактика пролежней» Учебное пособие пм 04 Выполнение работ по профессии Младшая медицинская сестра по уходу за больными |
||
Учебное пособие Иркутск 2006 Учебное пособие предназначено для студентов III v курсов специальности «Технология художественной обработки материалов» |
Компьютерные коммуникации в культуре учебное пособие по английскому языку Учебное пособие предназначено для развития навыков и умений устной речи. Пособие включает 8 тем, 21 текст, словарь. Текстовый материал... |
||
Учебное пособие соответствует примерной учебной программе по дисциплине... Учебное пособие предназначено для студентов, обучающихся по специальности «Педиатрия» |
Учебное пособие Г82 Противодействие организованной преступности: Учебное пособие для вузов / Под ред. А. И. Гурова, B. C. Овчинского. М.: Инфра-м,... |
||
Учебное пособие для бакалавров Безопасность жизнедеятельности / Под редакцией д-ра экон наук, проф. С. Г. Плещица. Часть 1: Учебное пособие.– Спб.: Изд-во Спбгэу,... |
Учебное пособие (Краткий курс) Москва Издательство Российского университета дружбы народов Учебное пособие предназначено для студентов, обучающихся в магистратуре и специализирующихся по защите растений |
||
Авиационный учебный центр «Северный Ветер» система управления безопасностью... Учебное пособие рассмотрено и одобрено Учебно-методическим советом Ассоциации ауц |
Учебное пособие правила etops. Навигация и процедуры при отказе двигателя,... Учебное пособие рассмотрено и одобрено Учебно-методическим советом Ассоциации ауц |
||
Учебное пособие ппи, 2008 104 с.: ил. Учебное пособие по дисциплине... Учебное пособие по дисциплине «Конструкторско-технологическое обеспечение производства эвм» предназначено для студентов Псковского... |
Страхование. Транспорт. (Корреспонденция и документация) учебное пособие по английскому языку Пособие содержит аутентичные документы и письма; материалы для развития навыков устного и письменного перевода; снабжено англо-русским... |
Поиск |