Федеральное агентство по образованию
Государственное образовательное учреждение
высшего профессионального образования
«Омский государственный технический университет»
Математические методы в психологии
Конспект лекций
для студентов 2 курса гуманитарных специальностей
дневного, вечернего и заочного отделений
Омск – 2008
Составитель Ананко Алла Александровна, ст. преподаватель
Печатается по решению редакционно-издательского совета Омского
государственного технического университета.
ЛЕКЦИЯ 1. Измерения и шкалы | |
1.1.Типы измерений | |
1.2. Измерительные шкалы | |
1.3. Как определить, в какой шкале измерено явление | |
ЛЕКЦИЯ 2. Дискретный вариационный ряд и его основные показатели | |
2.1. Вариация признака в совокупности и значение её изучения | |
ЛЕКЦИЯ 3. Статистический анализ выборочных средних двух выборок | |
3.1. Выбор метода и общий подход | |
3.2. t-критерий Стьюдента | |
3.3. Алгоритм расчета критерия Стьюдента для зависимых выборок измерений | |
ЛЕКЦИЯ 4 . Критерии для непараметрических распределений | |
4.1.
| |
4.2. Критерий знаков | |
ЛЕКЦИЯ 5. Вычисление и анализ коэффициента ранговой корреляции | |
5.1. Выполнить ранжирование по следующему алгоритму | |
5.2. Алгоритм расчета коэффициента ранговой корреляции Спирмена | |
ЛЕКЦИЯ 6. Многомерное шкалирование | |
6.1. Назначение | |
6.2. Многомерные методы и модели | |
6.3. Неметрическая модель | |
ЛЕКЦИЯ 7 . Кластерный анализ | |
7.1. Назначение | |
7.2. Методы кластерного анализа | |
ЛЕКЦИЯ 8. Уравнение линейной регрессии | |
8.1. Анализ статистической взаимосвязи между двумя рядами | |
8.2. Построение модели парной регрессии | |
8.3. Анализ качества модели парной регресс | |
ПРИЛОЖЕНИЯ | |
Приложение
А1. Критические значения критерия
| |
Приложение А2. Критические значения критерия знаков | |
БИБЛИОГРАФИЧЕСКИЙ СПИСОК |
Лекция 1. Измерения и шкалы
1.1. Типы измерений
Любое эмпирическое научное исследование начинается с того, что исследователь фиксирует выраженность интересующего его свойства, как правило, при помощи чисел. Таким образом, следует различать объекты исследования (в психологии это чаще всего люди, испытуемые), их свойства (то, что интересует исследователя, составляет предмет изучения) и признаки , отражающие в числовой шкале выраженность свойств.
Измерение в терминах производимых исследователем операций - это приписывание объекту числа по определенному правилу. Это правило устанавливает соответствие между измеряемым свойством объекта и результатом измерения - признаком.
В обыденном сознании, как правило, нет необходимости разделять свойства вещей и их признаки: такие свойства предметов, как вес и длина, мы отождествляем, соответственно, с количеством граммов и сантиметров. Если нет необходимости в измерении, мы ограничиваемся сравнительными суждениями: этот человек тревожный, а этот - нет, этот более сообразителен, чем другой, и т.д.
В научном исследовании нам исключительно важно отдавать себе отчет в том, что точность, с которой признак отражает измеряемое свойство, зависит от процедуры измерения.
Пример. Мы можем разделить всех наших испытуемых на две группы по сообразительности: сообразительные и не очень. И далее приписать каждому испытуемому символ (например, 1 и 0) в зависимости от его принадлежности к той или другой группе мы можем упорядочить всех испытуемых по степени выраженности сообразительности, приписывая каждому его ранг, от самого сообразительного (1 ранг), самого сообразительного из оставшихся (2 ранг) и т. д. до последнего испытуемого. В каком из этих двух случаев измеренный признак будет точнее отражать различия между испытуемыми по измеряемому свойству, догадаться нетрудно.
В зависимости от того, какая операция лежит в основе измерения признака, выделяют так называемые измерительные шкалы. Они еще называются шкалами С. Стивенса, по имени ученого-психолога, который их предложил. Эти шкалы устанавливают определенные соотношения между свойствами чисел и измеряемым свойством объектов. Шкалы разделяют на метрические (если есть или может быть установлена единица измерения) и неметрические (если единицы измерения не могут быть установлены).
ОСНОВНЫЕ ПОНЯТИЯ, ИСПОЛЬЗУЕМЫЕ В МАТЕМАТИЧЕСКОЙ ОБРАБОТКЕ ПСИХОЛОГИЧЕСКИХ ДАННЫХ
1.1. Признаки и переменные
Признаки и переменные - это измеряемые психологические явления. Такими
явлениями могут быть время решения задачи, количество допущенных ошибок, уровень
тревожности, показатель интеллектуальной лабильности, интенсивность агрессивных
реакций, угол поворота корпуса в беседе, показатель социометрического статуса и
множество других переменных.
Понятия признака и переменной могут использоваться как взаимозаменяемые. Они
являются наиболее общими. Иногда вместо них используются понятия показателя или
уровня, например, уровень настойчивости, показатель вербального интеллекта и др.
Понятия показателя и уровня указывают на то, что признак может быть измерен коли-
чественно, так как к ним применимы определения "высокий" или "низкий", например,
высокий уровень интеллекта, низкие показатели тревожности и др.
Психологические переменные являются случайными величинами, поскольку заранее
неизвестно, какое именно значение они примут.
Математическая обработка - это оперирование со значениями признака,
полученными у испытуемых в психологическом исследовании. Такие индивидуальные
результаты называют также "наблюдениями", "наблюдаемыми значениями",
"вариантами", "датами", "индивидуальными показателями" и др. В психологии чаще всего
используются термины "наблюдение" или "наблюдаемое значение".
Значения признака определяются при помощи специальных шкал измерения.
1.2. Шкалы измерения
Измерение - это приписывание числовых форм объектам или событиям в
соответствии с определенными правилами (Стивене С, 1960, с.60). С.Стивенсом
предложена классификация из 4 типов шкал измерения:
1) номинативная, или номинальная, или шкала наименований;
2) порядковая, или ординальная, шкала;
3) интервальная, или шкала равных интервалов;
4) шкала равных отношений.
Номинативная шкала - это шкала, классифицирующая по названию: потеп (лат.) -
имя, название. Название же не измеряется количественно, оно лишь позволяет отличить
один объект от другого или одного субъекта от другого. Номинативная шкала - это способ
классификации объектов или субъектов, распределения их по ячейкам классификации.
Простейший случай номинативной шкалы - дихотомическая шкала, состоящая всего
лишь из двух ячеек, например: "имеет братьев и сестер - единственный ребенок в семье";
"иностранец - соотечественник"; "проголосовал "за" - проголосовал "против"" и т.п.
Признак, который измеряется по дихотомической шкале наименований, называется
альтернативным. Он может принимать всего два значения. При этом исследователь
зачастую заинтересован в одном из них, и тогда он говорит, что признак “проявился”,
если тот принял интересующее его значение, и что признак “не проявился” , если он при-
нял противоположное значение. Например: "Признак леворукости проявился у 8
испытуемых из 20". В принципе номинативная шкала может состоять из ячеек "признак
проявился - признак не проявился.
Более сложный вариант номинативной шкалы - классификация из трех и более
ячеек, например: "экстрапунитивные - интрапунитивные -импунитивные реакции" или
"выбор кандидатуры А - кандидатуры Б -кандидатуры В - кандидатуры Г" или "старший -
средний - младший -единственный ребенок в семье" и др.
Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам
классификации, мы получаем возможность от наименований перейти к числам, подсчитав
количество наблюдений в каждой из ячеек.
Как уже указывалось, наблюдение - это одна зарегистрированная реакция, один
совершенный выбор, одно осуществленное действие или результат одного испытуемого.
Допустим, мы определим, что кандидатуру А выбрали 7 испытуемых, кандидатуру Б
11, кандидатуру В - 28, а кандидатуру Г -всего 1. Теперь мы можем оперировать этими
числами, представляющими собой частоты встречаемости разных наименований, то есть
частоты принятия признаком "выбор" каждого из 4 возможных значений. Далее мы можем
сопоставить полученное распределение частот с равномерным или каким-то иным
распределением.
Таким образом, номинативная шкала позволяет нам подсчитывать частоты
встречаемости разных "наименований", или значений признака, и затем работать с этими
частотами с помощью математических методов.
Единица измерения, которой мы при этом оперируем - количество наблюдений
(испытуемых, реакций, выборов и т. п.), или частота. Точнее, единица измерения - это
одно наблюдение. Такие данные могут быть обработаны с помощью метода ·2,
биномиального критерия m и углового преобразования Фишера ·*.
Порядковая шкала - это шкала, классифицирующая по принципу "больше -
меньше". Если в шкале наименований было безразлично, в каком порядке мы расположим
классификационные ячейки, то в порядковой шкале они образуют последовательность от
ячейки "самое малое значение" к ячейке "самое большое значение" (или наоборот).
Ячейки теперь уместнее называть классами, поскольку по отношению к классам
употребимы определения "низкий", "средний" и "высокий" класс, или 1-й, 2-й, 3-й класс, и
т.д.
В порядковой шкале должно быть не менее трех классов, например "положительная
реакция - нейтральная реакция - отрицательная реакция" или "подходит для занятия
вакантной должности - подходит с оговорками - не подходит" и т. п.
В порядковой шкале мы не знаем истинного расстояния между классами, а знаем
лишь, что они образуют последовательность. Например, классы "подходит для занятия
вакантной должности" и "подходит с оговорками" могут быть реально ближе друг к другу,
чем класс "подходит с оговорками" к классу "не подходит".
От классов легко перейти к числам, если мы условимся считать, что низший класс
получает ранг 1, средний класс - ранг 2, а высший класс - ранг 3, или наоборот. Чем
больше классов в шкале, тем больше у нас возможностей для математической обработки
полученных данных и проверки статистических гипотез.
Например, мы можем оценить различия между двумя выборками испытуемых по
преобладанию у них более высоких или более низких рангов или подсчитать коэффициент
ранговой корреляции между двумя переменными, измеренными в порядковой шкале,
допустим, между оценками профессиональной компетентности руководителя, данными
ему разными экспертами.
Все психологические методы, использующие ранжирование, построены на
применении шкалы порядка. Если испытуемому предлагается упорядочить 18 ценностей
по степени их значимости для него, проранжировать список личностных качеств
социального работника или 10 претендентов на эту должность по степени их
профессиональной пригодности, то во всех этих случаях испытуемый совершает так
называемое принудительное ранжирование, при котором количество рангов соответствует
количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.).
Независимо от того, приписываем ли мы каждому качеству или испытуемому один
из 3-4 рангов или совершаем процедуру принудительного ранжирования, мы получаем в
обоих случаях ряды значений, измеренные по порядковой шкале. Правда, если у нас всего
3 возможных класса и, следовательно, 3 ранга, и при этом, скажем, 20 ранжируемых
испытуемых, то некоторые из них неизбежно получат одинаковые ранги. Все
многообразие жизни не может уместиться в 3 градации, поэтому в один и тот же класс
могут попасть люди, достаточно серьезно различающиеся между собой. С другой
стороны, принудительное ранжирование, то есть образование последовательности из
многих испытуемых, может искусственно преувеличивать различия между людьми.
Кроме того, данные, полученные в разных группах, могут оказаться несопоставимыми,
так как группы могут изначально различаться по уровню развития исследуемого качества,
и испытуемый, получивший в одной группе высший ранг, в другой получил бы всего
лишь средний, и т.п.
Выход из положения может быть найден, если задавать достаточно дробную
классификационную систему, скажем, из 10 классов, или градаций, признака. В сущности,
подавляющее большинство психологических методик, использующих экспертную оценку,
построено на измерении одним и тем же "аршином" из 10, 20 или даже 100 градаций
разных испытуемых в разных выборках.
Итак, единица измерения в шкале порядка - расстояние в 1 класс или в 1 ранг, при
этом расстояние между классами и рангами может быть разным (оно нам неизвестно). К
данным, полученным по порядковой шкале, применимы все описанные в данной книге
критерии и методы.
Интервальная шкала - это шкала, классифицирующая по принципу "больше на
определенное количество единиц - меньше на определенное количество единиц". Каждое
из возможных значений признака отстоит от другого на равном расстоянии.
Можно предположить, что если мы измеряем время решения задачи в секундах, то
это уже явно шкала интервалов. Однако на самом деле это не так, поскольку
психологически различие в 20 секунд между испытуемым А и Б может быть отнюдь не
равно различию в 20 секунд между испытуемыми Б и Г, если испытуемый А решил задачу
за 2 секунды, Б - за 22, В - за 222, а Г - за 242.
Аналогичным образом, каждая секунда после истечения полутора минут в опыте с
измерением мышечного волевого усилия на динамометре с подвижной стрелкой, по
"цене", может быть, равна 10 или даже более секундам в первые полминуты опыта. "Одна
секунда за год идет" - так сформулировал это однажды один испытуемый.
Попытки измерять психологические явления в физических единицах - волю в
секундах, способности в сантиметрах, а ощущение собственной недостаточности - в
миллиметрах и т. п., конечно, понятны, ведь все-таки это измерения в единицах
"объективно" существующего времени и пространства. Однако ни один опытный
исследователь при этом не обольщает себя мыслью, что он совершает измерения по
психологической интервальной шкале. Эти измерения принадлежат по-прежнему к шкале
порядка, нравится нам это или нет (Стивене С, 1960, с.56; Паповян С.С., 1983, с.63;
Михеев В.И.: 1986, с.28).
Мы можем с определенной долей уверенности утверждать лишь, что испытуемый А
решил задачу быстрее Б, Б быстрее В, а В быстрее Г.
Аналогичным образом, значения, полученные испытуемыми в баллах по любой
нестандартизованной методике, оказываются измеренными лишь по шкале порядка. На
самом деле равноинтервальными можно считать лишь шкалы в единицах стандартного
отклонения и про-центильные шкалы, и то лишь при условии, что распределение значений
в стандартизующей выборке было нормальным (Бурлачук Л. Ф., Морозов С. М., 1989, с.
163, с. 101).
Принцип построения большинства интервальных шкал построен на известном
правиле "трех сигм": примерно 97,7-97,8% всех значений признака при нормальном его
распределении укладываются в диапазоне М±3·2 Можно построить шкалу в единицах
долей стандартного отклонения, которая будет охватывать весь возможный диапазон
изменения признака, если крайний слева и крайний справа интервалы оставить
открытыми.
Р.Б. Кеттелл предложил, например, шкалу стенов - "стандартной десятки". Среднее
арифметическое значение в "сырых" баллах принимается за точку отсчета. Вправо и влево
отмеряются интервалы, равные 1/2 стандартного отклонения. На Рис. 1.2 представлена
схема вычисления стандартных оценок и перевода "сырых" баллов в стены по шкале N 16-
факторного личностного опросника Р. Б. Кеттелла.
Справа
Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, причем
последний из этих интервалов открыт. Слева от среднего значения будут располагаться интервалы, равные
5, 4, 3, 2 и 1 стенам, и крайний интервал также открыт. Теперь мы поднимаемся вверх, к оси "сырых
баллов", и размечаем границы интервалов в единицах "сырых" баллов. Поскольку М=10,2; ·=2,4, вправо мы
откладываем 1/2·, т.е. 1,2 "сырых" балла. Таким образом, граница интервала составит: (10,2 + 1,2) = 11,4
"сырых" балла. Итак, границы интервала, соответствующего 6 стенам, будут простираться от 10,2 до 11,4
баллов. В сущности, в него попадает только одно "сырое" значение - 11 баллов. Влево от средней мы
откладываем 1/2 · и получаем границу интервала: 10,2-1,2=9. Таким образом, границы интервала,
соответствующие 9 стенам, простираются от 9 до 10,2. В этот интервал попадают уже два "сырых" значения
9 и 10. Если испытуемый получил 9 "сырых" баллов, ему начисляется теперь 5 стенов; если он получил 11
"сырых" баллов - 6 стенов, и т. д.
Мы видим, что в шкале стенов иногда за разное количество "сырых" баллов будет начисляться
одинаковое количество стенов. Например, за 16, 17, 18, 19 и 20 баллов будет начисляться 10 стенов, а за 14 и
15 - 9 стенов и т. д.
В принципе,шкалу стенов можно построить по любым данным, измеренным по крайней мере в
2 Определения и формулы расчета М и СТ даны в параграфе "Распределение признака. Параметры распределения".
порядковой шкале, при объеме выборки п>200 и нормальном распределении признака3.
Другой способ построения равноинтервальной шкалы - группировка интервалов по принципу
равенства накопленных частот. При нормальном распределении признака в окрестности среднего значения
группируе·ся большая часть всех наблюдений, поэтому в этой области среднего значения интервалы
оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются, (см. Рис. 1.2).
Следовательно, такая процентильная шкала является равноинтервальной только относительно накопленной
частоты (Мельников В.М., Ямпольский Л.Т., 1985, с. 194).
Построение шкал равных интервалов по данным, полученным по шкале порядка,
напоминает трюк с веревочной лестницей, на который ссылался С. Стивене. Мы сначала
поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы,
которая закреплена. Однако каким путем мы оказались на ней? Измерили некую психо-
логическую переменную по шкале порядка, подсчитали средние и стандартные
отклонения, а затем получили, наконец, интервальную шкалу. "Такому нелегальному
использованию статистики может быть дано известное прагматическое оправдание; во
многих случаях оно приводит к плодотворным результатам" (Стивене С, 1960, с. 56).
Многие исследователи не проверяют степень совпадения полученного ими
эмпирического распределения с нормальным распределением, и тем более не переводят
получаемые значения в единицы долей стандартного отклонения или процентили,
предпочитая пользоваться "сырыми" данными. "Сырые" же данные часто дают
скошенное, срезанное по краям или двухвершинное распределение. На Рис. 1.3
представлено распределение показателя мышечного волевого усилия на выборке из 102
испытуемых. Распределение с удовлетворительной точностью можно считать
нормальным (·2=12,7, при v=9, M=89,75, ·= 25,1).
На Рис . 1.4 представлено распределение показателя самооценки по шкале методики
Дж . Менестера - Р . Корзини " Уровень успеха , которого я должен был достичь уже сейчас "
(n=356). Распределение значимо отличается от нормального (· 2 =58,8, при v=7; p< 0,01;
М =80,64; · =16,86).
С такими "ненормальными" распределениями приходится встречаться очень часто,
чаще, может быть, чем с классическими нормальными. И дело здесь не в каком-то изъяне,
а в самой специфике психологических признаков. По некоторым методикам от 10 до 20%
испытуемых получают оценку "ноль" - например, в их рассказах не встречается ни одной
словесной формулировки, которая отражала бы мотив "надежда на успех" или "боязнь
неудачи" (методика Хекхаузена). То, что испытуемый получил оценку "ноль", нормально,
но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали
объем выборки (см. п. 5.3).
Методы статистической обработки, предлагаемые в настоящем руководстве, в
большинстве своем не требуют проверки совпадения полученного эмпирического
распределения с нормальным. Они построены на подсчете частот и ранжировании.
Проверка необходима только в случае применения дисперсионного анализа. Именно
поэтому соответствующая глава сопровождается описанием процедуры подсчета необхо-
димых критериев.
Во всех остальных случаях нет необходимости проверять степень совпадения
полученного эмпирического распределения с нормальным, и тем более стремиться
преобразовать порядковую шкалу в равноинтервальную. В каких бы единицах ни были
измерены переменные - в секундах, миллиметрах, градусах, количестве выборов и т. п. -
все эти данные могут быть обработаны с помощь непараметрических критериев4,
составляющих основу данного руководства.
Шкала равных отношений - это шкала, классифицирующая объекты или субъектов
пропорционально степени выраженности измеряемого свойства. В шкалах отношений
классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4,
как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета. В физике
абсолютная нулевая точка отсчета встречается при измерении длин отрезков или
физических объектов и при измерении температуры по шкале Кельвина с абсолютным
нулем температур. Считается, что в психологии примерами шкал равных отношений
являются шкалы порогов абсолютной чувствительности (Стивене С, 1960; Гайда В. К.,
Захаров В. П., 1982). Возможности человеческой психики столь велики, что трудно
представить себе абсолютный нуль в какой-либо измеряемой психологической
переменной. Абсолютная глупость и абсолютная честность - понятия скорее житейской
психологии.
То же относится и к установлению равных отношений: только метафора обыденной
речи допускает, чтобы Иванов был в 2 раза (3, 100, 1000) умнее Петрова или наоборот.
Абсолютный нуль, правда, может иметь место при подсчете количества объектов
или субъектов. Например, при выборе одной из 3 альтернатив испытуемые не выбрали
альтернативу А ни одного раза, альтернативу Б - 14 раз и альтернативу В - 28 раз. В этом
случае мы можем утверждать, что альтернативу В выбирают в два раза чаще, чем
альтернативу Б. Однако при этом измерено не психологическое свойство человека, а
соотношение выборов у 42 человек.
4 Определение и описание непараметрических критериев дано ниже в данной главе.
По отношению к показателям частот возможно применять все арифметические
операции: сложение, вычитание, деление и умножение. Единица измерения в этой шкале
отношений - 1 наблюдение, 1 выбор, 1 реакция и т. п. Мы вернулись к тому, с чего начали:
к универсальной шкале измерения в частотах встречаемости того или иного значения
признака и к единице измерения, которая представляет собой 1 наблюдение.
Расклассифицировав испытуемых по ячейкам номинативной шкалы, мы можем применить
потом высшую шкалу измерения - шкалу отношений между частотами.
1.3. Распределение признака. Параметры распределения
Распределением признака называется закономерность встречаемости разных его
значений (Плохинский Н.А., 1970, с. 12).
В психологических исследованиях чаще всего ссылаются на нормальное
распределение.
Нормальное распределение характеризуется тем, что крайние значения признака в
нем встречаются достаточно редко, а значения, близкие к средней величине - достаточно
часто. Нормальным такое распределение называется потому, что оно очень часто
встречалось в естественнонаучных исследованиях и казалось "нормой" всякого массового
случайного проявления признаков. Это распределение следует закону, открытому тремя
учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и
Лапласом в 1812 г. во Франции (Плохинский Н.А., 1970, с.17). График нормального
распределения представляет собой привычную глазу психолога-исследователя так на-
зываемую колоколообразную кривую (см. напр., Рис. 1.1, 1.2).
Параметры распределения - это его числовые характеристики, указывающие, где "в
среднем" располагаются значения признака, насколько эти значения изменчивы и
наблюдается ли преимущественное появление определенных значений признака.
Наиболее практически важными параметрами являются математическое ожидание,
дисперсия, показатели асимметрии и эксцесса.
В реальных психологических исследованиях мы оперируем не параметрами, а их
приближенными значениями, так называемыми оценками параметров. Это объясняется
ограниченностью обследованных выборок. Чем больше выборка, тем ближе может быть
оценка параметра к его истинному значению. В дальнейшем, говоря о параметрах, мы
будем иметь в виду их оценки.
Среднее арифметическое (оценка математического ожидания) вычисляется по
формуле:
i - индекс, указывающий на порядковый номер данного значения признака;
п - количество наблюдений;
·- знак суммирования.
Оценка дисперсии определяется по формуле:
где xi - каждое наблюдаемое значение признака;
x - среднее арифметическое значение признака;
n - количество наблюдений.
Величина, представляющая собой квадратный корень из несмещенной оценки
дисперсии (S), называется стандартным отклонением или средним квадратическим
отклонением. Для большинства исследователей привычно обозначать эту величину
греческой буквой · (сигма), а не S. На самом деле, · - это стандартное отклонение в
генеральной совокупности, a S - несмещенная оценка этого параметра в исследованной
выборке. Но, поскольку S - лучшая оценка · (Fisher R.A., 1938), эту оценку стали часто
обозначать уже не как S, а как ·:
В тех случаях, когда какие-нибудь причины благоприятствуют более частому
появлению значений, которые выше или, наоборот, ниже среднего, образуются
асимметричные распределения. При левосторонней, или положительной, асимметрии в
распределении чаще встречаются более низкие значения признака, а при правосторонней,
или отрицательной - более высокие (см. Рис. 1.5).
Показатель асимметрии (A) вычисляется по формуле:
В тех случаях, когда какие-либо причины способствуют преимущественному
появлению средних или близких к средним значений, образуется распределение с
положительным эксцессом. Если же в распределении преобладают крайние значения,
причем одновременно и более низкие, и более высокие, то такое распределение
характеризуется отрицательным эксцессом и в центре распределения может образоваться
впадина, превращающая его в двувершинное (см. Рис. 1.6).
Показатель эксцесса (E) определяется по формуле:
Рис. 1.6. Эксцесс: а) положительный; 6) отрицательный
В распределениях с нормальной выпуклостью E=0.
Параметры распределения оказывается возможным определить только по
отношению к данным, представленным по крайней мере в интервальной шкале. Как мы
убедились ранее, физические шкалы длин, времени, углов являются интервальными
шкалами, и поэтому к ним применимы способы расчета оценок параметров, по крайней
мере, с формальной точки зрения. Параметры распределения не учитывают истинной
психологической неравномерности секунд, миллиметров и других физических единиц
измерения.
На практике психолог-исследователь может рассчитывать параметры любого
распределения, если единицы, которые он использовал при измерении, признаются
разумными в научном сообществе.
1.4. Статистические гипотезы
Формулирование гипотез систематизирует предположения исследователя и
представляет их в четком и лаконичном виде. Благодаря гипотезам исследователь не
теряет путеводной нити в процессе расчетов и ему легко понять после их окончания, что,
собственно, он обнаружил.
Статистические гипотезы подразделяются на нулевые и альтернативные,
направленные и ненаправленные.
Нулевая гипотеза - это гипотеза об отсутствии различий. Она обозначается как
H0 И называется нулевой потому, что содержит число 0: X1-
Х2=0, где X1, X2 - сопоставляемые значения признаков.
Нулевая гипотеза - это то, что мы хотим опровергнуть, если
перед нами стоит задача доказать значимость различий.
Альтернативная гипотеза - это гипотеза о значимости различий. Она обозначается как
H1. Альтернативная гипотеза - это то, что мы хотим до-
казать, поэтому иногда ее называют экспериментальной
гипотезой.
Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть
подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные
испытуемые получают хотя и различные, но уравновешенные по трудности задания, или
что экспериментальная и контрольная выборки не различаются между собой по каким-то
значимым характеристикам. Однако чаще нам все-таки требуется доказать значимость
различий, ибо они более информативны для нас в поиске нового. Нулевая и
альтернативная гипотезы могут быть направленными и ненаправленными.
Направленные гипотезы
H0: X1 не превышает Х2
H1: X1 превышает Х2
Ненаправленные гипотезы
H0: X1 не отличается от Х2
Н1: Х1 отличается от Х2
Если вы заметили, что в одной из групп индивидуальные значения испытуемых по
какому-либо признаку, например по социальной смелости, выше, а в другой ниже, то для
проверки значимости этих различий нам необходимо сформулировать направленные
гипотезы.
Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных
воздействий произошли более выраженные изменения, чем в группе Б, то нам тоже
необходимо сформулировать направленные гипотезы.
Если же мы хотим доказать, что различаются формы распределения признака в
группе А и Б, то формулируются ненаправленные гипотезы.
При описании каждого критерия в руководстве даны формулировки гипотез,
которые он помогает нам проверить.
Построим схему - классификацию статистических гипотез.
Проверка гипотез осуществляется с помощью критериев статистической оценки
различий.
1.5. Статистические критерии
Статистический критерий - это решающее правило, обеспечивающее надежное
поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой
вероятностью (Суходольский Г.В., 1972, с. 291).
Статистические критерии обозначают также метод расчета определенного числа и
само это число.
Когда мы говорим, что достоверность различий определялась по критерию ·2, то
имеем в виду, что использовали метод ·2 - для расчета определенного числа.
рассчитанное по методу ·2. Это число обозначается как эмпирическое значение критерия.
По соотношению эмпирического и критичOского значений критерия мы можем
судить о том, подтверждается ли или опровергается нулевая гипотеза. Например, если
эмп> ·2
кр, H0 отвергается.
В большинстве случаев для того, чтобы мы признали различия значимыми,
необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть
критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны
придерживаться противоположного правила.
Эти правила оговариваются в описании каждого из представленных в руководстве
критериев.
В некоторых случаях расчетная формула критерия включает в себя количество
наблюдений в исследуемой выборке, обозначаемое как п. В этом случае эмпирическое
значение критерия одновременно является тестом для проверки статистических гипотез.
По специальной таблице мы определяем, какому уровню статистической значимости
различий соответствует данная эмпирическая величина. Примером такого критерия
является критерий ·*, вычисляемый на основе углового преобразования Шишера.
В большинстве случаев, однако, одно и то же эмпирическое значение критерия
может оказаться значимым или незначимым в зависимости от количества наблюдений в
исследуемой выборке (n) или от так называемого количества степеней свободы, которое
обозначается как v или как df.
Число степеней свободы v равно числу классов вариационного ряда минус число
условий, при которых он был сформирован (Ивантер Э.В., Коросов А.В., 1992, с. 56). К
числу таких условий относятся объем выборки (n), средние и дисперсии.
Если мы расклассифицировали наблюдения по классам какой-либо номинативной
шкалы и подсчитали количество наблюдений в каждой ячейке классификации, то мы
получаем так называемый частотный вариационный ряд. Единственное условие, которое
соблюдается при его формировании - объем выборки п. Допустим, у нас 3 класса: "Умеет
работать на компьютере - умеет выполнять лишь определенные операции - не умеет
работать на компьютере". Выборка состоит из 50 человек. Если в первый класс отнесены
20 испытуемых, во второй - тоже 20, то в третьем классе должны оказаться все остальные
10 испытуемых. Мы ограничены одним условием - объемом выборки. Поэтому даже если
мы потеряли данные о том, сколько человек не умеют работать на компьютере, мы можем
определить это, зная, что в первом и втором классах - по 20 испытуемых. Мы не свободны
в определении количества испытуемых в третьем разряде, "свобода" простирается только
на первые две ячейки классификации:
v= c-l = 3-1 = 2
Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы
были бы свободны только в 9 из них, если бы у нас было 100 классов - то в 99 из них и т.
Способы более сложного подсчета числа степеней свободы при двухмерных
классификациях приведены в разделах, посвященных критерию ·2 и дисперсионному
анализу.
Зная n и/или число степеней свободы, мы по специальным таблицам можем
определить критические значения критерия и сопоставить с ними полученное
эмпирическое значение. Обычно это записывается так: "при n=22 критические значения
критерия составляют..." или "при v=2 критические значения критерия составляют..." и
т.п.
Критерии делятся на параметрические и непараметрические.
Параметрические критерии
Критерии, включающие в формулу расчета параметры распределения, то есть
средние и дисперсии (t - критерий Стьюдента, критерий F и др.)
Непараметрические критерии
Критерии, не включающие в формулу расчета параметров распределения и
основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т
Вилкоксона и др.)
И те, и другие критерии имеют свои преимущества и недостатки. На основании
нескольких руководств можно составить таблицу, позволяющую оценить возможности и
ограничения тех и других (Рунион Р., 1982; McCall R., 1970; J.Greene, M.D"Olivera, 1989).
Таблица 1.1
Возможности и ограничения параметрических и непараметрических критериев
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ НЕПАРАМЕТРИЧЕСКИЕ
КРИТЕРИИ
1. Позволяют прямо оценить различи* в
средних, полученных в двух выборках (t -
критерий Стьюдента).
Позволяют оценить лишь средние
тенденции, например, ответить на
вопрос, чаще ли в выборке А
встречаются более высокие, а в выборке
Б - более низкие значения признака
(критерии Q, U, ·* и др.).
2. Позволяют прямо оценить различия в
дисперсиях (критерий Фишера).
Позволяют оценить лишь различия в
диапазонах вариативности признака
(критерий ·*).
3. Позволяют выявить тенденции изме-
нения признака при переходе от условия
к условию (дисперсионный
однофакторный анализ), но лишь при
условии нормального распределения
признака.
Позволяют выявить тенденции
изменения признака при переходе от
условия к условию при любом
распределении признака (критерии
тенденций L и S).
4. Позволяют оценить взаимодействие
двух и более факторов в их влиянии на
изменения признака (двухфакторный
дисперсионный анализ).
Эта возможность отсутствует.
5. Экспериментальные данные должны
отвечать двум, а иногда трем, условиям:
а) значения признака измерены по
интервальной шкале; б) распределение
признака является нормальным; в) в
дисперсионном анализе должно
соблюдаться требование равенства
дисперсий в ячейках комплекса.
Экспериментальные данные могут не
отвечать ни одному из этих условий: а)
значения признака могут быть пред-
ставлены в любой шкале, начиная от
шкалы наименований; б) распределение
признака может быть любым и
совпадение его с каким-либо
теоретическим законом распределения
необязательно и не нуждается в
проверке; в) требование равенства
дисперсий отсутствует.
6. Математические расчеты довольно
сложны.
Математические расчеты по большей
части просты и занимают мало времени
(за исключением критериев ·2 и ·).
7. Если условия, перечисленные в п.5,
выполняются, параметрические критерии
оказываются несколько более мощными,
чем непараметрические.
Если условия, перечисленные в п.5, не
выполняются, непараметрические
критерии оказываются более мощными,
чем параметрические, так как они менее
чувствительны к "засорениям".
Из Табл. 1.1 мы видим, что параметрические критерии могут оказаться несколько
более мощными5, чем непараметрические, но только в том случае, если признак измерен
по интервальной шкале и нормально распределен. С интервальной шкалой есть
определенные проблемы (см. раздел "Шкалы измерения"). Лишь с некоторой натяжкой
интервальные. Кроме того, проверка распределения "на нормальность" требует
достаточно сложных расчетов, результат которых заранее неизвестен (см. параграф 7.2).
Может оказаться, что распределение признака отличается от нормального, и нам так или
иначе все равно придется обратиться к непараметрическим критериям.
Непараметрические критерии лишены всех этих ограничений и нетребуют таких
длительных и сложных расчетов. По сравнению с параметрическими критериями они
ограничены лишь в одном - с их помощью невозможно оценить взаимодействие двух или
более условий или факторов, влияющих на изменение признака. Эту задачу может решить
только дисперсионный двухфакторный анализ.
Учитывая это, в настоящее руководство включены в основном непараметрические
статистические критерии. В сумме они охватывают большую часть возможных задач
сопоставления данных.
Единственный параметрический метод, включенный в руководство - метод
дисперсионного анализа, двухфакторный вариант которого ничем невозможно заменить.
1.6. Уровни статистической значимости
Уровень значимости - это вероятность того, что мы сочли различия существенными,
а они на самом деле случайны.
Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или
при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны,
составляет 0,05.
Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или
при р<0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны,
составляет 0,01.
Если перевести все это на более формализованный язык, то уровень значимости - это
вероятность отклонения нулевой гипотезы, в то время как она верна.
Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как
5 О понятии мощности критерия см. ниже.
она верна, называется ошибкой 1 рода.
Вероятность такой ошибки обычно обозначается как·. В сущности, мы должны
были бы указывать в скобках не р·0,05 или р·0,01, а ··0,05 или ··0,01. В некоторых
руководствах так и делается (Рунион Р., 1982; Захаров В.П., 1985 и др.).
Если вероятность ошибки - это ·, то вероятность правильного решения: 1 - ·. Чем
меньше ·, тем больше вероятность правильного решения.
Исторически сложилось так, что в психологии принято считать низшим уровнем
статистической значимости 5%-ый уровень (р<0,05): достаточным - 1%-ый уровень
(р<0,01) и высшим 0,1%-ый уровень (р<0,001), поэтому в таблицах критических значений
обычно приводятся значения критериев, соответствующих уровням статистической зна-
чимости р<0,05 и р<0,01, иногда - р<0,001. Для некоторых критериев в таблицах указан
точный уровень значимости их разных эмпирических значений. Например, для ·*=1,56
р=0,06.
До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05,
мы еще не имеем права отклонить нулевую гипотезу. В настоящем руководстве мы, вслед
за Р. Рунионом (1982), будем придерживаться следующего правила отклонения гипотезы
об отсутствии различий (H0) И принятия гипотезы о статистической достоверности
различий (Н1).
Правило отклонения H0 И принятия H1
Если эмпирическое значение критерия равняется критическому значению,
соответствующему р<0,05 или превышает его, то H0 отклоняется, но мы еще не можем
определенно принять H1. Если эмпирическое значение критерия равняется критическому
значению, соответствующему р<0,01 или превышает его, то H0 отклоняется и
принимается H1.
Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-
Уитни. Для них устанавливаются обратные соотношения.
Для облегчения процесса принятия решения можно всякий раз вычерчивать "ось
значимости".
Критические значения критерия обозначены как Q0,05 и Q0,01, эмпирическое значение
критерия как Qэмп. Оно заключено в эллипс.
Вправо от критического значения Q0,01 простирается "зона значимости" - сюда
попадают эмпирические значения, превышающие Q0,01 и, следовательно, безусловно
значимые.
Влево от критического значения Q0,05 простирается "зона незначимости", - сюда
попадают эмпирические значения Q, которые ниже Q0,05, и, следовательно, безусловно
незначимы.
Мы видим, что Q0,05=6; Q0,01=9; Qэмп
Эмпирическое значение критерия попадает в область между Q0,05 и Q0,01- Это зона
"неопределенности": мы уже можем отклонить гипотезу о недостоверности различий (H0),
НО еще не можем принять гипотезы об их достоверности (H1).
Практически, однако, исследователь может считать достоверными уже те различия,
которые не попадают в зону незначимости, заявив, что они достоверны при р<0,05, или
указав точный уровень значимости полученного эмпирического значения критерия,
например: р=0,02. С помощью таблиц Приложения 1 это можно сделать по отношению к
критериям Н Крускала-Уоллиса, ·2, Фридмана, L Пейджа, ·* Фишера, А, Колмогорова.
Уровень статистической значимости или критические значения критериев
определяются по-разному при проверке направленных и ненаправленных статистических
гипотез.
При направленной статистической гипотезе используется односторонний критерий,
при ненаправленной гипотезе - двусторонний критерий. Двусторонний критерий более
строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое
значение критерия, которое ранее соответствовало уровню значимости р<0,05, теперь
соответствует лишь уровню р<0,10.
В данном руководстве исследователю не придется всякий раз самостоятельно
решать, использует ли он односторонний или двухсторонний критерий. Таблицы
критических значений критериев подобраны таким образом, что направленным гипотезам
соответствует односторонний, а ненаправленным - двусторонний критерий, и
приведенные значения удовлетворяют тем требованиям, которые предъявляются к
каждому из них. Исследователю необходимо лишь следить за тем, чтобы его гипотезы
совпадали по смыслу и по форме с гипотезами, предлагаемыми в описании каждого из
критериев.
1.7. Мощность критериев
Мощность критерия - это его способность выявлять различия, если они есть. Иными
словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если
она неверна.
Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как
она неверна, называется ошибкой II рода.
Вероятность такой ошибки обозначается как ·. Мощность критерия - это его
способность не допустить ошибку II рода, поэтому:
Мощность=1-·
Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут
быть решены с помощью разных критериев, при этом обнаруживается, что некоторые
критерии позволяют выявить различия там, где другие оказываются неспособными это
сделать, или выявляют более высокий уровень значимости различий. Возникает вопрос: а
зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для
выбора критерия может быть не только мощность, но и другие его характеристики, а
именно:
а) простота;
б) более широкий диапазон использования (например, по отношению к данным,
определенным по номинативной шкале, или по отношению к большим n);
в) применимость по отношению к неравным по объему выборкам;
г) большая информативность результатов.
1.8. Классификация задач и методов их решения
Множество задач психологического исследования предполагает те или иные
сопоставления. Мы сопоставляем группы испытуемых по какому-либо признаку, чтобы
выявить различия между ними по этому признаку. Мы сопоставляем то, что было "до" с
тем, что стало "после" наших экспериментальных или любых иных воздействий, чтобы
определить эффективность этих воздействий. Мы сопоставляем эмпирическое
распределение значений признака с каким-либо теоретическим законом распределения
или два эмпирических распределения между собой, с тем, чтобы доказать неслучайность
выбора альтернатив или различия в форме распределений.
выборке испытуемых, для того, чтобы установить степень согласованности их изменений,
их сопряженность, корреляцию между ними.
Наконец, мы можем сопоставлять индивидуальные значения, полученные при
разных комбинациях каких-либо существенных условий, с тем чтобы выявить характер
взаимодействия этих условий в их влиянии на индивидуальные значения признака.
Именно эти задачи позволяет решить тот набор методов, который предлагается
настоящим руководством. Все эти методы могут быть использованы при так называемой
"ручной" обработке данных.
Краткая классификация задач и методов дана в Таблице 1.2.
Таблица 1.2
Классификация задач и методов их решения
Задачи Условия Методы
1. Выявление различий в
уровне исследуемого
признака
а) 2 выборки испытуемых Q - критерий Розенбаума;
U - критерий Манна-Уитни;
Фишера)
б) 3 и более выборок
испытуемых
Н - критерий Крускала-Уоллиса.
2. Оценка сдвига зна-
чений исследуемого
признака
а) 2 замера на одной и той
же выборке испытуемых
Т - критерий Вилкоксона;
G - критерий знаков;
·* - критерий (угловое преобразование
Фишера).
б) 3 и более замеров на
одной и той же выборке
испытуемых
·л
2 - критерий Фридмана;
L - критерий тенденций Пейджа.
3. Выявление различий в
распределении
а) при сопоставлении
эмпирического признака
распределения с
теоретическим
·2 - критерий Пирсона;
m - биномиальный критерий.
б) при сопоставлении двух
эмпирических
распределений
·2 - критерий Пирсона;
· - критерий Колмогорова-Смирнова;
·* - критерий (угловое преобразование
Фишера).
4.Выявление степени
согласованности
изменений
а) двух признаков rs - коэффициент ранговой корреляции
Спирмена.
б) двух иерархий или
профилей
rs - коэффициент ранговой корреляции
Спирмена.
5. Анализ изменений
признака под влиянием
контролируемых
условий
а) под влиянием одного
фактора
S - критерий тенденций Джонкира;
L - критерий тенденций Пейджа;
однофакторный дисперсионный анализ
Фишера.
б) под влиянием двух
факторов одновременно
Двухфакторный дисперсионный анализ
Фишера.
1.9. Принятие решения о выборе метода математической обработки
Если данные уже получены, то вам предлагается следующий алгоритм определения
задачи и метода.
АЛГОРИТМ 1
Принятие решения о задаче и методе обработки на стадии, когда данные уже
получены
1. По первому столбцу Табл. 1.2 определить, какая из задач стоит в вашем
исследовании.
2. По второму столбцу Табл. 1.2 определить, каковы условия решения вашей задачи,
например, сколько выборок обследовано или на какое количество групп вы можете
разделить обследованную выборку.
3. Обратиться к соответствующей главе и по алгоритму принятия решения о выборе
критерия, приведенного в конце каждой главы, определить, какой именно метод или
критерий вам целесообразно использовать.
Если вы еще находитесь на стадии планирования исследования, то лучшее заранее
подобрать математическую модель, которую вы будете в дальнейшем использовать.
Особенно необходимо планирование в тех случаях, когда в перспективе предполагается
использование критериев тенденций или (в еще большей степени) дисперсионного
анализа. , В этом случае алгоритм принятия решения таков:
АЛГОРИТМ 2
Принятие решения о задаче и методе обработки на стадии планирования
исследования
1. Определите, какая модель вам кажется наиболее подходящей для доказательства]
ваших научных предположений.
2. Внимательно ознакомьтесь с описанием метода, примерами и задачами для
самостоятельного решения, которые к нему прилагаются.
3. Если вы убедились, что это то, что вам нужно, вернитесь к разделу "Ограничения
критерия" и решите, сможете ли вы собрать данные, которые будут отвечать этим
ограничениям (большие объемы выборок, наличие нескольких выборок, монотонно
различающихся по какому-либо признаку, например, по возрасту и т.п.).
4. Проводите исследование, а затем обрабатывайте полученные данные по заранее!
выбранному алгоритму, если вам удалось выполнить ограничения.
5. Если ограничения выполнить не удалось, обратитесь к алгоритму 1.
В описании каждого критерия сохраняется следующая последовательность
изложения:
Назначение критерия;
Описание критерия;
Гипотезы, которые он позволяет проверить;
Графическое представление критерия;
Ограничения критерия;
Пример или примеры.
Кроме того, для каждого критерия создан алгоритм расчетов. Если критерий сразу
удобнее рассчитывать по алгоритму, то он приводится в разделе "Пример"; если алгоритм
легче можно воспринять уже после рассмотрения примера, то он приводится в конце
параграфа, соответствующего данному критерию.
1.10. Список обозначений
Латинские обозначения:
А - показатель асимметрии распределения
с - количество групп или условий измерения
d - разность между рангами, частотами или частостями
df - число степеней свободы в дисперсионном анализе
Е - показатель эксцесса
F - критерий Фишера для сравнения дисперсий
f - частота
f* - частость, или относительная частота
G - критерий знаков
Н - критерий Крускала-Уоллиса
i - индекс, обозначающий порядковый номер наблюдения
j - индекс, обозначающий порядковый номер разряда, класса, группы
k - количество классов или разрядов признака
L - критерий тенденций Пейджа
М - среднее значение признака или средняя арифметическая; то же, что и х
m - биномиальный критерий
n - количество наблюдений (испытуемых, реакций, выборов и т.п.)
N - общее количество наблюдений в двух или более выборках
Р - вероятность того, что событие произойдет
р - вероятность ошибки 1 рода (то же, что и а), уровень статистической значимости
Q - 1) вероятность того, что событие не произойдет; 2) критерий Розенбаума
rs - коэффициент ранговой корреляции Спирмена
S - критерий Джонкира
S2 - оценка дисперсии
Si - количество значений, которые выше или ниже данного значения
SS - суммы квадратов (в дисперсионном анализе)
Т - критерий Вилкоксона
Тс - суммы рангов по столбцам
Тк - большая сумма рангов в критерии U
U - критерий Манна-Уитни
Wn - размах вариативности, или диапазон значений от наименьшего до
наибольшего
хi - текущее наблюдение; каждое наблюдение по порядку
x - среднее значение признака (то же, что и М)
Греческие обозначения:
· (альфа) - вероятность ошибки I рода (отклонения H0, которая верна)
· (бета) - вероятность ошибки II рода (принятия H0, которая неверна)
·, (ламбда) - критерий Колмогорова-Смирнова
v (ню) - число степеней свободы в непараметрических критериях
· (сигма) - стандартное отклонение
· (фи) - центральный угол, определяемый по процентной доле в
критерии ·*
·* (фи) - критерий Фишера с угловым преобразованием
·2 (хи-квадрат) - критерий Пирсона
r (хи-ар-квадрат) - критерий Фридмана.
Материал размещен на сайте HRM.RU
Материалы к курсу
«МАТЕМАТИЧЕСКИЕ МЕТ ОДЫ В ПСИХОЛОГИИ»
ЧАСТЬ 1
@Преподаватель: Голев Сергей Васильевич, адъюнкт-профессор психологии (доцент).
@Ассистент: Голева Ольга Сергеевна, магистр психологии
(ОМУРЧ «Украина» ХФ. – 2008 г.)
ИПИС ХГУ - 2008 г.)
В лекциях были использованы материалы следующих авторов:
Годфруа Ж. Что такое психология? М.: Мир, 1996. Т 2 . Куликов Л. В. Психологическое исследование: методические рекомендаций по проведению. - СПб., 1995. Немов Р.С. Психология: Экспериментальная педагогическая психология и психодиагностика. - М., 1999.- Т. 3. Практикум по общей экспериментальной психологии / Под ред. А.А. Крылова. - Л. ЛГУ, 1987. Сидоренко Е.В . Методы математической обработки в психологии. –СПб.: ООО «Речь», 2000. -350 с. Шевандрин Н.И. Психодиагностика, коррекция и развитие личности. - М.: Владос, 1998.-С.123. Суходольский Г.В. Математические методы в психологии. – Харьков: Изд-во Гуманитарный Центр, 2004. – 284 с.
Курс «Математические методы в психологии»
(Материалы для самостоятельного изучения студентами)
Лекция № 1
ВВЕДЕНИЕ В КУРС «МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ»
Вопросы:
1.Математика и психология
2.Методологические вопросы применения математики в психологии
3.Математическая психология
3.1.Введение
3.2.История развития
3.3.Психологические измерения
3.4.Нетрадиционные методы моделирования
4.Словарь по математическим методам в психологии
Вопрос 1. МАТЕМАТИКА И ПСИХОЛОГИЯ
Существует мнение, неоднократно высказывавшееся крупными учеными прошлого: область знания становится наукой, лишь применяя математику. С этим мнением, возможно, не согласятся многие гуманитарии. А зря: именно математика позволяет количественно сравнивать явления, проверять правильность словесных утверждений и тем самым добираться до истины либо приближаться к ней. Математика делает обозримыми длинные и подчас туманные словесные описания, проясняет и экономит мысль.
Математические методы позволяют обоснованно прогнозировать будущие события, вместо того, чтобы гадать на кофейной гуще или как-либо иначе. В общем, польза от применения математики велика, но и труда на ее освоение требуется много. Однако он окупается сполна.
Психология в своем научном становлении неизбежно должна была пройти и прошла путь математизации, хотя не во всех странах и не в полной мере. Точной даты начала пути математизации, пожалуй, не знает ни одна наука. Однако для психологии в качестве условной даты начата этого пути можно принять 18 апреля
1822 г . Именно тогда в Королевском немецком научном обществе Иоганн Фридрих Гербарт прочел доклад «О возможности и необходимости применять в психологии математику». Основная идея доклада сводилась к упомянутому выше мнению: если психология хочет быть наукой, подобно физике, в ней нужно и можно применять математику.
Спустя два года после этого программного по своей сути доклада И. Ф. Гербарт издал книгу «Психология как наука, заново основанная на опыте, метафизике и математике». Эта книга примечательна во многих отношениях. Она, на мой взгляд (см. Г.В Суходольский, ), явилась первой попыткой создания психологической теории, опирающейся на тот круг явлений, которые непосредственно доступны каждому субъекту, а именно на поток представлений, сменяющих друг друга в сознании. Никаких эмпирических данных о характеристиках этого потока, полученных, подобно физике, экспериментальным путем, тогда не существовало. Поэтому Гербарт в отсутствие этих данных, как он сам писал, должен был придумывать гипотетические модели борьбы всплывающих и исчезающих в сознании представлений. Облекая эти модели в аналитическую форму,например φ =α(l-exp[-βt]) ,где t-время, φ-скорость изменения представлений, α и β - константы, зависящие от опыта, Гербарт, манипулируя числовыми значениями параметров, пытался описать возможные характеристики смены представлений.
По-видимому, И. Ф. Гербарту первому принадлежит мысль о том, что свойства потока сознания - это величины и, следовательно, они в дальнейшем развитии научной психологии подлежат измерению. Ему также принадлежит идея «порога сознания», и он первый употребил выражение «математическая психология».
У И. Ф. Гербарта в Лейпцигском университете нашелся ученик и последователь, позднее ставший профессором философии и математики, - Мориц-Вильгельм Дробиш. Он воспринял, развил и по-своему реализовал программную идею учителя. В словаре Брокгауза и Ефрона о Дробише сказано, что еще в 30-х годах Х1Х века он занимался исследованиями по математике и психологии и публиковался на латинском языке. Но в 1842г . М.В.Дробиш издал в Лейпциге на немецком языке монографию под недвусмысленным названием: «Эмпирическая психология согласно естественнонаучному методу».
На мой взгляд, эта книга М.-В. Дробиша дает замечательный пример первичной формализации знаний в области психологии сознания. Там нет математики в смысле формул, символики и расчетов, но там есть четкая система понятий о характеристиках потока представлений в сознании как взаимосвязанных величинах. Уже в предисловии М.-В. Дробиш написал, что эта книга предваряет другую, уже готовую, - имеется в виду книга по математической психологии. Но поскольку его коллеги-психологи недостаточно подготовлены в математике, постольку он счел необходимым продемонстрировать эмпирическую психологию сначала безо всякой математики, а лишь на твердых естественнонаучных основах.
Не знаю, подействовала ли эта книга на тогдашних философов и богословов, занимавшихся психологией. Скорее всего - нет. Но она, несомненно, подействовала, как и работы И. Ф. Гербарта, на лейпцигских ученых с естественнонаучным образованием.
Лишь через восемь лет, в 1850 г . в Лейпциге вышла в свет вторая основополагающая книга М.-В. Дробиша-«Первоосновы математической психологии». Таким образом, у этой психологической дисциплины тоже есть точная дата появления в науке. Некоторые современные психологи, пишущие в области математической психологии, ухитряются начинать ее развитие с американского журнала, появившегося в 1963 г. Воистину, «все новое - это хорошо забытое старое». Целое столетие до американцев развивалась математическая психология, точнее - математизированная психология. И начало процессу математизации нашей науки положили И. Ф. Гербарт и М.-В. Дробиш.
Надо сказать, что по части новаций математическая психология Дробиша уступает сделанному его учителем - Гербартом. Правда, Дробиш к двум борющимся в сознании представлениям добавил третье, а это сильно усложнило решения. Но главное, по-моему, в другом. Большую часть объема книги составляют примеры численного моделирования. К сожалению, ни современники, ни потомки не поняли и не оценили научного подвига, совершенного М.-В. Дробишем: у него ведь не было компьютера для численного моделирования. А в современной психологии математическое моделирование - это продукт второй половины XX века. В предисловии к нечаевскому переводу гербартианской психологии российский профессор А. И. Введенский, знаменитый своей «психологией без всякой метафизики», весьма пренебрежительно отозвался о попытке Гербарта применять в психологии математику. Но не такова была реакция естествоиспытателей. И психофизики, в частности Теодор Фехнер, и знаменитый Вильгельм Вундт, работавшие в Лейпциге, не могли пройти мимо основополагающих публикаций И.Ф.Гербартаи М.-В. Дробиша. Ведь именно они математически реализовали в психологии идеи Гербарта о психологических величинах, порогах сознания, времени реакций сознания человека, причем реализовали с использованием современной им математики.
Основные методы тогдашней математики-дифференциальное и интегральное исчисления, уравнения сравнительно несложных зависимостей - оказались вполне пригодными для выявления и описания простейших психофизических законов и различных реакций человека Но они не годились для изучения сложных психических явлений и сущностей. Не зря В.Вундт категорически отрицал возможность эмпирической психологии исследовать высшие психические функции. Они оставались, по Вундту, в ведении особой, по сути метафизической, психологии народов.
Математические средства для изучения сложных многомерных объектов, в том числе высших психических функции - интеллекта, способностей, личности, стали создавать англоязычные ученые. Среди других результатов оказалось, что рост потомков как бы стремится возвратиться к среднему росту предков. Появилось понятие «регрессия», и были получены уравнения, выражающие эту зависимость. Был усовершенствован коэффициент, раньше предложенный французом Бравэ. Этот коэффициент количественно выражает соотношение двух изменяющихся переменных, т. е. корреляцию. Теперь этот коэффициент - одно из важнейших средств многомерного анализа данных, дажесимвол сохранил аббревиатурный: малое латинское «г» от английского relation - отношение.
Еще будучи студентом Кембриджа, Фрэнсис Гальтон заметил, что рейтинг успешности сдачи экзаменов по математике,-а это был выпускной экзамен, -- изменяется от нескольких тысяч до немногих сотен баллов. Позднее, связав это с распределением талантов, Гальтон пришел к мысли о том, что специальные испытания позволяют прогнозировать дальнейшие жизненные успехи людей. Так в 80-х гг. XIX века родился гальтоновский метод тестов.
Идею тестов подхватили и развили французы-А. Бит, В. Анри и другие, создавшие первые тесты для селекции социально отсталых детей. Это послужило началом психологической тестологии, что, в свою очередь, повлекло за собой развитие психологических измерений.
left">
Негосударственное образовательное частное учреждение
высшего профессионального образования
«Московский социально-гуманитарный институт»
КОНСПЕКТ ЛЕКЦИЙ ПО ДИСЦИПЛИНЕ
«МАТЕМАТИЧЕСКИЕ МЕТ ОДЫ В ПСИХОЛОГИИ»
ЧАСТЬ 1
Лекция № 1
ВВЕДЕНИЕ В КУРС «МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ»
Вопросы:
1.Математика и психология
2.Методологические вопросы применения математики в психологии
3.Математическая психология
3.1.Введение
3.2.История развития
3.3.Психологические измерения
3.4.Нетрадиционные методы моделирования
1822 г . Именно тогда в Королевском немецком научном обществе прочел доклад «О возможности и необходимости применять в психологии математику». Основная идея доклада сводилась к упомянутому выше мнению: если психология хочет быть наукой, подобно физике, в ней нужно и можно применять математику.
Спустя два года после этого программного по своей сути доклада издал книгу «Психология как наука, заново основанная на опыте, метафизике и математике». Эта книга примечательна во многих отношениях. Она, на мой взгляд (см. Г. В Суходольский, ), явилась первой попыткой создания психологической теории, опирающейся на тот круг явлений, которые непосредственно доступны каждому субъекту, а именно на поток представлений, сменяющих друг друга в сознании. Никаких эмпирических данных о характеристиках этого потока, полученных, подобно физике, экспериментальным путем, тогда не существовало. Поэтому Гербарт в отсутствие этих данных, как он сам писал, должен был придумывать гипотетические модели борьбы всплывающих и исчезающих в сознании представлений. Облекая эти модели в аналитическую форму, например φ =α(l-exp[-βt]) ,где t-время, φ-скорость изменения представлений, α и β - константы, зависящие от опыта, Гербарт, манипулируя числовыми значениями параметров, пытался описать возможные характеристики смены представлений.
По-видимому, первому принадлежит мысль о том, что свойства потока сознания - это величины и, следовательно, они в дальнейшем развитии научной психологии подлежат измерению. Ему также принадлежит идея «порога сознания», и он первый употребил выражение «математическая психология».
У в Лейпцигском университете нашелся ученик и последователь, позднее ставший профессором философии и математики, - Мориц-Вильгельм Дробиш. Он воспринял, развил и по-своему реализовал программную идею учителя. В словаре Брокгауза и Ефрона о Дробише сказано, что еще в 30-х годах Х1Х века он занимался исследованиями по математике и психологии и публиковался на латинском языке. Но в 1842г . биш издал в Лейпциге на немецком языке монографию под недвусмысленным названием: «Эмпирическая психология согласно естественнонаучному методу».
На мой взгляд, эта книга М.-В. Дробиша дает замечательный пример первичной формализации знаний в области психологии сознания. Там нет математики в смысле формул, символики и расчетов, но там есть четкая система понятий о характеристиках потока представлений в сознании как взаимосвязанных величинах. Уже в предисловии М.-В. Дробиш написал, что эта книга предваряет другую, уже готовую, - имеется в виду книга по математической психологии. Но поскольку его коллеги-психологи недостаточно подготовлены в математике, постольку он счел необходимым продемонстрировать эмпирическую психологию сначала безо всякой математики, а лишь на твердых естественнонаучных основах.
Не знаю, подействовала ли эта книга на тогдашних философов и богословов , занимавшихся психологией. Скорее всего - нет. Но она, несомненно, подействовала, как и работы, на лейпцигских ученых с естественнонаучным образованием.
Лишь через восемь лет, в 1850 г . в Лейпциге вышла в свет вторая основополагающая книга М.-В. Дробиша-«Первоосновы математической психологии». Таким образом, у этой психологической дисциплины тоже есть точная дата появления в науке. Некоторые современные психологи, пишущие в области математической психологии, ухитряются начинать ее развитие с американского журнала, появившегося в 1963 г. Воистину, «все новое - это хорошо забытое старое». Целое столетие до американцев развивалась математическая психология, точнее - математизированная психология. И начало процессу математизации нашей науки положили и М.-В. Дробиш.
Надо сказать, что по части новаций математическая психология Дробиша уступает сделанному его учителем - Гербартом. Правда, Дробиш к двум борющимся в сознании представлениям добавил третье, а это сильно усложнило решения. Но главное, по-моему, в другом. Большую часть объема книги составляют примеры численного моделирования. К сожалению, ни современники, ни потомки не поняли и не оценили научного подвига, совершенного М.-В. Дробишем: у него ведь не было компьютера для численного моделирования. А в современной психологии математическое моделирование - это продукт второй половины XX века. В предисловии к нечаевскому переводу гербартианской психологии российский профессор, знаменитый своей «психологией без всякой метафизики», весьма пренебрежительно отозвался о попытке Гербарта применять в психологии математику. Но не такова была реакция естествоиспытателей. И психофизики, в частности Теодор Фехнер, и знаменитый Вильгельм Вундт, работавшие в Лейпциге, не могли пройти мимо основополагающих публикаций М.-В. Дробиша. Ведь именно они математически реализовали в психологии идеи Гербарта о психологических величинах, порогах сознания, времени реакций сознания человека, причем реализовали с использованием современной им математики.
Основные методы тогдашней математики-дифференциальное и интегральное исчисления, уравнения сравнительно несложных зависимостей - оказались вполне пригодными для выявления и описания простейших психофизических законов и различных реакций человека Но они не годились для изучения сложных психических явлений и сущностей. Не зря В. Вундт категорически отрицал возможность эмпирической психологии исследовать высшие психические функции. Они оставались, по Вундту, в ведении особой, по сути метафизической, психологии народов.
Математические средства для изучения сложных многомерных объектов, в том числе высших психических функции - интеллекта, способностей, личности, стали создавать англоязычные ученые. Среди других результатов оказалось, что рост потомков как бы стремится возвратиться к среднему росту предков. Появилось понятие «регрессия», и были получены уравнения, выражающие эту зависимость. Был усовершенствован коэффициент, раньше предложенный французом Бравэ. Этот коэффициент количественно выражает соотношение двух изменяющихся переменных, т. е. корреляцию. Теперь этот коэффициент - одно из важнейших средств многомерного анализа данных, дажесимвол сохранил аббревиатурный : малое латинское «г» от английского relation - отношение.
Еще будучи студентом Кембриджа, Фрэнсис Гальтон заметил, что рейтинг успешности сдачи экзаменов по математике,-а это был выпускной экзамен, -- изменяется от нескольких тысяч до немногих сотен баллов. Позднее, связав это с распределением талантов, Гальтон пришел к мысли о том, что специальные испытания позволяют прогнозировать дальнейшие жизненные успехи людей. Так в 80-х гг. XIX века родился гальтоновский метод тестов.
Идею тестов подхватили и развили французы-А. Бит, В. Анри и другие, создавшие первые тесты для селекции социально отсталых детей. Это послужило началом психологической тестологии, что, в свою очередь, повлекло за собой развитие психологических измерений.
Большие массивы числовых результатов измерений по тестам- в баллах, стали объектом многочисленных исследований, в том числе математико-психологических. Особая роль здесь принадлежит английскому инженеру, работавшему в Америке, -Чарльзу Спирмену
Во-первых , Ч. Спирмен, полагавший, что для вычисления корреляции между рядами целочисленных баллов, или рангов, нужна специальная мера, перепробовав разные варианты (я читал его объемную статью в Американском психологическом журнале за 1904 г.), остановился, наконец, на той форме коэффициента корреляции рангов, которая с тех пор носит его имя.
Во-вторых , имея дело с большими массивами числовых результатов по тестам и корреляций между этими результатами, Ч. Спирмен предположил, что эти корреляции вовсе не выражают взаимовлияние результатов, а эксплицируют их совместную изменчивость под влиянием обшей латентной психической причины, или фактора, например интеллекта. Соответственно этому Спирмен предложил теорию «генерального» фактора, определяющего совместную изменчивость переменных тестовых результатов, а также разработал метод выявления этого фактора по корреляционной матрице. Это был первый метод факторного анализа , созданный в психологии и для психологических целей.
У однофакторной теории Ч. Спирмена быстро нашлись оппоненты. Противоположную, многофакторную теорию, объясняющую корреляции, предложил Леон Терстоун. Ему же принадлежит первый метод мультифакторного анализа, основанный на применении линейной алгебры. После Ч. Спирмена и Л. Терстоуна факторный анализ, не только стал одним из важнейших математических методов многомерного анализа данных в психологии, но и вышел далеко за ее пределы, превратился в общенаучный метод анализа, данных.
С конца 20-х гг XX века математические методы все шире проникают в психологию и творчески используются в ней. Интенсивно развивается психологическая теория измерений. На основе аппарата цепей Маркова разрабатываются стохастические модели научения в психологии поведения. Созданный в области биологии Рональдом Фишером дисперсионный анализ становится основным математическим методом в генетической психологии. Математические модели из теории автоматического регулирования и шенноновская теория информации широко применяются в инженерной и общей психологии. В итоге современная научная психология во многих своих отраслях математизирована значительным образом. При этом вновь появляющиеся математические новации нередко заимствуются психологами для своих целей. К примеру, появление алгоритмического языка для задач управления, предложенного и, почти сразу же бьшо использовано для составления алгоритмов деятельности железнодорожного диспетчера.
Должен возникнуть вопрос: какими особыми свойствами обладает математика, если одни и те же математические методы успешно применяются в различных науках. Отвечая на этот вопрос, следует обратиться к предмету математики и ее объектам.
На протяжении многих столетий считалось, что предметом математики является все сущее - природа в широком смысле. Математики древности полагали, что математические формы имеют божественное происхождение. Так, Платон рассматривал геометрические фигуры как идеальные эйдосы, т. е. образы, созданные высшими богами для копирования людьми, конечно, уже не в той совершенной форме. А знаменитый Пифагор видел в числах и определенных числовых сочетаниях предустановленную гармонию небесных сфер.
Религиозное мировоззрение людей веками связывало божественное творение мира с математическими средствами, с помощью которых выражаются законы природы. Глубоко религиозный сэр Исаак Ньютон верил, что «книга природы написана на языке математики», и широко использовал математические методы в своей натуральной философии.
Надо сказать, что, даже отказавшись от веры в божественное творение мира, многие математики продолжали считать природу предметом математики. Нам широко известна формулировка, данная в свое время Ф. Энгельсом : «Предметом математики служат пространственные формы и количественные отношения материального мира». Еще и сегодня можно встретить эту формулировку в учебной литературе. Правда, появились и другие трактовки предмета - как наиболее абстрактных моделей всего сущего. Но здесь, намой взгляд, предмет математики опять-таки сужен до служебной функции - моделирования и снова природы в широком смысле.
Спрашивается, а правильно ли это, отказавшись от идеи творения, по-прежнему считать природу предметом математики? Ведь это не только не последовательно. Дело в том, что один и тот же природный закон можно выразить математически по-разному и в пределах научной точности нельзя доказать, какое из выражений истинно. Примером могут служить логарифмический закон Вебера-Фехнера и степенной закон Стивенса, которые, как показал, оба выводятся при определенных допущениях из некоего обобщенного психофизического закона. То обстоятельство, что один и тот же математический метод описывает явления из разных наук, тоже свидетельствует не в пользу природы как предмета математики.
Так если не природа, то что же является предметом математики? Мой ответ, несомненно, крайне удивит многих представителей физико-математических наук: предметом математики является ее собственный продукт-те математические объекты, из которых состоит математика как наука.
Математический объект - это продукт человеческой мысли, материализованный хотя бы в одной из пяти основных форм: вербальной, графической, табличной, символической или аналитической. Конечно, древний мыслитель мог найти в природе аналоги математическим объектам - геометрическим формам, числам, как-либо физически воплощенным (прямая тростинка, пять камней и т. п.). Но ведь математическую сущность надо было абстрагировать от материальной природной формы. Лишь после этого она становилась математической, а не физической (биологической и т. д.). И сделать это мог только человек. В длинном ряду поколений - и для практических целей, и ради интереса - люди создавали тот мир математических объектов (включая отношения и операции над объектами, которые тоже суть математические объекты), который называется математикой.
Подобно психологии, математика - это обширная и бурно развивающаяся область знаний. Но она также далеко не однородна: в ее составе выделяются не только многочисленные отрасли, но и «разные математики». Существуют «чистая» и прикладная, «непрерывная» и дискретная, «не конструктивная» и конструктивная, формально-логическая и содержательная математики.
Пожалуй, так же как нет психолога, знающего все отрасли психологии, так нет и математика, знающего все отрасли и направления современной математики. Ведь даже энциклопедии и справочники наряду с классическими, традиционными разделами, общими для всех, содержат различные дополнительные, причем отнюдь не новые разделы математических сведений. Обилие и разнообразие математических теорий и методов порождает проблемы выбора и практического использования математики за ее пределами, в том числе в психологии. Но об этом мы поговорим в последней главе книги.
Абстрактный характер математики, ее независимость от природы в широком смысле и позволяют использовать математические методы в самых разных приложениях. Разумеется, при этом важно, чтобы метод был адекватен объекту, для изучения которого применяется.
Для того чтобы завершить рассмотрение общих вопросов, остановимся на том, что понимается под математическими методами.
В каждой науке, помимо ее предмета, предполагают существующими особые, свойственные данной науке методы. Так, для современной психологии характерным является метод тестов. Используемые в ней методы наблюдения, беседы, эксперимента и т. д., о которых пишется в учебниках, не являются специфичными для психологии и широко используются в других науках. Вообще, за редким исключением, современные научные методы универсальны и применяются везде, где можно.
Аналогично обстоит дело с математикой. И хотя большинство математиков убеждены в специфичности аксиоматического подхода, математической индукции и доказательств, на самом деле все эти методы используются и за пределами математики.
Как я уже отмечал, математические объекты существуют в текстах и мыслях думающих о них людей в одной, нескольких или всех из пяти основных форм - словесной, графической, табличной, символической и аналитической. Это названия объектов, геометрические фигуры или чертежи и графики, различные таблицы, символы объектов, операций и отношений, наконец, различные формулы, которыми выражаются отношения между объектами. Так вот математические методы представляют собой правила или процедуры построения, преобразования, метризации и вычисления математических объектов-всего четыре основных типа методов. Среди каждого из них есть простые и сложные, как, например, суммирование двух чисел и факторизация корреляционной матрицы. Пятый тип - комбинированный из основных - открывает неограниченные возможности конструирования новых математических методов, необходимых для определенных научных приложений.
Заканчивая, отмечу, что многие методы играют служебную роль в самой математике, как, в частности, доказательства теорем или определенные строгости изложения, так приветствуемые математиками. Для практических приложений математических методов за пределами математики, в том числе в психологии, математические строгости и тонкости не нужны: они затеняют суть результатов, в которых математика должна находиться на заднем плане, как, например, логарифмическая основа психофизического закона Вебера-Фехнера.
Вопрос 2. МЕТОДОЛОГИЧЕСКИЕ ВОПРОСЫ ПРИМЕНЕНИЯ МАТЕМАТИКИ В ПСИХОЛОГИИ
Маститые психологи, имеющие базовое гуманитарное образование, критически относятся к применению математических методов в психологии, сомневаются в их полезности. Их аргументы таковы: математические методы создавались в науках, объекты которых не сравнимы по сложности с психологическими объектами; психология слишком специфична, что бы в ней была польза от математики.
Первый аргумент в определенной мере справедлив. Поэтому именно в психологии создавались математические методы, специально рассчитанные на сложные объекты, например, корреляционный и факторный анализы. Но второй аргумент явно ошибочен: психология не специфичнее многих других наук, где применяется математика. И сама история психологии подтверждает это. Вспомним идеи И. Гербарта и М.-В. Дробиша, да и весь путь развития современной психологии. Он подтверждает расхожую истину: область знания становится наукой, когда начинает применять математику.
, Об индивидных, субъектных и личностных проявленияхиндивидуальнойтревожности//Ананьевскиечтения - 2003. СПб., Изд-во СПбГУ. С. 58-59.
В психологии всегда было много мигрантов из естественных наук, а в XX веке - из наук технических. Неплохо подготовленные в области математики мигранты, естественно, применяли доступную им математику в новой психологической области, не достаточно учитывая существенную психологическую специфику, которая, конечно, существует в психологии, как и в любой науке. В результате в психологических отраслях появилась масса математических моделей, малоадекватных в содержательном отношении. Особенно это относится к психометрии и инженерной психологии, но и к общей, социальной и другим «популярным» психологическим отраслям.
Малоадекватные математические формализмы отталкивают от себя гуманитарно ориентированных психологов и подрывают доверие к математическим методам. А между тем мигранты в психологию из естественных и технических наук уверены в необходимости математизации психологии вплоть до такого уровня, когда само существо психики будет выражено математически. При этом считается, что в математике достаточно методов для психологического использования и психологам нужно только выучить математику.
В основе этих воззрений лежит ошибочная, как я считаю, мысль о всесилии математики, о ее способности, так сказать, вооружившись пером и бумагой, открывать новые тайны, подобно тому, как в физике был предсказан позитрон.
При всем моем уважении и даже любви к математическим методам, должен сказать, что математика не всесильна; она является одной из наук, но, благодаря абстрактности своих объектов, легко и с пользой применимой в других науках. Действительно, в любой науке полезен расчет, и важно представлять закономерности в лаконичной символической форме, использовать наглядные схемы и чертежи. Однако, применение математических методов за пределами математики должно приводить к утрате математической специфики.
Идущая из глубины веков вера в то, что «книга природы написана на языке математики», идущем от господа Бога - создавшего всего и вся, привела к тому, что и в языке и в мышлении ученых закрепились выражения «математические модели», «математические методы» в экономике, биологии, психологии, физике, но как могут существовать математические модели в физике? Ведь в ней должны быть и, конечно, существуют физические модели, построенные с помощью математики. И создают их физики, владеющие математикой, или математики, владеющие физикой.
Короче говоря, в математической физике должны быть математико-физические модели и методы, а в математической психологии - математико-психологические. Иначе, в традиционном варианте «математических моделей» имеет место математический редукционизм.
Редукционизм вообще является одной из основ математической культуры: всегда сводить неизвестную, новую задачу к известной и решать ее апробированными методами. Именно математический редукционизм служит причиной появления малоадекватных моделей в психологии и других науках.
Еще недавно среди наших психологов было распространенным мнение: психолога должны формулировать задачи для математиков, которые смогут их корректно решить. Это мнение явно ошибочное: решать специфические задачи могут лишь специалисты, но являются ли таковыми в психологии математики, - нет, конечно. Рискну утверждать, что математикам также трудно решать психологические задачи, как психологам - задачи математические: ведь надо изучать ту научную область, к которой задача относится, а на это годы нужны и еще интерес к «чужой» научной области, в которой иные критерии научных достижений. Так, математику для научной стратификации необходимо совершать «математические» открытия-доказывать новые теоремы. Причем же здесь психологические задачи? Их должны решать сами психологи, которым надо научиться использовать подходящие математические методы. Таким образом, снова возвращаемся к вопросу об адекватности и полезности математических методов в психологии.
Не только в психологии, но в любой науке, полезность математики состоит в том, что ее методы обеспечивают возможность количественных сравнений, лаконичные символические интерпретации, обоснованность прогнозов и решений, экспликацию правил управления. Но все это - при условии адекватности применяемых математических методов.
Адекватность - это соответствие: метод должен соответствовать содержанию, причем соответствовать в том смысле, что бы отображение не математического содержания математическими средствами было гомоморфным. К примеру, обычные множества не адекватны для описания процессов познания: в них не отображается частота необходимых повторений. Адекватными здесь будут лишь мультимножества. Читатель, познакомившийся с содержанием текста предыдущих глав, легко поймет, что рассмотренные математические методы в целом адекватны для психологических приложений, а в деталях адекватность нужно оценивать конкретно.
Общее правило таково: если психологический объект характеризуется конечным набором свойств, то адекватный метод отобразит весь набор, а если, что-то не отобразится, то и адекватность снижается. Таким образом, мерой адекватности служит количество отображаемых методом содержательных свойств. При этом важны два обстоятельства: наличие конкурирующих, эквивалентных по возможности применения, методов и возможность взаимных вербально-символических, табличных, графических и аналитических отображений результатов.
Среди конкурирующих методов следует выбирать наиболее простые, либо понятные, и желательно проверять результат разными методами. Например, дисперсионным анализом и математическим планированием эксперимента можно обоснованно выявлять зависимости в науке.
Не следует ограничиваться одной-двумя из математических форм, нужно, по видимости (а она всегда существует) использовать их все, создавая определенную избыточность в математическом описании результатов.
Важнейшим условием конкретного применения математических методов является, - помимо их понимания, разумеется, - содержательная и формальная интерпретация. В психологии следует различать и уметь выполнять четыре вида интерпретаций; психолого-психологические, психолого-математические, математико-математические и (обратные) математико-психологические. Они организованы в цикл.
Любая научно-исследовательская или практическая задача в психологии сначала подвергается психолого-психологическим интерпретациям, посредством которых от теоретических воззрений переходят к операционально определяемым понятиям и эмпирическим процедурам. Затем наступает черед психолого-математических интерпретаций, с помощью которых выбираются и реализуются математические методы эмпирического исследования. Полученные данные надо обработать и в процессе обработки осуществляются математико-математические интерпретации. Наконец, результаты обработки следует интерпретировать содержательно, т. е. выполнить математико-психологическую интерпретацию уровней значимости, аппроксимированных зависимостей и т. д. Цикл замкнулся, и либо задача решена и можно переходить к другой, либо необходимо уточнить предыдущую и повторить исследование. Такова логика действий в применении математики, - и не только в психологии, но и в других науках.
И последнее. Нельзя досконально изучить все рассмотренные в этой книге математические методы впрок, раз и навсегда. Для овладения любым достаточно сложным методам нужны многие десятки, а то и сотни обучающих попыток. Но познакомится с методами и попытаться их понять в общем и целом нужно впрок, а с деталями можно познакомится в дальнейшем, по мере надобности.
Вопрос 3. Математическая психология
3.1. Введение
Математическая психология - это раздел теоретической психологии, использующий для построения теорий и моделей математический аппарат.
«В рамках математической психологии должен осуществляться принцип абстрактно-аналитического исследования, в котором изучается не конкретное содержание субъективных моделей действительности, а общие формы и закономерности психической деятельности» [Крылов, 1995].
Объект математической психологии : естественные системы, обладающие психическими свойствами; содержательные психологические теории и математические модели таких систем. Предмет - разработка и применение формального аппарата для адекватного моделирования систем, обладающих психическими свойствами. Метод - математическое моделирование.
Процесс математизации психологии начался с момента ее выделения в экспериментальную дисциплину. Этот процесс проходит ряд этапов.
Первый - применение математических методов для анализа и обработки результатов экспериментального исследования, а также выведение простых законов (конец XIX в. - начало XX в.). Это время разработки закона научения, психофизического закона, метода факторного анализа.
Второй (40-50-е гг.) - создание моделей психических процессов и поведения человека с использованием ранее разработанного математического аппарата.
Третий (60-е гг. по настоящее время) - выделение математической психологии в отдельную дисциплину, основная цель которой - разработка математического аппарата для моделирования психических процессов и анализа данных психологического эксперимента.
Четвертый этап еще не наступил. Этот период должен характеризоваться становлением психологии теоретической и отмиранием - математической.
Часто математическую психологию отождествляют с математическими методами, что является ошибочным. Математическая психология и математические методы соотносятся друг с другом так же, как теоретическая и экспериментальная психология.
3.2. История развития
Термин «математическая психология» стал применяться с появлением в 1963 г. в США «Руководства по математической психологии» . В эти же годы здесь начинает издаваться журнал «Journal of Mathematical Psychology».
Проведенный в лаборатории математической психологии ИП РАН анализ работ позволил выделить основные тенденции развития математической психологии.
В 60-70-е гг. получили широкое распространение работы по моделированию обучения, памяти, обнаружения сигналов, поведения, принятия решений. Для их разработки использовался математический аппарат вероятностных процессов, теории игр, теории полезности и др. Было завершено создание математической теории обучения. Наиболее известны модели Р. Буша, Ф. Мостеллера, Г. Бауэра, В. Эс-теса, Р. Аткинсона. (В последующие годы наблюдается снижение количества работ по данной проблематике.) Появляется множество математических моделей по психофизике, например С. Стивенса, Д. Экмана, Ю. Забродина, Дж. Светса, Д. Грина, М. Михайлевской, Р. Льюса (см. разд. 3.1). В работах по моделированию группового и индивидуального поведения, в том числе в ситуации неопределенности, использовались теории полезности, игр, риска и стохастические процессы. Это модели Дж. Неймана, М. Цетлина, В. Крылова, А. Тверского, Р. Льюса. В рассматриваемый период создавались глобальные математические модели основных психических процессов.
В период до 80-х гг. появляются первые работы по психологическим измерениям: осуществляется разработка методов факторного анализа, аксиоматики и моделей измерения, предлагаются различные классификации шкал, ведется работа над созданием методов классификации и геометрического представления данных,
строятся модели, основанные на лингвистической переменной (Л. Заде).
В 80-е гг. особое внимание уделяется уточнению и развитию моделей, связанных с разработкой аксиоматики различных теорий.
В психофизике это: современная теория обнаружения сигналов (Д. Свете, Д. Грин), структуры сенсорных пространств (Ю. Забродин, Ч. Измайлов), случайных блужданий (Р. Льюс, 1986), различения Линка и др.
В области моделирова ния группового и индивидуального поведения : модель решения и действия в психомоторных актах (Г. Коренев, 1980), модель целенаправленной системы (Г. Коренев), «деревья» предпочтения А. Тверского, модели системы знаний (Дж. Грино), вероятностная модель научения (А. Дрынков, 1985), модель поведения в диадном взаимодействии (Т. Савченко, 1986) моделирование процессов поиска и извлечения информации из памяти (Р. Шифрин, 1974), моделирование стратегий принятия решений в процессе обучения (В. Венда, 1982) и др.
В теории измерения:
множество моделей многомерного шкалирования (МШ), в которых прослеживается тенденция к снижению точности описания сложных систем - модели предпочтения, неметрическое шкалирование, шкалирование в псевдоевклидовом пространстве, МШ на «размытых» множествах (Р. Шепард, К. Кумбс, Д. Краскал, В. Крылов, Г Головина, А. Дрынков);
Модели классификации: иерархические, дендритные, на «размытых» множествах (А. Дрынков, Т. Савченко, В. Плюта);
Модели конфирматорного анализа, позволяющие формировать культуру проведения экспериментального исследования;
Применение математичеекого моделирования в психодиагностике (А. Анастази, П. Клайн, Д. Кендалл, В. Дружинин)
В 90-х гг. глобальные математические модели психических процессов практически не разрабатываются, однако значительно возрастает количество работ по уточнению и дополнению существующих моделей, продолжает интенсивно развиваться теория измерений, теория конструирования тестов; разрабатываются новые шкалы, более адеквантые реальности (Д. Льюс, П. Саппес, А. Тверски, А. Марли); широко внедряется в психологию синергетический подход к моделированию.
Если в 70-е гг. работы по математической психологии в основном появлялись в США, то в 80-е наблюдается бурный рост ее развития в России, в настоящее время, к сожалению, заметно снизившийся из-за недостаточного финансирования фундаментальной науки.
Наиболее значимые модели появились в 70-е-начале 80-х гг., далее они дополнялись и уточнялись. В 80-е гг. интенсивно развивалась теория измерений. Эта работа продолжается и сегодня. Особенно важно, что многие методы многомерного анализа получили широкое применение в экспериментальных исследованиях; появляется множество специально ориентированных на психологов программ анализа данных психологического тестирования.
В США большое внимание уделяется чисто математическим вопросам моделирования. В России же, наоборот, математические модели зачастую не обладают достаточной строгостью, что приводит к неадекватному описанию реальности.
Математические модели в психологии. В математической психологии принято выделять два направления: математические модели и математические методы. Мы нарушили эту традицию, так как считаем, что нет необходимости выделять отдельно методы анализа данных психологического эксперимента. Они являются средством построения моделей: классификации, латентных структур, семантических пространств и др.
3.3. Психологические измерения
В основе применения математических методов и моделей в любой науке лежит измерение. В психологии объектами измерения являются свойства системы психики или ее подсистем, таких, как восприятие, память, направленность личности, способности и т. д. Измерение - это приписывание объектам числовых значений, отражающих меру наличия свойства у данного объекта.
Методы и способы математико-статистической обработки у студентов гуманитарных факультетов, в том числе и психологических, вызывают значительные затруднения и, как следствие, боязнь и предубеждение в возможности ими овладения. Однако, как показывает практика, это ложные заблуждения. Следует понять, что в современной психологии, в практической деятельности психолога любого уровня, без использования аппарата математической статистики все выводы могут восприниматься как не более чем умозрительные, с известной долей субъективности. Вместе с тем по мере накопления практического опыта, освоения базы данных эмпирических исследований неизбежно возникает задача их обобщения, выявления тенденций, динамики, характерных черт, особенностей, которые невозможно обоснованно интерпретировать, не используя математические методы количественного анализа.
Анализ первичных статистик
Для определения способов математико-статистической обработки прежде всего необходимо оценить характер распределения данных по всем используемым параметрам (признакам). Для параметров (признаков), имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики, которые во многих случаях являются более мощными, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения.
Одним из важнейших в математической статистике является понятие нормального распределения.
Нормальное распределение - модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов. Количество таких факторов велико, а эффект влияния каждого из них в отдельности очень мал. Такой характер взаимовлияний весьма характерен для психических явлений, поэтому исследователь в области психологии чаще всего выявляет нормальное распределение. Однако так бывает не всегда, поэтому в каждом случае форма распределения должна быть проверена.
Характер распределения выявляется главным образом для того, чтобы определиться в методах математико-статистической обработки данных.
Если характер распределения показателей психологического признака является нормальным или близким к нормальной форме распределения признака, описываемой кривой Гаусса, то можно использовать параметрические методы математической статистики как наиболее простые, надежные и достоверные: сравнительный анализ, расчет достоверности отличий признака между выборками (по критерию Стьюдента, F-критерию Фишера, коэффициенту корреляции Пирсона и др).
Если кривая распределения показателей психологического признака далека от нормальной, то используют методы непараметрической статистики: расчет достоверности отличий по критерию Q Розенбаума (для малых выборок), по критерию U Манна-Уитни, коэффициенту ранговой корреляции Спирмена, по факторному, многофакторному, кластерному и другим методам анализа.
Помимо этого, по характеру распределения можно составить общее представление об общей характеристике выборки испытуемых по данному признаку и тому, насколько данная методика соответствует (т. е. «работает», валидна) данной выборке.
Важнейшими первичными статистиками, характеризующими распределение исследуемого признака, являются:
- средняя арифметическая - это величина, сумма отрицательных и положительных отклонений от которой равна нулю. В статистике ее обозначают буквой «М» или «X». Чтобы ее подсчитать, надо суммировать все значения ряда и разделить сумму на количество суммированных значений;
- среднее квадратичное отклонение (обозначаемое греческой буквой а (сигма) и называемое также основным, или стандартным отклонением) - мера разнообразия входящих в группу объектов; она показывает, насколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и среднее квадратичное отклонение. Разброс значений характеризует и размах, т.е. разность между наибольшим и наименьшим значением в ряду. Однако сигма полнее характеризует разброс значений относительно средней арифметической;
- коэффициент вариации - частное, полученное отделения сигмы на среднюю арифметическую, умноженное на 100%:
CV=q/Mx 100%,
где q - стандартное отклонение; CV - коэффициент вариации; М - среднее арифметическое.
Следует иметь в виду, что сигма (q) - величина именованная и зависит не только от степени варьирования, но и от единиц измерения. Поэтому по сигме можно сравнивать изменчивость лишь одних и тех же показателей, а сопоставлять сигмы разных признаков по абсолютной величине нельзя. Для того чтобы сравнить по уровню изменчивости признаки любой размерности (выраженные в различных единицах измерения) и избежать влияния масштаба измерений средней арифметической на величину сигмы, применяют коэффициент вариации, который представляет собой по существу приведение к одинаковому масштабу величины q.
Для нормального распределения используются точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант.
Таким образом, ориентируясь на характеристики нормального распределения, можно оценить степень близости к нему рассматриваемого распределения психологического признака.
Следующими по важности характеристиками распределения показателей признака являются такие первичные статистики, как коэффециент асимметрии и эксцесс.
Коэффициент асимметрии - показатель отклонения распределения в левую или правую сторону по оси абсцисс. Если правая ветвь кривой длиннее левой, говорят о правосторонней (положительной) fccbvtnhbb, если левая ветвь длиннее правой, говорят о левосторонней (отрицательной) асимметрии.
Эти параметры позволяют составить первое приближенное представление о характере распределения:
- у нормального распределения редко можно обнаружить коэффициент асимметрии, близкий к единице и более единицы (-1 и +1);
- эксцесс у признаков с нормальным распределением обычно имеет величину в диапазоне 2-4. Вычислить показатели ассиметрии и эксцесса эмпирического распределения можно, используя функцию «Описательная статистика» в программе Excel.
Следующий момент, на который следует обратить особое внимание, относится к интерпретации психологического значения, выявляемого данным характером распределения. Что же выявляет кривая Гаусса в характеристике психологических явлений? Какой психологический смысл выявляет кривая распределения данных, оценок тестовых баллов исследуемого психологического признака?
Следует иметь в виду, что кривая распределения тестовых баллов (оценок, результатов выполнения заданий и т. д.), с одной стороны, отражает свойства пунктов, из которых составлен тест (задание) а с другой - характеризует состав выборки испытуемых, т. е. насколько успешно они справляются с заданием, насколько данный тест (задание) дифференцирует выборку по соответствующему качеству, признаку.
Если кривая имеет правостороннюю асимметрию, то это значит что в тесте преобладают трудные задания (для данной выборки); если кривая имеет левостороннюю асимметрию,
то значит, большинство пунктов в тесте легкие (слабые).
Таким образом, имеются два варианта объяснения:
1) тест (задание) плохо дифференцирует испытуемых с низким уровнем развития способностей (свойств, качеств, характеристик): большинство испытуемых получают примерно одинаковый - низкий балл;
2) тест хуже дифференцирует испытуемых с высоким развитием способностей (свойств, качеств, характеристик): большинство испытуемых получают достаточно высокий балл.
Анализ эксцесса кривой распределения позволяет сделать следующие выводы в зависимости от формы распределения показателей (данных, вариант) психологического признака:
В случае, когда возникает значительный положительный эксцесс (эксцессивная кривая) и вся масса баллов скучивается вблизи среднего значения, возможны следующие объяснения:
- ключ составлен неверно: объединены при подсчете отрицательно связанные признаки, которые взаимоуничтожают баллы. Но в практике психолога, который работает с валидными и надежными методиками, такие случаи исключаются (кроме собственной невнимательности и безответственности);
- испытуемые применяют, разгадав направленность теста (опросника), специальную тактику «медианного балла» - искусственно балансируя ответы «за» и «против» одного из полюсов измеряемого психологического признака;
- если подбираются пункты, тесно положительно коррелирующие между собой (т. е. испытания не являются статистически независимыми), то в распределении баллов возникает отрицательный эксцесс, принимающий форму плато;
- максимальных величин отрицательный эксцесс достигает по мере возрастания вогнутости вершины распределения - до образования двух вершин, двух мод (с «провалом» между ними). Такая бимодальная конфигурация распределения баллов указывает на то. что выборка испытуемых разделилась на две категории, подгруппы (с плавным переходом между ними): одни справились с большинством заданий (согласились с большинством вопросов), другие - не справились (не согласились). Такое распределение свидетельствует, что в основе заданий (пунктов) имеется какой-то один общий им всем признак, соответствующий определенному свойству испытуемых: если у испытуемых есть это свойство (способность, знание, умение), то они справляются с большинством пунктов заданий, если нет этого свойства, то не справляются.
Начать с анализа первичных статистик надо еще и по той причине, что они весьма чувствительны к наличию выпадающих вариант. Большие величины эксцесса и асимметрии часто являются индикаторами ошибок при подсчетах вручную или ошибок при вве-агпни данных через клавиатуру при компьютерной обработке. Грубые промахи при введении данных для обработки можно обнаружить, если сравнить величины сигм у аналогичных параметров. Выделяющаяся величиной сигма может указывать на ошибки.
Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особо ответственные - трижды), желательно, -разными способами с вариацией последовательности обращения к числовому массиву.
Иной причиной больших показателей эксцесса и асимметрии может оказаться недостаточная надежность и валидность методик, используемых для данной популяции.
В научных исследованиях по части (отдельной выборке) никогда не удается полностью охарактеризовать целое (генеральную совокупность, популяцию): всегда остается вероятность того, что оценка генеральной совокупности на основе выборочных данных недостаточно точна, имеет некоторые, большие или меньшие, ошибки. Такие ошибки, при обобщении, экстраполяции результатов, полученных при изучении отдельной выборки, на всю генеральную совокупность, называются ошибками репрезентативности.
Статистические ошибки репрезентативности показывают, в каких пределах могут отклоняться от параметров генеральной совокупности (от математического ожидания или истинных значений) частные определения, полученные на основе конкретных выборок. Очевидно, величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка. Это и отражено в формулах для вычисления статистических ошибок, характеризующих варьирование выборочных показателей относительно их генеральных параметров.
Поэтому в число первичных статистик обязательно входит статистическая ошибка средней арифметической. Формула для ее вычисления такова:
mM = +(-) q/n,
где: mn - ошибка средней арифметической; q - сигма, стандарта отклонение; n - число значений признака.
Перечисленные основные первичные статистики позволяют оценить характер распределения данных в экспериментальном массиве и использовать основные методы параметрической и непараметрической статистики для обоснования результатов эмпирического психологического исследования.