Корреляционный метод

Модификацией метода сравнения с эталоном является корреляционный метод, основанный на вычислении взаимокорреляционной функции между эталоном и изображением.

Корреляция -- статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.

Корреляционный анализ -- метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков для установления между ними статистических взаимосвязей.

Цель корреляционного анализа -- обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной А, произойдет одновременно с пропорциональным изменением значения Б.

Классификация изображений проводится по результату: чем больше значение функции взаимной корреляции, тем с большей вероятностью эталон совпадает с изображением. Используя обозначения, принятые в выражении, формулу для вычисления взаимокорреляционной функции К можно представить в виде

Максимальное значение взаимокорреляционной функции равно,

и достигается при полном совпадении изображения с эталоном. Нормированная взаимокорреляционная функция

при совпадении эталона с изображением достигает максимального значения, равного единице.

Использование корреляционного метода и метода прямого сравнения с эталоном предъявляет к процессу предварительной обработки изображений общие требования. Они заключаются в том, что изображение и эталон должны быть одинаково ориентированы, иметь равный масштаб и не быть сдвинутыми друг относительно друга в поле изображения. Другим свойством этих методов, которое следует учитывать, является необходимость использования большого количества эталонов. Это особенно важно в тех случаях, когда решаются задачи распознавания объектов изменением их проекции.

Распознавание через связь шаблонов

Поиск объектов указанием связей между шаблонами

Часто наблюдаемый объект обладает внутренними степенями свободы, а это означает, что его внешний вид может сильно варьироваться (например, люди могут двигать руками и ногами, рыбы деформируются при плавании, змеи извиваются и т.д.). Данное явление может чрезвычайно затруднить сравнение с шаблоном, поскольку потребуется либо классификатор с гибкими границами (и множество образцов), либо много различных шаблонов.

Многие объекты названного типа содержат небольшое число компонентов, довольно строго упорядоченных. Можно попытаться согласовать данные компоненты как шаблоны, а затем определить, какие объекты присутствуют, изучив предложенные связи между найденными шаблонами. Например, вместо поиска лица по одному полному шаблону лица, можно искать глаза, нос и рот с приемлемым взаимным расположением.

Данный подход имеет несколько потенциальных преимуществ. Во-первых, узнать шаблон глаза может быть легче, чем узнать шаблон лица, поскольку первая структура очевидно проще. Во-вторых, можно получить и использовать относительно простые вероятностные модели, поскольку могут существовать некоторые свойства независимости, которые можно будет использовать. В-третьих, возможно, удастся согласовать большое число объектов с относительно небольшим числом шаблонов. Хороший пример этого явления -- морды животных; почти все животные с характерными мордами имеют глаза, нос и рот, отличается лишь пространственное расположение этих элементов. Наконец, из сказанного следует, что для построения сложных объектов можно использовать простые отдельные шаблоны. Например, люди могут двигать руками и ногами, и похоже, что обучить цельный явный шаблон обнаруживать людей целиком значительно сложнее, чем получить отдельные шаблоны для частей тела и вероятностную модель, описывающую их степени свободы.

Рассматриваемая тема не настолько хорошо изучена, чтобы к ней выработался какой-либо стандартный подход. В то же время основной вопрос достаточно очевиден -- как закодировать набор связей между шаблонами в форму, с которой легко работать. В данной главе изучается ряд различных подходов к данной задаче. Во-первых, каждый шаблон может указывать на объекты, которые он может представлять, а затем каким-то образом считается число указателей. Если построить некоторую явную вероятностную модель, для описания деталей пространственных отношений можно использовать больше весовых коэффициентов. Данную модель можно получить из функций правдоподобия; по сути, нужна функция распределения вероятностей, дающая большое значение, когда конфигурация компонентов подобна объекту, и малое -- в противном случае. Тогда поиск объектов превращается в поиск шаблонов, которые при подстановке в вероятностную модель дают большие значения. Нужно отметить, что следует внимательно относиться к сокращению поиска. Сложность этого подхода заключается в том, что даже при сокращении поиск может быть дорогим. Как утверждают Форсайт и Понс, в то же время при определенном классе вероятностных моделей можно провести эффективный поиск .

Простые модели объектов могут обеспечивать достаточно эффективное распознавание. Простейшая модель -- это рассматривать объект как набор фрагментов изображения (небольших окрестностей элементов характерного вида) нескольких различных типов, формирующих образ (pattern). Чтобы определить, какой образ наблюдается, находятся все фрагменты, каждый из которых указывает на все образы, в которые он входит. То изображение, на которое было указано наибольшее число, и считается присутствующим. Хотя данная стратегия проста, она довольно эффективна. Ниже описываются методы поиска фрагментов, а затем представляется ряд последовательно усложняющихся реализаций данной стратегии.

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака, на него оказывают воздействие многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер и аналитически выражаются функцией вида:

y ср. x == f (x).

Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменений одной из случайных величин приводит к изменению математического ожидания другой.

В статистике принято различать следующие варианты зависимостей :

1. Парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными).

2. Частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3. Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование.

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определять “полезность” факторных признаков при построении уравнений множественной регрессии. Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

Первоначально исследования корреляции проводились в биологии, а позднее распространились и на другие области, в том числе и на социально-экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: корреляция оценивает силу (теснота) статистической связи, регрессия исследует ее форму . Та и другая служат для установления соотношения между явлениями, для определения наличия и отсутствия связи.

Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты, направления связи(корреляционный анализ) и установление аналитического выражения (формы) связи (регрессионный анализ).

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Регрессия может быть однофакторной (парной) и многофакторной (множественной) .

По форме зависимости различают:

1) линейную регрессию, которая выражается уравнениями прямой (линейной функцией) вида: Yср. x = а 0 + а 1 х

2) нелинейную регрессию, которая выражается уравнениями вида:

Парабола: Yср. x = а 0 + а 1 х + а 2 х 2

Гипербола: Yср. x = а 0 + а 1 / х и др.

По направлению связи различают:

1) прямую регрессию (положительную), возникающую при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;

2) обратную (отрицательную) регрессию, проявляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.

Положительную и отрицательную регрессии легче понять, если использовать их графическое изображение (см. рисунки ниже).

а) Прямая (положительная) регрессия.

б) Обратная (отрицательная) регрессия.

Рисунок 10 – Прямая и обратная регрессия

Для простой (парной) регрессии в условиях, когда достаточно полно установлены причинно-следственные связи, приобретает практический смысл только последнее положение; при множественности причинных связей невозможно четко разграничить одни причинные явления от других.

Итак, все явления и процессы, характеризующие социально-экономическое развитие и составляющие единую систему национальных счетов, тесно взаимосвязаны и взаимозависимы между собой. В статистике показатели, характеризующие эти явления, могут быть связаны либо корреляционной зависимостью , либо быть независимыми . Корреляционная зависимость является частным случаем стохастической зависимости, при которой изменение значений факторных признаков (х 1 , х 2 , х 3 ….х k) влечет за собой изменение среднего значения результативного признака. Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализов. Корреляционный анализ изучает взаимосвязи показателей и позволяет решить задачи: оценка тесноты связи между показателями с помощью парных, частных и множественных коэффициентов корреляции; оценка уровня регрессии. Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (Y) от факторных (х 1 , х 2 , х 3 ….х k). Уравнение регрессии, или статистическая модель связи социально-экономических явлений, выражаемая функцией: Yср. x = f (х 1 , х 2 , х 3 ….х k), является достаточно адекватной реальному

моделируемому явлению или процессу в случае соблюдения следующих требований их построения:

1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственной связи.

3. Все факторные признаки должны иметь количественное (цифровое) выражение.

4. Наличие достаточно большого объема исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами следует описывать линейной или приводимой к линейной формой зависимости.

6. Отсутствие количественных ограничений на параметры модели связи.

Постоянство территориальной и временной структуры изучаемой совокупности

Корреляция - это степень, в которой события или личные характеристики человека зависят друг от друга. Корреляционный метод - процедура в исследовании, использующаяся, чтобы определить взаимосвязь между переменными. Данный метод может, например, ответить на вопрос: «существует ли корреляция между количеством стресса, с которым сталкиваются люди и степенью испытываемой ими депрессии?» То есть, по мере того, как люди продолжают переживать стресс, насколько увеличивается вероятность того, что они впадут в депрессию?

Корреляция - степень зависимости друг от друга событий или характеристик.

Корреляционный метод - процедура исследований, которая используется для определения того, насколько события или характеристики зависят друг от друга.

Чтобы ответить на этот вопрос, исследователи подсчитывают баллы жизненного стресса (например, количество угрожающих событий, переживаемых человеком в определенный период времени) и баллы депрессии (например, баллы в опросниках по депрессии). Как правило, исследователи обнаруживают, что эти переменные увеличиваются или уменьшаются вместе (Stader & Hokanson, 1998; Paykel & Cooper, 1992). To есть чем больше количество баллов стресса в жизни определенного человека, тем выше его или ее сумма баллов по депрессии. Корреляции такого рода имеют позитивную направленность и их называют позитивной корреляцией.

Корреляция может иметь и негативную, а не позитивную направленность. При негативной корреляции, когда значение одной переменной возрастает, значение другой уменьшается. Исследователи обнаружили, например, негативную корреляцию между депрессией и уровнем активности. Чем больше депрессия человека, тем меньше его занятость.

Существует еще и третья взаимосвязь в корреляционном исследовании. Две переменные могут быть не взаимосвязаны, то есть между ними не существует последовательной взаимосвязи. Когда число одной переменной возрастает, показатели другой переменной иногда возрастают, иногда уменьшаются. Исследования обнаружили, например, что депрессия и интеллект не зависят друг от друга.

Кроме знания направленности корреляции исследователям нужно знать ее величину или силу. То есть насколько близко эти две переменные соотносятся между собой. Действительно ли одна переменная всегда зависит от другой или их взаимосвязь менее определенна? Когда обнаруживается тесная взаимосвязь двух переменных у многих испытуемых, то говорят, что корреляция - высокая или устойчивая.

Направленность и величина корреляции часто имеет численное значение и выражается в статистическом понятии - коэффициенте корреляции ( r ). Коэффициент корреляции может варьироваться от +1.00, показывающего полную позитивную корреляцию между двумя переменными, и до -1.00 - этот коэффициент указывает на полную негативную корреляцию. Знак коэффициента (+ или -) обозначает направленность корреляции; число представляет ее величину. Чем ближе коэффициент к 0, тем слабее корреляция и меньше ее величина. Так корреляции +0.75 и -0.75 имеют одинаковые величины, а корреляция +.25 слабее и той и другой корреляции.

Коэффициент корреляции ( r ) - статистический термин, указывающий направленность и величину корреляции, колеблющийся от -1.00 до +1.00.

Поведение людей меняется, и многие человеческие реакции можно оценивать лишь приблизительно. Поэтому в психологических исследованиях корреляции не достигают величины полной позитивной или полной негативной корреляции. В одном исследовании стресса и депрессии, проводившемся с 68 взрослыми, корреляция между двумя переменными составила +0.53 (Miller et al., 1976). Несмотря на то, что эту корреляцию едва ли можно назвать абсолютной, ее величина в психологическом исследовании считается большой.

Статистический анализ корреляционных данных

Ученые должны решить, действительно ли корреляция, обнаруженная ими в данной группе испытуемых, точно отражает подлинную корреляцию в общем населении. Может ли наблюдаемая корреляция возникать только случайно? Ученые могут протестировать свои выводы при помощи статистического анализа данных, применив принципы вероятности. В сущности, они задаются вопросом, насколько вероятно, что данные отдельного исследования были получены случайно. Если статистический анализ указывает на очень малую вероятность того, что обнаруженная корреляция была получена случайно, то исследователи называют корреляцию статистически значимой и делают вывод, что их данные отражают подлинную корреляцию, встречающуюся повсеместно.

Преимущества и недостатки корреляционного метода

У корреляционного метода есть некоторые преимущества по сравнению с изучением отдельных случаев болезни. Поскольку исследователи получают свои переменные, основываясь на многочисленных примерах, и применяют статистический анализ, то они лучше могут обобщить данные о людях, которых изучали. Исследователи также могут повторить корреляционные исследования на новых испытуемых, чтобы проверить результаты своих изысканий.

Несмотря на то, что корреляционные исследования позволяют исследователям описать взаимосвязь между двумя переменными, они не объясняют эту взаимосвязь. Когда мы взглянем на позитивную корреляцию, обнаруживающуюся при исследовании разных жизненных стрессов, у нас может возникнуть искушение сделать вывод, что усиление стресса приводит к более сильной депрессии. На самом деле, однако, эти две переменные могли коррелировать по одной из трех причин: 1) жизненный стресс может приводить к депрессии; 2) депрессия может заставить людей перенести более сильный стресс (например, депрессивный подход к жизни приводит к тому, что люди будут неправильно распоряжаться деньгами или депрессия негативно скажется на их социальных взаимоотношениях); 3) депрессия и жизненный стресс могут быть обусловлены третьей переменной, такой как бедность. Вопросы причинности требуют применения экспериментального метода.

<Вопросы для размышления. Как бы вы объяснили значительную корреляцию между жизненным стрессом и депрессией? Какая из интерпретаций, по вашему мнению, наиболее точна?>

Особые формы корреляционного исследования

Клиницисты широко используют два типа корреляционных исследований - эпидемиологические исследования и долгосрочные (лонгитюдные) исследования. В ходе эпидемиологических исследований обнаруживается общее число случаев и распространенность определенного расстройства среди указанной части населения (Weissman, 1995). Число случаев - это количество новых случаев расстройств, возникших за данный период времени. Распространенность - общее число случаев среди населения в данный период времени; распространенность расстройства или заболевания включает как уже существующие, так и новые случаи.

За прошедшие двадцать лет клиницисты в США разработали самое обширное эпидемиологическое исследование, которое когда-либо проводилось, и назвали его Районным эпидемиологическим исследованием. Они взяли интервью более чем у 20 000 людей в пяти городах, чтобы выяснить преобладание разных психических расстройств и то, какие программы применялись для их лечения (Regier et al., 1993). Это исследование сравнивалось в эпидемиологическими исследованиями в других странах, чтобы проверить, как уровни психических расстройств и программы лечения варьируются в разных странах мира (Weissman, 1995).

<Близнецы, корреляция и наследственность. Корреляционные исследования многих пар близнецов позволяют сделать вывод о возможной взаимосвязи между генетическими факторами и некоторыми психическими расстройствами. Идентичные близнецы (близнецы, которые, как и изображенные здесь, обладают идентичными генами) проявляют высокую степень корреляции при некоторых расстройствах, и эта корреляция выше, чем у неидентичных близнецов (с неидентичными генами).>

Такие эпидемиологические исследования помогают психологам выделить группы риска, предрасположенные к определенным расстройствам. Оказывается, что среди женщин превалирует уровень расстройств, связанных с тревожным состоянием и депрессией, в отличие от мужчин, среди которых преобладает более высокий уровень алкоголизма, чем у женщин. У пожилых людей уровень суицида выше, чем у людей помоложе. У людей в некоторых не западных странах (например, в Тайване) уровень психической дисфункции выше, чем на Западе. Эти тенденции приводят исследователей к предположению, что какие-то особые факторы и среда провоцируют определенные типы расстройств (Rogers & Holloway, 1990). Так, ухудшение здоровья у пожилых людей с большей вероятностью приводит их к самоубийству; культурные прессы или установки, распространенные в одной стране, приводят к определенному уровню психических дисфункций, отличающемуся от уровня тех же дисфункций в другой стране.

Эпидемиологическое исследование - исследование, которое определяет число случаев заболевания и его распространенность среди данного слоя населения.

Число случаев заболевания - количество новых случаев расстройства, возникающих в данном слое населения в определенный период времени.

Распространенность - общее число случаев расстройств, возникающих в данном слое населения за определенный период времени.

Проводя долгосрочные исследования, психологи наблюдают тех же самых испытуемых в разных ситуациях на протяжении длительного периода времени. В одном таком опыте ученые наблюдали в течение многих лет развитие нормально функционирующих детей, чьи отец или мать страдали от шизофрении (Parnas, 1988; Mednick, 1971). Исследователи обнаружили среди прочего, что дети родителей с тяжелыми формами шизофрении чаще обнаруживали психические отклонения и совершали преступления на поздних стадиях своего развития.

Долгосрочное (лонгитюдное) исследование - исследование, в котором те же самые испытуемые наблюдаются в течение длительного периода времени.

Все явления в природе и обществе находятся во взаимной связи. Выяснение

наличия связей между изучаемыми явлениями ― одна из важных

задач статистики. Многие медико-биологические и медико-социальные

исследования требуют установления вида связи (зависимости) между

случайными величинами. Сама постановка большого круга задач

в медицинских исследовательских работах предполагает построение

и реализацию алгоритмов «фактор ― отклик», «доза ― эффект».

Зачастую нужно установить наличие эффекта при имеющейся дозе

и оценить количественно полученный эффект в зависимости от дозы. Решение

этой задачи напрямую связано с вопросом прогнозирования определенного

эффекта и дальнейшего изучения механизма возникновения именно такого

Как известно, случайные величины X и Y могут быть либо независимыми,

либо зависимыми. Зависимость случайных величин подразделяется на

функциональную и статистическую (корреляционную).

Функциональная зависимость ― такой вид зависимости, когда каждому

значению одного признака соответствует точное значение другого.

В математике функциональную зависимость переменной X от переменной

Y называют зависимостью вида X= f (Y), где каждому допустимому значению

Y ставится в соответствие по определенному правилу единственно возможное

значение X.

Например: взаимосвязь площади круга (S) и длины окружности (L). Известно,

что площадь круга и длина окружности связаны вполне определенным

отношением S = r L, где r – радиус круга. Умножив длину окружности

на половину ее радиуса, можно точно определить площадь крута. Такую

изменение одного признака изменением другого. Этот вид связи характерен

для объектов, являющихся сферой приложения точных наук.

В медико-биологических исследованиях сталкиваться с функциональной

связью приходится крайне редко, поскольку объекты этих исследований

имеют большую индивидуальную вариабельность (изменчивость). С

другой стороны, характеристики биологических объектов зависят,

как правило, от комплекса большого числа сложных взаимосвязей и не могут

быть сведены к отношению двух или трех факторов. Во многих

медицинских исследованиях требуется выявить зависимость какой-либо

величины, характеризующей результативный признак, от нескольких

факториальных признаков.

Дело в том, что на формирование значений случайных величин X и Y

оказывают влияние различные факторы. Обе величины ― и X, и

Y ― являются случайными, но так как имеются общие факторы, оказывающие

влияние на них, то X и Y обязательно будут взаимосвязаны. И связь эта

уже не будет функциональной, поскольку в медицине и биологии часто

бывают факторы, влияющие лишь на одну из случайных величин и

разрушающие прямую (функциональную) зависимость между значениями

X и Y. Связь носит вероятностный, случайный характер, в численном выражении

меняясь от испытания к испытанию, но эта связь определенно присутствует

и называется корреляционной.

Корреляционной является зависимость массы тела от роста, поскольку

на нее влияют и многие другие факторы (питание, здоровье,

наследственность и т.д.). Каждому значению роста (X) соответствует множество

значений массы (Y), причем, несмотря на общую тенденцию, справедливую

для средних: большему значению роста соответствует и большее

значение массы, ― в отдельных наблюдениях субъект с большим ростом

может иметь и меньшую массу. Корреляционной будет зависимость

заболеваемости от воздействия внешних факторов, например

запыленности, уровня радиации, солнечной активности и т.д. Имеется

корреляционная зависимость между дозой ионизирующего излучения и

числом мутаций, между пигментом волос человека и цветом глаз, между

показателями уровня жизни населения и смертностью, между числом

пропущенных студентами лекций и оценкой на экзамене.

Именно корреляционная зависимость наиболее часто встречается в

природе в силу взаимовлияния и тесного переплетения огромного множества

самых разных факторов, определяющих значение изучаемых показателей.

Корреляционная зависимость ― это зависимость, когда при изменении

одной величины изменяется среднее значение другой.

Строго говоря, термин «зависимость» при статистической обработке

материалов медико-биологических исследований должен использоваться

весьма осторожно. Это связано с природой статистического анализа,

который сам по себе не может вскрыть истинных причинно-следственных

отношений между факторами, нередко опосредованными третьими факторами,

причем эти третьи факторы могут лежать вообще вне поля зрения

исследователя. С помощью статистических критериев можно дать только

формальную оценку взаимосвязей. Попытки механически

перенести данные статистических расчетов в объективную реальность

могут привести к ошибочным выводам. Например, утверждение: «Чем

громче утром кричат воробьи, тем выше встает солнце», несмотря на явную

несуразность, с точки зрения формальной статистики вполне правомерно.

Таким образом, термин «зависимость» в статистическом анализе подразумевает

только оценку соответствующих статистических критериев.

Корреляционные связи называют также статистическими (например,

зависимость уровня заболеваемости от возраста населения). Эти связи

непостоянны, они колеблются от нуля до единицы. Ноль означает отсутствие

зависимости между признаками, а единица ― полную, или функциональную,

связь, когда имеется зависимость только от одного признака.

Мерой измерения статистической зависимости служат раз личные

коэффициенты корреляции. Выбор метода для определения взаимосвязей

обусловлен видом самих признаков и способами их группировки.

Для количественных данных применяют линейную регрессию и

коэффициент линейной корреляции Пирсона. Для качественных признаков

применяются таблицы сопряженности и рассчитываемые на их основе

коэффициенты сопряженности (С и Ф), Чупрова (К). Для при знаков,

сформированных в порядковой (ранговой, балльной) шкале, можно применять

ранговые коэффициенты корреляции Спирмена или Кендэла.

Любую существующую зависимость по направлению связи можно

подразделить на прямую и обратную. Прямая зависимость

― это зависимость, при которой увеличение или уменьшение значения

одного признака ведет, соответственно, к увеличению или уменьшению второго.

Например: при увеличении температуры возрастает давление газа

(при его неизменном объеме), при уменьшении температуры снижается

и давление. Обратная зависимость имеется тогда, когда при увеличении

одного признака второй уменьшается, и наоборот: при уменьшении

одного второй увеличивается. Обратная зависимость, или обратная

связь, является основой нормального регулирования почти

всех процессов жизнедеятельности любого организма.

Оценка силы корреляционной связи проводится в соответствии со шкалой тесноты.

Если размеры коэффициента корреляции от ±0,9(9) до ±0,7, то связь

сильная, коэффициенты корреляции от ±0,31 до ±0,69 отражают связь средней

силы, а коэффициенты от ±0,3 до нуля характеризуют слабую связь.

Известное представление о наличии или отсутствии корреляционной связи

между изучаемыми явлениями или признаками (например, между массой тела и

ростом) можно получить графически, не прибегая к специальным расчетам. Для

этого достаточно на чертеже в системе прямоугольных координат отложить,

например,

на оси абсцисс величины роста, а на оси ординат ― массы тела и нанести ряд точек,

каждая из которых соответствует индивидуальной величине веса при данном

росте обследуемого. Если полученные точки располагаются кучно по наклонной

прямой к осям ординат в виде овала (эллипса) или по кривой линии,

то это свидетельствует о зависимости между явлениями. Если же точки

расположены беспорядочно или на прямой, параллельной абсциссе либо ординате,

то это говорит об отсутствии зависимости.

По форме корреляционные связи подразделяются на прямолинейные, когда

наблюдается пропорциональное изменение одного признака в зависимости от

изменения другого (графически эти связи изображаются в виде прямой линии или

близкой к ней), и криволинейные, когда одна величина признака

Не со всеми проблемами можно справиться экспериментальным методом. Существует множество ситуаций, когда исследователь не может контролировать, какие испытуемые попадают в те или иные условия. Например, если надо проверить гипотезу, что люди с анорексией более чувствительны к изменениям вкуса, чем люди с нормальным весом, то не можем же мы собрать группу испытуемых с нормальным весом и потребовать, чтобы у половины из них появилась анорексия! На самом деле нам придется отобрать людей, уже страдающих анорексией, и тех, у кого вес в норме, и проверить, различаются ли они также по вкусовой чувствительности. Вообще говоря, можно использовать метод корреляций, чтобы определить связана ли некоторая переменная, которую мы не можем контролировать, с другой интересующей нас переменной, или, иначе говоря, коррелируют ли они между собой.

В вышеприведенном примере у переменной веса есть только два значения -- нормальный и анорексичный. Чаще случается, что каждая из переменных может принимать много значений, и тогда надо определить, насколько величины одной и другой переменной коррелируют между собой. Определить это может статистический параметр, называемый коэффициентом корреляции и обозначаемый буквой r. Коэффициент корреляции позволяет оценить, насколько связаны две переменные, и выражается числом от -1 до +1. Ноль означает отсутствие связи; полная связь выражается единицей (+1, если отношение положительное, и -1, если оно отрицательное). По мере увеличения r от 0 до 1 сила связи возрастает.

Рис.6.

Эти гипотетические данные принадлежат 10 пациентам, каждый из которых имеет некоторое повреждение участков мозга, ответственных, насколько известно, за узнавание лиц. На рис. 6а пациенты располагаются вдоль горизонтали соответственно объему повреждения мозга, причем самая левая точка показывает пациента с наименьшим повреждением (10%), а самая правая точка показывает пациента с наибольшим повреждением (55%). Каждая точка на графике отражает показатель для отдельного пациента в тесте на узнавание лиц. Корреляция положительная и равна 0,90. На рис. 6б изображены те же самые данные, но теперь они показывают долю правильных ответов, а не ошибок. Здесь корреляция отрицательная, равная -0,90. На рис..6в успехи пациентов в тесте на распознавание отображены в зависимости от их роста. Здесь корреляция равна нулю.

Суть коэффициента корреляции можно пояснить на примере графического представления данных гипотетического исследования. Как показано на рис. 6а, в исследовании участвуют пациенты, о которых заранее известно, что у них поврежден мозг, и это вызвало разной степени трудности в узнавании лиц (прозопагнозия). Предстоит выяснить, возрастает ли трудность, или ошибка узнавания лиц, с увеличением процента поврежденной мозговой ткани. Каждая точка на графике 6а показывает результат для отдельного пациента при его тестировании на узнавание лиц. Например, пациент с 10%-ным повреждением ошибался в тесте на распознавание лиц в 15% случаев, а пациент с 55%-ным повреждением делал ошибки в 95% случаев. Если бы ошибка узнавания лиц постоянно возрастала с увеличением процента повреждения мозга, точки на графике располагались бы все время выше при движении слева направо; если бы они размещались на диагонали рисунка, коэффициент корреляции был бы r = 1,0. Однако несколько точек расположены по разные стороны этой линии, поэтому корреляция составляет около 90%. Корреляция 90% означает очень сильную связь между объемом поврежденного мозга и ошибками узнавания лиц. Корреляция на рис. 6а -- положительная, поскольку большее повреждение мозга вызывает больше ошибок.

Если бы вместо ошибок мы решили отобразить долю правильных ответов в тесте на распознавание, то получили бы график, изображенный на рис. 6б. Здесь корреляция отрицательная (равная примерно -0,90), поскольку с увеличением повреждения мозга доля правильных ответов уменьшается. Диагональ на рис. 6б -- это просто инверсный вариант той, что на предыдущем рисунке.

Наконец, обратимся к графику на рис. 6в. Здесь отображена доля ошибок пациентов в тесте на распознавание лиц в зависимости от их роста. Разумеется, нет оснований считать, что доля узнанных лиц связана с ростом пациента, и график подтверждает это. При движении слева направо точки не проявляют согласованного движения ни вниз, ни вверх, а разбросаны вокруг горизонтальной линии. Корреляция равна нулю.

Числовой метод вычисления коэффициента корреляции описан в Приложении II. Сейчас, однако, мы сформулируем несколько элементарных правил, которые помогут вам разобраться с коэффициентом корреляции, когда вы встретитесь с ним в последующих главах.

Корреляция бывает положительной (+) и отрицательной (-). Знак корреляции показывает, связаны ли две переменные положительной корреляцией (величина обеих переменных растет или уменьшается одновременно) или отрицательной корреляцией (одна переменная растет при уменьшении другой). Предположим, например, что количество пропусков занятий студентом имеет корреляцию -0,40 с баллами в конце семестра (чем больше пропусков, тем меньше баллов). С другой стороны, корреляция между полученными баллами и количеством посещенных занятий будет +0,40. Прочность связи одна и та же, но знак ее зависит от того, считаем ли мы пропущенные или посещенные занятия.

По мере усиления связи двух переменных r увеличивается от 0 до 1. Чтобы лучше это представить, рассмотрим несколько известных положительных коэффициентов корреляции:

Коэффициент корреляции между баллами, полученными в первый год обучения в колледже, и баллами, полученными на втором году, составляет около 0,75.

Корреляция между показателями геста на интеллект в возрасте 7 лет и при повторном тестировании в 18 лет составляет примерно 0,70.

Корреляция между ростом одного из родителей и ростом ребенка во взрослом возрасте, составляет около 0,50.

Корреляция между результатами теста на способность к обучению, полученными в школе и в колледже, равна примерно 0,40.

Корреляция между баллами, полученными индивидуумами в бланковых тестах, и суждением психолога-эксперта об их личностных качествах составляет около 0,25.

В психологических исследованиях коэффициент корреляции 0,60 и выше считается достаточно высоким. Корреляция в диапазоне от 0,20 до 0,60 имеет практическую и теоретическую ценность и полезна при выдвижении предсказаний. К корреляции от 0 до 0,20 следует относиться осторожно, при выдвижении предсказаний ее польза минимальна.

Тесты. Знакомый пример использования корреляционного метода -- тесты по измерению некоторых способностей, достижений и других психологических качеств. При тестировании группе людей, различающихся по какому-нибудь качеству (например, математическим способностям, ловкости рук или агрессивности), предъявляют некоторую стандартную ситуацию. Затем можно вычислить корреляцию между изменениями показателей данного теста и изменением другой переменной. Например, можно установить корреляцию между показателями группы студентов в тесте на математические способности и их оценками по математике при дальнейшем обучении в колледже; если корреляция значительная, то на основе результатов этого теста можно решить, кого из нового набора студентов можно перевести в группу с повышенными требованиями.

Тестирование -- важный инструмент психологических исследований. Оно позволяет психологам получать большое количество данных о людях с минимальным отрывом их от повседневных дел и без применения сложного лабораторного оборудования. Построение тестов включает множество этапов, которые мы подробно рассмотрим в последующих главах.

Корреляция и причинно-следственные связи. Между экспериментальными и корреляционными исследованиями есть важное различие. Как правило, в экспериментальном исследовании систематически манипулируют одной переменной (независимой) с целью определить ее причинное воздействие на некоторые другие переменные (зависимые). Такие причинно-следственные связи нельзя вывести из корреляционных исследований. Ошибочное понимание корреляции как причинно-следственного отношения можно проиллюстрировать на следующих примерах. Может существовать корреляция между мягкостью асфальта на улицах города и количеством солнечных ударов, случившихся за день, но отсюда не следует, что размягченный асфальт выделяет какой-то яд, приводящий людей на больничную койку. На самом деле изменение обеих этих переменных -- мягкости асфальта и числа солнечных ударов -- вызывается третьим фактором -- солнечным теплом. Еще один простой пример -- высокая положительная корреляция между большим количеством аистов, гнездящихся во французских деревнях, и высокой рождаемостью, зарегистрированной там же. Предоставим изобретательным читателям самим догадываться о возможных причинах такой корреляции, не прибегая к постулированию причинно-следственной связи между аистами и младенцами. Эти примеры служат достаточным предостережением от понимания корреляции как причинно-следственного отношения. Если между двумя переменными есть корреляция, изменение одной может вызывать изменения другой, но без специальных экспериментов такой вывод будет неоправданным.