Главная » 10-11 классы » Качественные методы обработки данных в психологии. Различают количественную и качественную обработку данных. Вопросы для обсуждения

Качественные методы обработки данных в психологии. Различают количественную и качественную обработку данных. Вопросы для обсуждения

Математические методы в психологии используются как средство повышения надежности, объективности, точности получаемых данных. Эти методы становятся необходимыми, когда исследователь работает одновременно с несколькими переменными, с набором гипотез, с большим эмпирическим материалом.

К методам обработки данных относят и качественный анализ. Качественный анализ (дифференциация материала по типам, группам, вариантам) позволяет создавать классификации, типологии и т.п. Одним из обрабатывающих способов качественного анализа является психологическая казуистика – описание случаев, как наиболее типичных для данной популяции.

Генетический метод интерпретирует весь обработанный материал исследования в характеристиках развития, выделяя фазы, стадии процесса становления психических функций, свойств личности. С его помощью можно исследовать происхождение и развитие у ребенка тех или иных психических процессов, изучить, какие этапы в него включены, какие факторы на него влияют. Генетический метод включает в себя метод поперечных срезов и метод продольных срезов (лонгитюдный), применяется в возрастной и генетической психологии. Лонгитюдный метод предполагает многократные обследования одних и тех же лиц на протяжении многих лет. Метод поперечных срезов осуществляется при прослеживании и сравнении того. Как выполняются одни и те же задачи на последовательных ступенях развития ребенка.

Структурный метод интерпретирует весь обработанный материал исследования в характеристиках систем и типов связей между ними, образующих личность, социальную группу и т.д.

Теоретические методы психологического исследования : а) дедуктивный – восхождение от общего к частному, от абстрактного к конкретному; результатом становится теория, закон; б) индуктивный – обобщение фактов, восхождение от частного к общему; результатом становится гипотеза, закономерность, классификация, систематизация; в) моделирование - умозаключение от частного к частному, когда в качестве аналога более сложного объекта берется более простой и доступный для исследования; результатом становится модель объекта, процесса, состояния.

Метод моделирования . Моделирование применяется тогда, когда изучение исследуемого явления с помощью наблюдения, эксперимента, опроса затруднено в силу его сложности и недоступности, или по моральным соображениям. Такими объектами, например, являются Вселенная, Солнечная система, человек как объект психофармакологических исследований. Модели могут быть техническими, логическими, математическими, кибернетическими. В медицине и психологии модели могут быть биологическими – крысы, обезьяны, кролики. Модель является аналогом изучаемого объекта.

Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формулами, требующими высокого уровня абстрагирования.

Однако, как говорит Мак-Коннелл, статистика - это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок, предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, — нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.

Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных. В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях.

Для того чтобы оценить огромные преимущества, которые может дать статистика, мы попробуем проследить за ходом расшифровки и обработки данных, полученных в эксперименте. Тем самым, исходя из конкретных результатов и тех вопросов, которые они ставят перед исследователем, мы сможем разобраться в различных методиках и несложных способах их применения. Однако, перед тем как приступить к этой работе, нам будет полезно рассмотреть в самых общих чертах три главных раздела статистики.

1. Описательная статистика , как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков

данные того или иного распределения , вычислять среднее для данного распределения и его размах и дисперсию .

2. Задача индуктивной статистики - проверка того, можно ли распространить результаты, полученные на данной выборке , на всю популяцию , из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают какие-то выводы и обобщения, исходя из данных, полученных при изучении выборки.

3. Наконец, измерение корреляции позволяет узнать, насколько связаны между собой две переменные, с тем чтобы можно было предсказывать возможные значения одной из них, если мы знаем другую.

Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность - это наиболее широко применяемые параметрические методы , в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность - это непараметрические методы , оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения. Когда мы познакомимся с различными способами описания данных и перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности.

Как уже говорилось, для того чтобы попытаться разобраться в этих различных областях статистики, мы попробуем ответить на те вопросы, которые возникают в связи с результатами того или иного исследования. В качестве примера мы возьмем один эксперимент, а именно - изучение влияния потребления марихуаны на глазодвигательную координацию и на время реакции. Методика, используемая в этом гипотетическом эксперименте, а также результаты, которые мы могли бы в нем получить, представлены ниже.

При желании вы можете заменить какие-то конкретные детали этого эксперимента на другие - например, потребление марихуаны на потребление алкоголя или лишение сна, - или, что еще лучше, подставить вместо этих гипотетических данных те, которые вы действительно получили в вашем собственном исследовании. В любом случае вам придется принять «правила нашей игры» и выполнять те расчеты, которые здесь от вас потребуются; только при этом условии до вас «дойдет» существо предмета, если это уже не случилось с вами раньше.

Важное примечание. В разделах, посвященных описательной и индуктивной статистике, мы будем рассматривать только те данные эксперимента, которые имеют отношение к зависимой переменной «поражаемые мишени». Что касается такого показателя, как время реакции, то мы обратимся к нему только в разделе о вычислении корреляции. Однако само собой разумеется, что уже с самого начала значения этого показателя надо обрабатывать так же, как и переменную «поражаемые мишени». Мы предоставляем читателю заняться этим самостоятельно с помощью карандаша и бумаги.

Некоторые основные понятия. Популяция и выборка

Одна из задач статистики состоит в том, чтобы анализировать данные, полученные на части популяции, с целью сделать выводы относительно популяции в целом.

Популяция в статистике не обязательно означает какую-либо группу людей или естественное сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую совокупность, будь то атомы или студенты, посещающие то или иное кафе.

Выборка - этонебольшое количество элементов, отобранных с помощью научных методов так, чтобы она была репрезентативной, т.е. отражала популяцию в целом.

(В отечественной литературе более распространены термины соответственно «генеральная совокупность» и «выборочная совокупность». - Прим. перев. )

Данные и их разновидности

Данные в статистике - это основные элементы, подлежащие анализу. Данными могут быть какие-то количественные результаты, свойства, присущие определенным членам популяции, место в той или иной последовательности - в общем любая информация, которая может быть классифицирована или разбита на категории с целью обработки.

Не следует смешивать «данные» с теми «значениями», которые эти данные могут принимать. Для того чтобы всегда различать их, Шатийон (Chatillon, 1977) рекомендует запомнить следующую фразу: «Данные часто принимают одни и те же значения» (так, если мы возьмем, например, шесть данных - 8, 13, 10, 8, 10 и 5, то они принимают лишь четыре разных значения - 5, 8, 10 и 13).

Построение распределения - это разделение первичных данных, полученных на выборке, на классы или категории с целью получить обобщенную упорядоченную картину, позволяющую их анализировать.

Существуют три типа данных:

1. Количественные данные , получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирования и т. п.). Их можно распределить по шкале с равными интервалами.

2. Порядковые данные , соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастающем порядке (1-й, ..., 7-й, ..., 100-й, ...; А, Б, В. ...).

3. Качественные данные , представляющие собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число лиц с голубыми или с зелеными глазами, курильщиков и не курильщиков, утомленных и отдохнувших, сильных и слабых и т.п.).

Из всех этих типов данных только количественные данные можно анализировать с помощью методов, в основе которых лежат параметры (такие, например, как средняя арифметическая). Но даже к количественным данным такие методы можно применить лишь в том случае, если число этих данных достаточно, чтобы проявилось нормальное распределение. Итак, для использования параметрических методов в принципе необходимы три условия: данные должны быть количественными, их число должно быть достаточным, а их распределение - нормальным. Во всех остальных случаях всегда рекомендуется использовать непараметрические методы.

Классификация l l l это распределение множества объектов по группам (классам) в зависимости от их общих признаков Результат: совокупность классов, которую, как и сам процесс группировки, называют классификацией. Классификация бывает: А) естественная – на основе существенного признака (например, предметный каталог в библиотеке, интровертированность – экстравертированность) Б) искусственная – на основе несущественного для самих объектов признака (например, алфавитный каталог)

Психологические портреты работников с различным уровнем ПС Параметры сравнения Работник с высоким уровнем профессионального стресса Работник с низким уровнем профессионального стресса Уровень невротизации высокий низкий Уровень напряжения и переутомления высокий низкий Способность ориентации во времени ориентируется лишь на один из отрезков временной шкалы (прошлое, настоящее или будущее) и (или) дискретное восприятие своего жизненного пути живет настоящим, т. е. переживает настоящий момент своей жизни во всей его полноте, а не просто как фатальное следствие прошлого или подготовку к будущей «настоящей жизни» ; ощущает неразрывность прошлого, настоящего и будущего, воспринимает мир целостно Зависимость от внешних обстоятельств высокой степени зависимости, конформности, несамостоятельности («извне направляемая» личность), внешний локус контроля относительно независим в своих поступках, стремится руководствоваться в жизни собственными целями, убеждениями, установками и принципами, что, однако, не означает враждебности к окружающим и конфронтации с групповыми нормами; свободен в выборе, не подвержен внешнему влиянию («изнутри направляемая» личность) Уровень самоактуализации низкий высокий Способность к установлению контактов Низкий уровень субъект-субъектного взаимодействия способен к быстрому установлению глубоких и тесных эмоционально-насыщенных контактов с людьми

Типологизация l l l это группировка объектов по наиболее существенным для них системам признаков. Результат: типология как совокупность типов (типы темперамента, типы личности и т. д.) В психологической науке известны четыре вида типологий: 1) конституциональные (типологии Э. Кречмера и У. Шелдона); 2) психологические (типологии К. Юнга, К. Леонгарда, А. Е. Личко, Г. Шмишека, Г. Айзенка); 3) социальные (типы руководства и лидерства); 4) астропсихологические (гороскопы).

Особенности характеристик ценностно смысловой сферы личности студентов с разным типом отношения к профессии II тип IV тип Более или менее адекватные представления, считается престижной Занижены (непрестижная, не способна удовлетворить важные жизненные потребности) I тип Представления о профессии Завышены (весьма престижна, способна удовлетворить важные жизненные потребности) Занижены Доминирующие ценности Компетентность, творчество, стабильность, служение, карьерный рост Уважение, признание, творчество, стабильность работы, менеджмент, польза для общества Высокая заработная плата, автономия, служение, интеграция всех стилей жизни Самостоятельность, менеджмент, независимость, предпринимательство, высокая заработная плата. Отношение к учебе в вузе Положительное, повышенный интерес к предметам специализации. Достаточно нейтральное Интерес ко всем вузовским предметам Неудовлетворенность процессом обучения, наименьший интерес представляют дисциплины специализации Степень включенности профессии в СЖ контекст Высокая Средняя Достаточно высокая Низкая Удовлетворенность некоторыми сторонами собственной жизни Неудовлетворенность различными сторонами собственной жизни Особенности самооценки Удовлетворенность различными сторонами собственной жизни Удовлетворенность некоторыми сторонами собственной жизни Профессиональные планы Связаны с получаемой профессией или близкие к ней, имеются намерения продолжить обучение в аспирантуре или магистратуре Отдаленно связаны с получаемой профессией, нацеленность на получение второго высшего образования, напрямую не связанного с первым Связаны с получаемой профессией или близкие к ней Не связаны с получаемой профессией Особенности жизненной перспективы Оптимистичная Менее оптимистична Достаточно оптимистическая Менее оптимистична

Отличие классификации от типологизации l l Класс- это некоторое множество сходных реальных объектов. Тип - это идеальный образец, на который в той или иной степени похожи реальные объекты.

Систематизация l это упорядочивание объектов внутри классов, классов между собой и множества классов с другими множествами классов. Это структурирование элементов внутри систем разных уровней (объектов в классах, классов в их множестве и т. д.) и сопряжение этих систем с другими одноуровневыми системами, что позволяет получать системы более высокого уровня организации и обобщенности. l На практике систематизация выливается в многоуровневую классификацию. Примеры: систематики растительного и животного мира; систематика наук (в частности, наук о человеке); систематика психологических методов; систематика психических процессов; систематика свойств личности; систематика психических состояний.

Периодизация l l l это хронологическое упорядочивание существо вания изучаемого объекта (явления). Суть: разделение жизненного цикла объекта на существенные этапы (периоды). Каждый этап обычно соответствует значительным изменениям (количественным или качественным) в объекте, что можно соотнести с философской категорией «скачок» . Примеры периодизации в психологии: периодизация онтогенеза человека; этапы социализации личности; этапы и фазы развития группы (групповая динамика) и др.

Периодизация психического развития по В. И. Слободчикову Ступени развития субъектности Период становления событийности Период становления самобытности Кризисы рождения Стадии принятия Кризисы развития Младенчество 6 - 12 мес I. Оживление Родовой кризис -2 мес - +3 недели Новорожденность 0, 5 - 4, 0 мес Кризис новорожденности 3, 5 - 7 мес Младенчество 6 - 12 мес II. Одушевление Кризис младенчества 11 - 18 мес Раннее детство 1, 5 - 3, 0 года Кризис раннего детства 2, 5 - 3, 5 года Дошкольное детство 3 года - 6, 5 лет III. Персонализация Кризис детства 5, 5 - 7, 5 лет Отрочество 6, 5 - 11, 5 лет Кризис отрочества 11 - 14 лет Юность 13 - 18 лет IV. Индивидуализация Кризис юности 17 - 21 год Молодость 19 - 28 лет Кризис молодости 27 - 33 года Взрослость 32 - 42 года V. Универсализация Кризис взрослости 39 - 45 лет Зрелость 44 - 60 лет Кризис зрелости 55 - 65 лет Старость 62- Кризис индивидуальной жизни

Психологическая казуистика l l это описание и анализ как наиболее типичных, так и исключительных для исследуемой реальности случаев дифференциальной и практической психологии. Пример: метод инцидентов в профессиографии.

В рамках психологии можно выделить два основных подхода к сбору данных - качественный и количественный. При количественном подходе информация преобразуется в числа. Примерами могут послужить заполнение анкеты или ответы на вопросы, связанные с тем, до какой степени люди согласны или не согласны с определенными высказываниями. Ответы можно оценивать в баллах, соответствующих взглядам отвечающих. Одно из преимуществ количественного метода заключается в том, что с его помощью можно проверять гипотезы и легко проводить сравнение различных социальных групп - например, работающих и безработных. Основной же недостаток заключается в том, что реальные высказывания людей скрываются за абстрактными цифрами.

При проведении качественных исследований все богатство и разнообразие чувств и мыслей людей сохраняется. В данном случае так же широко применяются опросы, но здесь важно то, что будет сделано потом с полученными данными, которые можно преобразовать в цифры. Например, анализируя ответы Джона количественным методом, можно подсчитать число употребленных им слов, указывающих на его подавленное психологическое состояние. Качественный же анализ состоит в анализе смысла этих ответов - например, того, что Джон имеет в виду под словом «безработица». Качественная методология изучает связи между событиями и видами активности, а также исследует то, как люди представляют себе эти связи.

С помощью количественного и качественного анализов так же можно изучать личность. Количественный или вариационно-статистический, анализ заключается в вычислении коэффициентов правильного решения задач, частоты повторения наблюдаемых психических явлений. Для сравнения результатов исследований по разным количеством задач или различным количественным составом группы пользуются не абсолютными, а относительными, преимущественно процентными показателями. При количественном анализе результатов исследования зачастую используют среднее арифметическое из всех исследований того или иного психического процесса или индивидуально-психологической особенности. Для того чтобы сделать выводы о вероятности среднего арифметического, исчисляют коэффициент отклонений от него отдельных показателей. Что меньше отклонения показателей отдельных исследований от среднего арифметического, то показательнее оно является для исследований психологической особенности личности.

Качественный анализ выполняют на основе количественного анализа, но не сводятся только к нему. В качественном анализе выясняют причины высоких или низких показателей, зависимость их от возрастных и индивидуальных особенностей личности, условий жизни и обучения, отношений в коллективе, отношение к деятельности и др.

Количественный и качественный анализ данных исследования дают основание для получения психолого-педагогической характеристики личности и выводов о воспитательные мероприятия.

Обработка данных психологических исследований – отдельный раздел экспериментальной психологии, тесно связанный с математической статистикой и логикой. Обработка данных направлена на решение следующих задач:

Упорядочивание полученного материала;

Обнаружение и ликвидация ошибок, недочетов, пробелов в сведениях;

Выявление скрытых от непосредственного восприятия тенденций, закономерностей и связей;

Обнаружение новых фактов, которые не ожидались и не были замечены в ходе эмпирического процесса;

Выяснение уровня достоверности, надежности и точности собранных данных и получение на их базе научно обоснованных результатов.

Различают количественную и качественную обработку данных. Количественная обработка – это работа с измеренными характеристиками изучаемого объекта, его «объективированными» свойствами. Качественная обработка представляет собой способ проникновения в сущность объекта путем выявления его неизмеряемых свойств.

Количественная обработка направлена в основном на формальное, внешнее изучение объекта, качественная – преимущественно на содержательное, внутреннее его изучение. В количественном исследовании доминирует аналитическая составляющая познания, что отражено и в названиях количественных методов обработки эмпирического материала: корреляционный анализ, факторный анализ и т. д. Реализуется количественная обработка с помощью математико-статистических методов.

В качественной обработке преобладают синтетические способы познания. Обобщение проводится на следующем этапе исследовательского процесса – интерпретационном. При качественной обработке данных главное заключается в соответствующем представлении сведений об изучаемом явлении, обеспечивающем дальнейшее его теоретическое изучение. Обычно результатом качественной обработки является интегрированное представление о множестве свойств объекта или множестве объектов в форме классификаций и типологий. Качественная обработка в значительной мере апеллирует к методам логики.

Противопоставление друг другу качественной и количественной обработки довольно условно. Количественный анализ без последующей качественной обработки бессмыслен, так как сам по себе не приводит к приращению знаний, а качественное изучение объекта без базовых количественных данных в научном познании невозможно. Без количественных данных научное познание – чисто умозрительная процедура.

Единство количественной и качественной обработки наглядно представлено во многих методах обработки данных: факторном и таксономическом анализе, шкалировании, классификации и др. Наиболее распространены такие приемы количественной обработки, как классификация, типологизация, систематизация, периодизация, казуистика.

Качественная обработка естественным образом выливается в описание и объяснение изучаемых явлений, что составляет уже следующий уровень их изучения, осуществляемый на стадии интерпретации результатов. Количественная же обработка полностью относится к этапу обработки данных.

7.2. Первичная статистическая обработка данных

Все методы количественной обработки принято подразделять на первичные и вторичные.

Первичная статистическая обработка нацелена на упорядочивание информации об объекте и предмете изучения. На этой стадии «сырые» сведения группируются по тем или иным критериям, заносятся в сводные таблицы. Первично обработанные данные, представленные в удобной форме, дают исследователю в первом приближении понятие о характере всей совокупности данных в целом: об их однородности – неоднородности, компактности – разбросанности, четкости – размытости и т. д. Эта информация хорошо считывается с наглядных форм представления данных и дает сведения об их распределении.

В ходе применения первичных методов статистической обработки получаются показатели, непосредственно связанные с производимыми в исследовании измерениями.

К основным методам первичной статистической обработки относятся: вычисление мер центральной тенденции и мер разброса (изменчивости) данных.

Первичный статистический анализ всей совокупности полученных в исследовании данных дает возможность охарактеризовать ее в предельно сжатом виде и ответить на два главных вопроса: 1) какое значение наиболее характерно для выборки; 2) велик ли разброс данных относительно этого характерного значения, т. е. какова «размытость» данных. Для решения первого вопроса вычисляются меры центральной тенденции, для решения второго – меры изменчивости (или разброса). Эти статистические показатели используются в отношении количественных данных, представленных в порядковой, интервальной или пропорциональной шкале.

Меры центральной тенденции – это величины, вокруг которых группируются остальные данные. Данные величины являются как бы обобщающими всю выборку показателями, что, во-первых, позволяет судить по ним обо всей выборке, а во-вторых, дает возможность сравнивать разные выборки, разные серии между собой. К мерам центральной тенденции в обработке результатов психологических исследований относятся: выборочное среднее, медиана, мода.

Выборочное среднее (М) – это результат деления суммы всех значений (X) на их количество (N).

Медиана (Me) – это значение, выше и ниже которого количество отличающихся значений одинаково, т. е. это центральное значение в последовательном ряду данных. Медиана не обязательно должна совпадать с конкретным значением. Совпадение происходит в случае нечетного числа значений (ответов), несовпадение – при четном их числе. В последнем случае медиана вычисляется как среднее арифметическое двух центральных значений в упорядоченном ряду.

Мода (Мо) – это значение, наиболее часто встречающееся в выборке, т. е. значение с наибольшей частотой. Если все значения в группе встречаются одинаково часто, то считается, что моды нет. Если два соседних значения имеют одинаковую частоту и больше частоты любого другого значения, мода есть среднее этих двух значений. Если то же самое относится к двум несмежным значениям, то существует две моды, а группа оценок является бимодальной.

Обычно выборочное среднее применяется при стремлении к наибольшей точности в определении центральной тенденции. Медиана вычисляется в том случае, когда в серии есть «нетипичные» данные, резко влияющие на среднее. Мода используется в ситуациях, когда не нужна высокая точность, но важна быстрота определения меры центральной тенденции.

Вычисление всех трех показателей производится также для оценки распределения данных. При нормальном распределении значения выборочного среднего, медианы и моды одинаковы или очень близки.

Меры разброса (изменчивости) – это статистические показатели, характеризующие различия между отдельными значениями выборки. Они позволяют судить о степени однородности полученного множества, его компактности, а косвенно и о надежности полученных данных и вытекающих из них результатов. Наиболее используемые в психологических исследованиях показатели: среднее отклонение, дисперсия, стандартное отклонение.

Размах (Р) – это интервал между максимальным и минимальным значениями признака. Определяется легко и быстро, но чувствителен к случайностям, особенно при малом числе данных.

Среднее отклонение (МД) – это среднеарифметическое разницы (по абсолютной величине) между каждым значением в выборке и ее средним.

где d = |Х – М |, М – среднее выборки, X – конкретное значение, N – число значений.

Множество всех конкретных отклонений от среднего характеризует изменчивость данных, но если не взять их по абсолютной величине, то их сумма будет равна нулю и мы не получим информации об их изменчивости. Среднее отклонение показывает степень скученности данных вокруг выборочного среднего. Кстати, иногда при определении этой характеристики выборки вместо среднего (М) берут иные меры центральной тенденции – моду или медиану.

Дисперсия (D) характеризует отклонения от средней величины в данной выборке. Вычисление дисперсии позляет избежать нулевой суммы конкретных разниц (d = Х – М) не через их абсолютные величины, а через их возведение в квадрат:

где d = |Х – М|, М – среднее выборки, X – конкретное значение, N – число значений.

Стандартное отклонение (б). Из-за возведения в квадрат отдельных отклонений d при вычислении дисперсии полученная величина оказывается далекой от первоначальных отклонений и потому не дает о них наглядного представления. Чтобы этого избежать и получить характеристику, сопоставимую со средним отклонением, проделывают обратную математическую операцию – из дисперсии извлекают квадратный корень. Его положительное значение и принимается за меру изменчивости, именуемую среднеквадратическим, или стандартным, отклонением:

где d = |Х– М|, М – среднее выборки, X– конкретное значение, N – число значений.

МД, D и? применимы для интервальных и пропорционных данных. Для порядковых данных в качестве меры изменчивости обычно берут полуквартильное отклонение (Q), именуемое еще полуквартильным коэффициентом. Вычисляется этот показатель следующим образом. Вся область распределения данных делится на четыре равные части. Если отсчитывать наблюдения начиная от минимальной величины на измерительной шкале, то первая четверть шкалы называется первым квартилем, а точка, отделяющая его от остальной части шкалы, обозначается символом Qv Вторые 25 % распределения – второй квартиль, а соответствующая точка на шкале – Q2. Между третьей и четвертой четвертями распределения расположена точка Q3. Полуквартильный коэффициент определяется как половина интервала между первым и третьим квартилями:

При симметричном распределении точка Q2 совпадет с медианой (а следовательно, и со средним), и тогда можно вычислить коэффициент Q для характеристики разброса данных относительно середины распределения. При несимметричном распределении этого недостаточно. Тогда дополнительно вычисляют коэффициенты для левого и правого участков:

7.3. Вторичная статистическая обработка данных

К вторичным относят такие методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности. Вторичные методы можно подразделить на способы оценки значимости различий и способы установления статистических взаимосвязей.

Способы оценки значимости различий. Для сравнения выборочных средних величин, принадлежащих к двум совокупностям данных, и для решения вопроса о том, отличаются ли средние значения статистически достоверно друг от друга, используют t-критерий Стьюдента. Его формула выглядит следующим образом:

где М1, М2 – выборочные средние значения сравниваемых выборок, m1, m2 – интегрированные показатели отклонений частных значений из двух сравниваемых выборок, вычисляются по следующим формулам:

где D1, D2 – дисперсии первой и второй выборок, N1, N2 – число значений в первой и второй выборках.

t по таблице критических значений (см. Статистическое приложение 1), заданного числа степеней свободы (N 1 + N 2 – 2) и избранной вероятности допустимой ошибки (0,05, 0,01, 0,02, 001 и т.д.) находят табличное значение t. Если вычисленное значение t больше или равно табличному, делают вывод о том, что сравниваемые средние значения двух выборок статистически достоверно различаются с вероятностью допустимой ошибки, меньшей или равной избранной.

Если в процессе исследования встает задача сравнить неабсолютные средние величины, частотные распределения данных, то используется?2критерий (см. Приложение 2). Его формула выглядит следующим образом:

где Pk – частоты распределения в первом замере, Vk – частоты распределения во втором замере, m – общее число групп, на которые разделились результаты замеров.

После вычисления значения показателя?2по таблице критических значений (см. Статистическое приложение 2), заданного числа степеней свободы (m – 1) и избранной вероятности допустимой ошибки (0,05, 0,0 ?2t больше или равно табличному) делают вывод о том, что сравниваемые распределения данных в двух выборках статистически достоверно различаются с вероятностью допустимой ошибки, меньшей или равной избранной.

Для сравнения дисперсий двух выборок используется F-критерий Фишера. Его формула выглядит следующим образом:

где D 1, D 2 – дисперсии первой и второй выборок, N 1, N 2 – число значений в первой и второй выборках.

После вычисления значения показателя F по таблице критических значений (см. Статистическое приложение 3), заданного числа степеней свободы (N 1 – 1, N2 – 1) находится F кр. Если вычисленное значение F больше или равно табличному, делают вывод о том, что различие дисперсий в двух выборках статистически достоверно.

Способы установления статистических взаимосвязей. Предыдущие показатели характеризуют совокупность данных по какому-либо одному признаку. Этот изменяющийся признак называют переменной величиной или просто переменной. Меры связи выявляют соотношения между двумя переменными или между двумя выборками. Эти связи, или корреляции, определяют через вычисление коэффициентов корреляции. Однако наличие корреляции не означает, что между переменными существует причинная (или функциональная) связь. Функциональная зависимость – это частный случай корреляции. Даже если связь причинна, корреляционные показатели не могут указать, какая из двух переменных является причиной, а какая – следствием. Кроме того, любая обнаруженная в психологических исследованиях связь, как правило, существует благодаря и другим переменным, а не только двум рассматриваемым. К тому же взаимосвязи психологических признаков столь сложны, что их обусловленность одной причиной вряд ли состоятельна, они детерминированы множеством причин.

По тесноте связи можно выделить следующие виды корреляции: полная, высокая, выраженная, частичная; отсутствие корреляции. Эти виды корреляций определяют в зависимости от значения коэффициента корреляции.

При полной корреляции его абсолютные значения равны или очень близки к 1. В этом случае устанавливается обязательная взаимозависимость между переменными. Здесь вероятна функциональная зависимость.

Высокая корреляция устанавливается при абсолютном значении коэффициента 0,8–0,9. Выраженная корреляция считается при абсолютном значении коэффициента 0,6–0,7. Частичная корреляция существует при абсолютном значении коэффициента 0,4–0,5.

Абсолютные значения коэффициента корреляции менее 0,4 свидетельствуют об очень слабой корреляционной связи и, как правило, в расчет не принимаются. Отсутствие корреляции констатируется при значении коэффициента 0.

Кроме того, в психологии при оценке тесноты связи используют так называемую «частную» классификацию корреляционных связей. Она ориентирована не на абсолютную величину коэффициентов корреляции, а на уровень значимости этой величины при определенном объеме выборки. Эта классификация применяется при статистической оценке гипотез. При данном подходе предполагается, что чем больше выборка, тем меньшее значение коэффициента корреляции может быть принято для признания достоверности связей, а для малых выборок даже абсолютно большое значение коэффициента может оказаться недостоверным.

По направленности выделяют следующие виды корреляционных связей: положительная (прямая) и отрицательная (обратная). Положительная (прямая) корреляционная связь регистрируется при коэффициенте со знаком «плюс»: при увеличении значения одной переменной наблюдается увеличение другой. Отрицательная (обратная) корреляция имеет место при значении коэффициента со знаком «минус». Это означает обратную зависимость: увеличение значения одной переменной влечет за собой уменьшение другой.

По форме различают следующие виды корреляционных связей: прямолинейную и криволинейную. При прямолинейной связи равномерным изменениям одной переменной соответствуют равномерные изменения другой. Если говорить не только о корреляциях, но и о функциональных зависимостях, то такие формы зависимости называют пропорциональными. В психологии строго прямолинейные связи – явление редкое. При криволинейной связи равномерное изменение одного признака сочетается с неравномерным изменением другого. Эта ситуация для психологии типична.

Коэффициент линейной корреляции по К. Пирсону (r) вычисляется c помощью следующей формулы:

где х X от среднего выборки (Мх), у – отклонение отдельного значения Y от среднего выборки (М у), Ьх – стандартное отклонение для X, ?y – стандартное отклонение для Y, N – число пар значений X и Y.

Оценка значимости коэффициента корреляции проводится по таблице (см. Статистическое приложение 4).

При сравнении порядковых данных применяется коэффициент ранговой корреляции по Ч. Спирмену (R):

где d – разность рангов (порядковых мест) двух величин, N – число сравниваемых пар величин двух переменных (X и Y).

Оценка значимости коэффициента корреляции проводится по таблице (см. Статистическое приложение 5).

Внедрение в научные исследования автоматизированных средств обработки данных позволяет быстро и точно определять любые количественные характеристики любых массивов данных. Разработаны различные программы для компьютеров, по которым можно проводить соответствующий статистический анализ практически любых выборок. Из массы статистических приемов в психологии наибольшее распространение получили следующие: 1) комплексное вычисление статистик; 2) корреляционный анализ; 3) дисперсионный анализ; 4) регрессионный анализ; 5) факторный анализ; 6) таксономический (кластерный) анализ; 7) шкалирование. Познакомиться с характеристиками этих методов можно в специальной литературе («Статистические методы в педагогике и психологии» Стенли Дж., Гласа Дж. (М., 1976), «Математическая психология» Г.В. Суходольского (СПб., 1997), «Математические методы психологического исследования» А.Д. Наследова (СПб., 2005) и др.).

Некоторые основные понятия. Популяция и выборка

Данные и их разновидности

Похожие статьи