Экспериментальная психология: Учебное пособие. Валидность эксперимента и факторы ее нарушения Фактор фона в экспериментальной психологии

Указанные факторы проявляются в эксперименте в качестве конкретных по- бочных переменных, способных оказывать влияние на зависимую переменную помимо независимой. Факторы времени связаны с изменениями, которые происходят с течением времени. Эти факторы могут быть как известны заранее, так и непредсказуемы. Искажающее влияние факторов времени особенно опасно для естественных и лю- бых долговременных экспериментов. К факторам времени относят фон, естест- венное развитие и инструментальную погрешность. 1. Фоном (или, иногда: «эффектом истории») называют конкретные события, происходящие в период проведения эксперимента. К фоновым явлениям относят колебания температуры, сезонные погодные изменения, шумы, изменение осве- щения и др. Как фон рассматривают и случайные события, помехи, которые име- ют место во время проведения экспериментальной процедуры. Особое место за- нимают такие фоновые явления, как события личной жизни испытуемых и обще- ственные изменения. 2. Естественное развитие – изменение характеристик испытуемых, являющее- ся следствием течения времени и имеющее процессуальный характер. Это могут быть изменения состояния (голод, усталость, болезнь и др.), свойств индивида (возрастные перемены, накопление опыта и др.), изменения связанные с динами- ческими процессами в группе. Само пребывание в ситуации эксперимента может вызвать изменения в поведении испытуемого процессуального характера. Однако, процессы, соответствующие естественному развитию, могут происходить и неза- висимо от эксперимента. В этом случае они выступаю как фактор, нарушающий внутреннюю валидность, если определяют различия между двумя последователь- ными замерами. 3. Инструментальной погрешностью называют неточности измерения, раз- личающиеся от пробы к пробе. Инструментальная погрешность может появляться в результате ненадёжности инструментария, износа техники, случайных ошибок экспериментатора или испытуемых, утомления экспериментатора или, наоборот, приобретения им опыта измерения. Факторы отбора связаны с характеристиками групп испытуемых, участвую- щих в экспериментальном исследовании. 1. Ошибка селекции возникает вследствие неправильного распределения ис- пытуемых по группам. Группы, соответствующие разным условиям независимых переменных, должны быть эквивалентны по составу. Стойкие различия между группами, результаты которых сравниваются в эксперименте, неизбежно вы- зывают систематическую ошибку в результатах. Такой эффект и называется ошибкой селекции. 2. Эквивалентность групп, достигнутая до начала эксперимента, может быть нарушена в результате экспериментального отсева – неравномерного выбыва- ния испытуемых из сравниваемых групп. 3. К факторам отбора относится и статистическая регрессия, которая возника- ет, если группы отбирались на основе «крайних» показателей. Статистическая регрессия отражает общую статистическую закономерность, которая выражается 11 в том, что «крайние» (очень высокие или слишком низкие) показатели, получен- ные в первом замере, имеют тенденцию приближаться к средним величинам при вторичном измерении. В целом, чем сильнее отклоняется оценка от среднего зна- чения, тем больше вероятность того, что она связана с ошибкой измерения. Так, как правило, получающему самые высокие оценки в некотором смысле необы- чайно «везет» (большая позитивная ошибка), а получающему самые низкие оцен- ки «не везет» (большая негативная ошибка). Поэтому, при последующем тестиро- вании показатели тех, кто получил высокие оценки, несколько сместятся к сред- нему по группе, а получившие низкие оценки улучшат свои позиции. Если для эксперимента была специально отобрана группа испытуемых, имеющих крайне низкие или крайне высокие показатели, то при повторном тестировании их ре- зультаты изменятся и без воздействия независимой переменной. Таким образом, статистическая регрессия опасна для экспериментов с предварительным тестиро- ванием и только в том случае, если специально отбирались группы на основе «крайних» показателей. Факторы задачи связаны с различием экспериментальных задач, которые предъявляются испытуемым при разных условиях независимой переменной. Эффектами последовательности называются влияния одного из условий не- зависимой переменной на условия, следующие за ним. В этом случае сам факт предъявления предыдущих проб влияет на характеристики ответов испытуемого в последующих пробах. Эффекты последовательности различаются по качеству действия и могут быть положительными и отрицательными. Положительными называются эффекты, когда выполнение одного задания облегчает выполнение следующего (например: обучающий эксперимент). Отрицательным считается эффект, если после вы- полнения определённого задания выполнение последующего затрудняется (на- пример, привычка заучивать тексты с помощью чтения вслух может помешать за- учиванию без него). Эффекты последовательности также различаются по времени действия и могут быть недолгими или продолжительными. Недолгими считаются эффекты, кото- рые распространяются только на одну последующую пробу; продолжительными – те, действие которых сохраняется длительное время. Если действие продолжительных эффектов последовательности накапливается по мере предъявления проб, его называют эффектом переноса. Эффекты переноса различаются по равномерности влияния от пробы к пробе. В этом смысле выделяют однородные и неоднородные эффекты переноса. Если влияние любого условия на каждую последующую пробу всегда одинаково по ве- личине, то мы имеем дело с однородным переносом. Если величина влияния од- ного условия на другое меняется с течением времени, то такой перенос называют неоднородным (например, известно, что эффект научения наиболее выражен вна- чале процесса обучения, и затем постепенно угасает). Условия независимой переменной могут оказывать неодинаковое влияние друг на друга. В связи с этим различают симметричный и асимметричный перенос. Симметричным называется эффект, когда влияние условия «А» на последующее 12 условие «Б» является точно таким же, как и влияние условия «Б» на последующее условие «А». Если влияние условия «А» на условие «Б» отличается от влияния «Б» на «А», то такой эффект называют асимметричным. Наличие асимметрич- ных эффектов между условиями независимой переменной существенно затрудня- ет применение в эксперименте интраиндивидуальной схемы. Эффект тестирования рассматривают как частный случай эффектов последо- вательности. Эффект тестирования наблюдается тогда, когда предварительное тестирование способно повлиять на результат итогового. Чаще всего это происхо- дит в тех случаях, когда даже однократное выполнение какой-либо деятельности способствует научению подобным процедурам. На результаты эксперимента может оказать влияние и сам экспериментатор, а так же испытуемые. Если исследователь заинтересован в подтверждении (или опровержении) своей гипотезы, то он может неосознанно вносить искажения в ход эксперимента и ин- терпретацию данных, добиваясь, чтобы испытуемый «работал под гипотезу». Американский психолог Розенталь назвал это явление «эффектом Пигмалиона» в честь персонажа греческого мифа. Влияние испытуемых на результаты эксперимента связано с тем, что уже само участие в исследовании порождает у испытуемых ряд поведенческих проявлений, которые являются причинами специфических эффектов. Среди наиболее известных: - «эффект плацебо», - «эффект Хотторна», - «эффект аудитории». Эффект плацебо был обнаружен медиками: когда испытуемые считают, что препарат или действия врача способствуют их выздоровлению, у них наблюдается улучшение состояния. Соответственно, если испытуемые считают, что действие экспериментатора произведёт на них какое-либо влияние, то обычно так и проис- ходит. Эффект основан на механизмах внушения и самовнушения. Эффект Хотторна проявился при проведении социально-психологических исследований на фабриках. Привлечение к участию в эксперименте, который про- водили психологи, расценивалось испытуемыми как проявление внимания к ним лично. Поэтому, участники исследования вели себя так, как ожидали от них экс- периментаторы. Эффект аудитории (или эффект социальной фасилитации) был обнаружен Г. Зайонцем. Присутствие любого внешнего наблюдателя, в частности экспери- ментатора и ассистента, изменяет поведение человека, выполняющего ту или иную работу. При этом, в отдельных случаях результаты деятельности могут улучшаться или же, наоборот, наблюдается противоположная тенденция: сниже- ние эффективности деятельности. Упражнения для практических занятий Упражнение 1 13 Работа проводится в парах или тройках. Используется набор карточек с факторами, нарушающими внутреннюю валидность эксперимента. Из набора слу- чайным образом выбирается одна карточка. Следует оценить, опасен ли данный фактор для эксперимента, представленного в текстовом описании. Если такая опасность существует, надо обозначить конкретную побочную переменную, в ко- торой отражается выбранный фактор, и сформулировать конкурирующую гипоте- зу. Если данный фактор не представляет собой угрозы нарушения внутренней ва- лидности, необходимо обосновать это и отложить карточку в сторону. Затем сле- дует выбрать из набора новую карточку, и процедура повторяется. Упражнение 2 Работа проводится в парах или тройках. Предлагается текстовое описание эксперимента и 2 фактора, способных нарушить его внутреннюю валидность. Не- обходимо определить, какой из двух факторов более опасен для данного экспери- мента. Упражнение 3 Работа проводится в парах или тройках. Используется набор карточек с побоч- ными переменными. Из набора случайным образом выбирается одна карточка. Задание заключается в том, чтобы: - определить, в роли какого фактора, нарушающего внутреннюю валидность (или нескольких факторов), может выступать данная побочная переменная; - смоделировать экспериментальную ситуацию, когда обозначенный фактор может вызывать: а) ненадёжность, б) систематическое смешение.Упражнение 4.Предлагаются текстовое описание эксперимента, основная экспериментальная гипотеза и несколько «конкурирующих». проанализировать конкурирующие ги- потезы и выделить те из них, против которых эксперимент действительно «не за- щищён». ЭКСПЕРИМЕНТАЛЬНЫЙ КОНТРОЛЬ Искусство планирования эксперимента состоит в том, чтобы минимизировать действие побочных переменных. Исследователь должен контролировать все воз- можные факторы, способные повлиять на результат эксперимента. Поэтому, лю- бое усовершенствование экспериментальной процедуры с целью повышения его валидности называется контролем. Существует 3 формы контроля побочных переменных: 1) предварительное устранение побочных переменных из ситуации экспери- мента, 2) выравнивание побочных переменных по условиям независимой переменной, 3) усреднение случайных влияний за счёт увеличения количества проб и испы- туемых. Указанные формы являются целевыми и могут реализоваться во множестве конкретных способов контроля (см. таб. 1). Таблица 1 14 Контроль факторов, нарушающих внутреннюю валидность эксперимента Катего- Фактор Способ контроля рия Фон - контроль условий эксперимента, - создание одинаковых условий для групп в М/Г, последовательность условий в И/И, - увеличение количества проб и испытуемых. Инструменталь- - использование надёжных средств измерения, ная погрешность - одинаковые способы измерения в М/Г, после- Факторы времени довательность условий в И/И, - увеличение количества проб и испытуемых. Естественное раз- - последовательность предъявления условий в витие И/И, - введение контрольной группы, - контроль продолжительности эксперимента. Ошибка селекции - стратегии распределения групп, - отказ от межгрупповой схемы. - исключение результатов выбывших испытуе- Факторы отбора Эксперименталь- мых, ный отсев - увеличение количества испытуемых, - подготовительная работа с испытуемыми. Статистическая - отбор испытуемых, регрессия - несколько серий предварительного и итогового тестирования. Факторы задачи - одинаковые задачи для разных групп в М/Г, последовательность распределения задач по условиям НП в И/И. - использование параллельных форм задач Эффекты последовательно- - последовательность предъявления условий, сти - отказ от интраиндивидуальной схемы. Эффект тестирования - использование параллельных форм, - введение контрольной группы, - метод независимого измерения, - отказ от схемы с предварительным тестирова- нием. Влияние испытуемого - метод «плацебо», - метод «обмана», - метод «скрытого» эксперимента, - метод независимого измерения, - контроль восприятия испытуемым ситуации. Окончание табл.1 Фактор Способ контроля 15 Влияние экспериментатора - автоматизация исследования, - участие нескольких экспериментаторов, - привлечение независимых ассистентов, - «двойной слепой опыт». Особую специфику имеют способы контроля влияния испытуемого и экспе- риментатора. Для контроля влияния испытуемого традиционно используют следующие ме- тоды. Метод «плацебо». В этом случае для испытуемых, которые составляют кон- трольную группу, имитируется (только внешне) экспериментальное воздействие, аналогичное тому, которое производится в экспериментальной группе. Метод «обмана» основан на целенаправленном введении испытуемых в заблу- ждение. Например, можно не сообщать испытуемому гипотезу исследования или дать ложную. Использование данного метода связано с этическими проблемами, и многие психологи гуманистической ориентации считают его неприемлемым. Метод «скрытого» эксперимента часто применяется в полевых исследовани- ях, при реализации так называемого «естественного» эксперимента. Эксперимент так включается в естественную жизнь испытуемого, что тот не подозревает о сво- ем участии в исследовании в качестве испытуемого. Метод независимого измерения зависимых параметров заключается в том, что эксперимент проводится с испытуемым по обычному плану, но эффект воз- действия измеряется не в ходе эксперимента, а вне его, например, при контроле результатов учебной или трудовой деятельности испытуемого. Контроль восприятия испытуемым ситуации. Обычно для этого применяет- ся постэкспериментальное интервью. Также полезно учитывать или контролиро- вать отношение испытуемого к эксперименту и экспериментатору, понимание им инструкции, принятие целей эксперимента. Для контроля влияния экспериментатора чаще всего рекомендуются следую- щие методы. Метод «плацебо вслепую», или «двойной слепой опыт». С помощью данного метода обычно контролируется эффект Пигмалиона. Процедура исследования строится так, что сам экспериментатор не знает, какая группа получает воздейст- вие, соответствующее одному условию независимой переменной, а какая подвер- гается альтернативному воздействию (другое условие независимой переменной). Существуют модификации этого плана. Одна из них состоит в том, что экспе- римент проводит не сам экспериментатор, а приглашенный ассистент, которо- му не сообщается истинная гипотеза исследования и то, какая из групп подверга- ется реальному воздействию. Также используются: автоматизация исследования и участие нескольких экспериментаторов. Упражнения для практических занятий 16 Упражнение 1 Предлагается текст с описанием экспериментального исследования и ука- зывается фактор, нарушающий внутреннюю валидность данного эксперимента, который необходимо проконтролировать. Необходимо разработать и обосновать способы экспериментального контроля. Упражнение 2 Предлагается текст с описанием экспериментального исследования и ука- зывается фактор, нарушающий внутреннюю валидность данного эксперимента, который необходимо проконтролировать. Предлагаются два способа контроля указанного фактора. Необходимо выбрать более продуктивный способ и обосно- вать свой выбор. Упражнение 3 Предлагается текст с описанием экспериментального исследования. Необ- ходимо выделить факторы, способные нарушить внутреннюю валидность данного эксперимента, и обозначить побочные переменные. Рекомендуется последова- тельно рассмотреть все возможные факторы, фиксируя результаты анализа в таб- лице (таб.2). Если некоторый фактор не представляет опасности для конкретного эксперимента, то в соответствующей графе ставится прочерк. Далее необходимо обсудить возможные способы контроля выделенных факторов и занести их в таб- лицу. Таблица 2 Факторы, нарушающие внутреннюю валидность эксперимент Категория Фактор Побочная переменная Способ контроля Фон Инструменталь- Факторы отбо- Факторы времени ная погрешность Естественное развитие Ошибка селек- ции Эксперимен- тальный отсев Статистическая регрессия ра Факторы задачи Эффекты последовательно- сти Эффект тестирования Влияние испытуемого Влияние экспериментатора ОСОБЕННОСТИ КОНТРОЛЯ В МЕЖГРУППОВЫХ 17 И ИНТРАИНДИВИДУАЛЬНЫХ ЭКСПЕРИМЕНТАХ Для экспериментов, построенных по межгрупповой схеме, наиболее опасным является фактор отбора; в то время как эксперименты, спланированные по интра- индивидуальной схеме, прежде всего, страдают от эффектов последовательности. Для контроля факторов отбора в межгрупповых экспериментах применяют осо- бые стратегии распределения испытуемых по группам; для контроля побочных эффектов в интраиндивидуальных экспериментах существуют несколько схем последовательности предъявления условий независимой переменной. Фактор отбора может нарушать валидность эксперимента двояким образом. Внешняя валидность нарушается в результате неправильного отбора испытуемых из популяции. В этом случае мы получаем нерепрезентативную выборку. Внут- ренняя валидность эксперимента может быть нарушена вследствие неверного распределения испытуемых по группам в межгрупповом эксперименте. Это про- исходит в том случае, если сформированные группы неэквивалентны по значи- мым признакам. Основным средством контроля фактора отбора в эксперименте являются стра- тегии отбора испытуемых из популяции (внешняя валидность) и стратегии рас- пределения испытуемых по группам (внутренняя валидность). Выделяют две стратегии отбора испытуемых из популяции: случайная стра- тегия и стратометрический отбор. 1. Если используется случайный отбор, то из представителей популяции, к ко- торым существует доступ, случайным образом отбираются испытуемые для экс- перимента. Для этих целей лучше использовать таблицу случайных чисел. Не следует путать случайную стратегию с привлечением добровольцев или исполь- зованием реальных групп испытуемых, которые имеются в наличии: такие выбор- ки в большинстве случаев являются нерепрезентативными. 2. Стратометрический отбор (случайный отбор групп с выделением слоев) более предпочтителен, поскольку такая стратегия отбора позволяет в эксперимен- тальной выборке представить различные категории испытуемых в такой же про- порции, что и в популяции. Например, если в популяции «мужчин от 20 до 30 лет» 50% имеют среднее образование, 20% являются студентами ВУЗов и 30% имеют законченное высшее образование, то и в выборке испытуемые должны быть представлены в той же самой пропорции. Таким образом, стратометрический отбор следует начать с разделения потен- циальных испытуемых на слои (страты). Основание для выделения страт необхо- димо формировать в соответствии с целями эксперимента. Например, при изучении программ обучения имеет смысл сформировать слои на основе таких признаков, как возраст, уровень интеллекта, опыт обучения по данной программе. Если же Вы исследуете отношение к политическому деятелю, то целесообразно использовать такие основания, как возраст, социальное положе- ние, уровень образования и др. После того, как выделены необходимые страты, из каждой случайным образом отбирается такое количество испытуемых, которое соответствует процентному составу данной страты в популяции. 18 Существуют три основные стратегии распределения испытуемых по груп- пам. Это: случайная стратегия, стратегия подбора пар и стратометрическое рас- пределение. 1. Случайная стратегия. В этом случае испытуемые распределяются по груп- пам случайным образом, то есть каждый участник эксперимента с одинаковой ве- роятностью может попасть в любую из групп. Для такого распределения удобно использовать таблицу случайных чисел. Однако, следует помнить, что примене- ние случайной стратегии обеспечивает эквивалентность групп только в том слу- чае, когда количество испытуемых в выборке достаточно велико. 2. Стратегия подбора пар (попарное распределение групп). В этом случае сна- чала выделяется некоторая характеристика, на основе которой должны быть вы- ровнены группы. Производится замер этой характеристики у всех участников эксперимента, после чего подбираются пары испытуемых, максимально сходных друг с другом. Один испытуемый из каждой пары зачисляется в первую группу, другой – во вторую. Стратегия подбора пар допускает меньшее количество испытуемых. Однако этот способ выравнивания групп может использоваться только тогда, когда суще- ствует возможность количественного измерения тех характеристик, по которым группы предполагается выравнивать. 3. Стратометрическое распределение (случайное распределение групп с вы- делением слоев). При использовании данной стратегии необходимо сначала опре- делить критерии, на основе которых будут формироваться страты (слои). В осно- ве формирования страт должны лежать признаки, способные выступить в данном эксперименте в качестве побочных переменных. Если критерии выделены пра- вильно, то стратометрическое распределение будет иметь преимущество по срав- нению со случайным распределением: для достижения столь же высокой надеж- ности эксперимента потребуется меньшее количество испытуемых. Чтобы сформировать страты (слои), следует провести множественную класси- фикацию, разделив испытуемых на несколько групп в соответствии с обозначен- ными критериями. Критериев для формирования страт может быть несколько, од- нако следует помнить, что использование двух критериев предполагает формиро- вание 4-х качественно различных групп, три критерия дают уже 8 групп и т.д. По- этому, следует выделять для стратификации лишь наиболее существенные при- знаки. Например, с целью обеспечения валидности некоторого эксперимента необхо- димо уравновесить две группы по 2-м признакам: полу и возрасту. В этом случае будут сформированы 4 слоя (страты). Страты могут различаться по количеству испытуемых (см. таб. 3). Таблица 3 Пример распределения 100 испытуемых 19 на страты с учётом 2-х признаков возраст 25 - 35 лет 36 – 50 лет пол Мужчины Слой 1: мужчины в возрасте Слой 2: мужчины в возрасте от 25 до 35 лет (25 человек) от 36 до 50 лет (19 человек) Женщины Слой 3: женщины в возрасте Слой 4: женщины в возрасте от 25 до 35 лет (32 человека) от 36 до 50 лет (24 человека) Когда страты сформированы, необходимо каждый слой случайным образом разделить на две части, составив из всех слоёв две эквивалентные и равные по ко- личеству группы. В приведённом выше примере в каждой из 2–х эксперименталь- ных групп в конечном итоге будет по 50 человек. С целью контроля побочных факторов в интраиндивидуальных экспериментах используют три различные схемы последовательности предъявления условий: случайную последовательность, схему регулярного чередования условий, и пози- ционно уравненную последовательность. 1. При использовании случайной последовательности состояния или условия независимой переменной предъявляются в случайном порядке (например: АВ- ВАВАААВАВААВВВ). Такая схема рекомендуется, если: (а) пробы коротки, (б) проб много и (в) испытуемый не должен знать о состоянии независимой перемен- ной в каждой конкретной пробе. 2. Схема регулярного чередования представляет собой такую последователь- ность, когда условия независимой переменной равномерно чередуются через один на всём протяжении эксперимента (например: АВАВАВАВ). Данная схема при- меняется, если: (а) пробы коротки, (б) проб много, и (в) имеют место длительные процессы, развивающиеся с течением времени. 3. Позиционно уравненная последовательность строится по принципу урав- новешивания местоположения различных условий независимой переменной отно- сительно центра ряда (например: АВВА, или АВССВА). Эту последовательность целесообразно использовать, если: (а) пробы объёмны и трудоёмки, (б) проб мало, (в) имеют место изменения во времени линейного характера. Указанные последовательности успешно применяются в интраиндивидуальных экспериментах для контроля факторов времени, эффектов последовательности и факторов задачи. В первом случае они позволяют равномерно распределить усло- вия НП во времени. Эффекты последовательности контролируются посредством уравновешивания влияний условий НП друг на друга. Когда контролируется фак- тор задачи, ставится цель равномерного распределения задач по условиям НП. Упражнения для практических занятий 20

Естественный эксперимент проводится только в естественных, привычных для субъекта условиях труда, там, где обычно проходят его рабочий день и трудовая деятельность. Это могут быть рабочий стол в офисе, купе вагона, цех, аудитория института, кабинет, кабина грузовика и т. д.
При использовании такого метода субъект исследования может и не знать того, что в данный момент проходит какое-то исследование. Это нужно для «чистоты» эксперимента, ведь когда человек не знает, что за ним наблюдают, он ведет себя естественно, раскованно и без смущения. Это как в реалити-шоу: когда знаешь, что тебя снимают, никогда не позволишь себе то, что мог бы сделать без камер (ругательства, аморальное поведение и т. д.).
Примером естественного эксперимента может служить искусственно созданная ситуация пожара в больнице, для того чтобы посмотреть и проанализировать действия обслуживающего персонала, т. е. врачей, по необходимости откорректировать их действия и указать на ошибки, чтобы при реальных обстоятельствах весь персонал больницы знал, как себя вести, и сумел оказать необходимую помощь. Преимущество данного метода заключается в том, что все действия происходят в привычной рабочей обстановке, но при этом полученные результаты можно использовать при решении практических проблем. Но данный метод эксперимента обладает и отрицательными моментами: наличие неконтролируемых факторов, контроль за которыми просто невозможен, а также тот факт, что необходимо получать информацию в кратчайший срок, иначе произойдет нарушение производственного процесса. Формы Е.Э.
Е. Э. имеет много форм и различных приемов. Для сбора первичной информации обычно используются: Вводные задачи. В простейшем своем виде он широко применяется в форме вводных задач. Задачи эти могут ставиться руководителем устно ("Случилось то-то, что будете делать?") или путем введения незаметно для сотрудника отклонения в его работу. Уже одно наблюдение за таким естественным экспериментом дает ценные факты, позволяет проверить ту или иную гипотезу исследователя.
Формирующий эксперимент. Широкое применение в практической психологии находит формирующий (обучающий или воспитывающий) эксперимент, в котором навыки или качества личности изучаются в процессе их формирования, развития. Измененение условий деятельности. Своеобразным методическим приемом является целенаправленное изменение структуры профессиональной деятельности. Смысл этого приема заключается в том, что при выполнении определенной деятельности выключаются по заранее продуманному плану отдельные анализаторы, меняется поза или «хватка» за рычаги управления, вводятся дополнительные раздражители, меняются эмоциональный фон и мотивы деятельности и т. д. Учет результатов деятельности в различных условиях позволяет оценить роль тех или иных факторов в структуре изучаемой деятельности и гибкость соответствующих навыков.
Моделирование изучаемой деятельности. Моделирование как метод применяется в ситуациях, когда исследование интересующего явления путем простого наблюдения, опроса, теста или эксперимента затруднено или невозможно в силу сложности или труднодоступности. В таком случае прибегают к созданию искусственной модели изучаемого феномена, повторяющей его основные параметры и предполагаемые свойства. На этой модели детально исследуют данное явление и делают выводы о его природе.
Кроме перечисленных методов, предназначенных для сбора первичной информации, в психологии широко применяются различные способы и приемы обработки этих данных, их логического и математического анализа для получения вторичных результатов, то есть фактов и выводов, вытекающих из интерпретации переработанной первичной информации. Для этой цели применяются, в частности, разнообразные методы математической статистики, без которых зачастую невозможно получить достоверную информацию об изучаемых явлениях, а также методы качественного анализа.

22. Формирующий эксперимент
Формирующий эксперимент заключается в том, чтобы человек или группа людей участвуют в организованном экспериментаторами обучении и формировании тех или иных качеств и навыков. И если результат сформирован, нам не нужно гадать, что привело к этому результату: именна эта методика к результату и привела. Не нужно гадать, каков уровень навыка у конкретного человека - насколько в эксперименте вы его навыку обучили, настолько он им и владеет. Хотите более устойчивый навык - продолжайте формирование. В таком эксперименте обычно участвуют две группы: экспериментальная и контрольная. Участникам экспериментальной группы предлагается определенное задание, которое (по мнению экспериментаторов) будет способствовать формированию заданного качества. Контрольной группе испытуемых данное задание не предоставляется. В конце эксперимента две группы сравниваются между собой для оценки полученных результатов. Формирующий психолого-педагогический эксперимент как метод появился благодаря теории деятельности (А.Н. Леонтьев, Д.Б.Эльконин и др.), в которой утверждается идея о первичности деятельности по отношению к психическому развитию. В ходе формирующего эксперимента активные действия совершают как испытуемые, так и экспериментатор. Со стороны экспериментатора необходима высокая степень вмешательства и контроля над основными переменными. Это отличает эксперимент от наблюдения или экспертизы.

23. Соотношение понятий «идеальный эксперимент», «реальный эксперимент» и «эксперимент полного соответствия».
Идеальный эксперимент - это эксперимент, организованный таким образом, что экспериментатор изменяет лишь не зависимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя пара метры, но и ряд других условий. Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность. Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность - главный признак хорошо проведенного эксперимента. Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента: фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание Если они не контролируются, то приводят к по явлению соответствующих эффектов. Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной. Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т.п.). Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих. Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта. Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок. Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом. Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп. Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.Эксперимент полного соответствия - это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности. От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным. К факторам, угрожающим внешней валидности, относят следующие:реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений); эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).
Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии - клинической, педагогической, организационной, поскольку в случае невалидного исследования его реультаты ничего не дадут при переносе их в реальные условия. Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых.

24. Понятие валидности. Конструктная и экологическая валидность.
Валидность- одна из важнейших характеристик психодиагностических методик и тестов, один из основных критериев их качества. Это понятие близко к понятию достоверности, но не вполне тождественно. Проблема валидности возникает в ходе разработки и практического применения теста или методики, когда требуется установить соответствие между степенью выраженности интересующего свойства личности и методом его измерения. Валидность указывает, что именно тест или методика измеряет и насколько хорошо это делает; чем они валиднее, тем лучше отображается в них то качество (свойство), ради измерения коего они создавались. Количественно валидность может выражаться через корреляции результатов, полученных с помощью теста или методики, с другими показателями, - например, с успешностью выполнения соответственной деятельности. Валидность можно обосновать разными путями, чаще всего - комплексно. Применяются также дополнительные понятия валидности концептуальной, критериальной, конструктивной, и прочие виды валидности - со своими способами установления их уровня. Требование валидности весьма важно, и многие нарекания в адрес тестов или иных психодиагностических методик связаны с сомнительностью их валидности. Разные концепции требуют различного состава заданий, поэтому важен вопрос валидности концептуальной. Чем больше задания соответствуют данной авторской концепции интеллекта, тем увереннее можно говорить о валидности концептуальной теста. Корреляция теста с эмпирическим критерием указывает на его возможную валидность по отношению к данному критерию. Определение валидности теста всегда требует постановки дополнительных вопросов: валидность для чего? для какой цели? по какому критерию? Итак, понятие валидности относится не только к тесту, но и к критерию оценки его качества. Чем выше коэффициент корреляции теста с критерием, тем выше валидность. Развитие анализа факторного позволило создавать тесты, валидные по отношению к идентифицируемому фактору. Только проверенные на валидность тесты можно использовать в ориентации профессиональной, отборе профессиональном, в исследованиях научных. Констру?ктная вали?дность (концептуальная, понятийная валидность) - частный случай операциональной валидности, степень адекватности метода интерпретации экспериментальных данных теории, которая определяется правильностью употребления терминов той или иной теории. Конструктная валидность, обоснованная Л.Кронбахом в 1955г., характеризуется способностью теста к измерению такой черты, которая была обоснована теоретически (как теоретический конструкт). Когда сложно найти адекватный прагматический критерий, может быть выбрана ориентация на гипотезы, сформулированные на основе теоретических предположений об измеряемом свойстве. Подтверждение этих гипотез свидетельствует о теоретической обоснованности методики. Сначала необходимо, насколько возможно полно, содержательно описать конструкт, для измерения которого предназначен тест. Это достигается за счет формулирования гипотез о нем, предписывающих, с чем данный конструкт должен коррелировать, а с чем не должен. После чего данные гипотезы проверяются. Это наиболее эффективный способ валидизации для личностных опросников, для которых установление единственного критерия их обоснованности является затруднительным. Конструктная валидность является наиболее комплексным и сложным видом валидности. Вместо одного результата (прежде всего прагматического) необходимо учитывать множество (чаще всего собственно психологических). Конструктная валидность имеет отношение к попыткам обозначения любых аспектов эксперимента. Опасности нарушения конструктной валидности заключаются в неправильном обозначении причины и эффекта с помощью абстрактных терминов, терминов, взятых из обыденного языка или формальной теории. Экологическая валидность - степень соответствия условий эксперимента исследуемой реальности. Например, в известном эксперименте Курта Левина по изучению типов лидерства отношения в группах подростков мало соответствовали отношениям в государстве, следовательно, была нарушена экологическая валидность.

25. Внутренняя валидность. Причины нарушения внутренней валидности.
Вну?тренняя вали?дность (англ. internal validity) - вид валидности, степень влияния независимой переменной на зависимую переменную. Внутренняя валидность тем выше, чем больше вероятность того, что изменение зависимой переменной вызвано изменением именно независимой переменной (а не чего-либо ещё). Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внутренняя валидность - соответствие реального исследования идеальному. При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором.
Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.
Изменение во времени (зависимость субъектов и окружающей среды от времени суток, времён года, изменений в самом человеке - старение, усталость и рассеивание внимания при длительных исследованиях, изменение мотивированности испытуемых и экспериментатора и т. д.; ср. естественное развитие)
Эффект последовательности
Эффект Розенталя (Пигмалиона)
Эффект Хоторна
Эффект плацебо
Эффект аудитории
Эффект первого впечатления
Эффект Барнума
Сопутствующее смешение
Факторы выборки
Неправильная селекция (неэквивалентность групп по составу, вызывающая систематическую ошибку в результатах)
Статистическая регрессия
Экспериментальный отсев (неравномерное выбывание испытуемых из сравниваемых групп, приводящее к неэквивалентности групп по составу)
Естественное развитие (общее свойство живых существ к изменению; ср. онтогенез) и др.

26. Внешняя валидность. Причины нарушения внешней валидности.
Внешняя валидность (англ. external validity) - вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность - соответствие реального исследования изучаемой объективной реальности. Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном - очень мало, можно рассматривать как критику внешней валидности.
Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.
Кэмпбелл называет главные причины нарушения внешней валидности:
1.*Эффект тестирований - уменьшение или увеличение восприимчивости испытуемых к экспериментальному воздействию под влиянием тестирования. Например, предварительный контроль знаний учеников может повысить их интерес к новому учебному материалу. Поскольку генеральная совокупность предварительному тестированию не подвергается, то результаты для нее могут быть нерепрезентативными. *Условия проведения исследования. Они вызывают реакцию испытуемого на эксперимент. Следовательно, его данные нельзя переносить на лиц, не принимавших участия в эксперименте, этими лицами является вся генеральная совокупность, кроме экспериментальной выборки. *Взаимодействие факторов отбора и содержания экспериментального воздействия. Их следствия - артефакты (в экспериментах с добровольцами или испытуемыми, участвующими по принуждению). *Интерференция экспериментальных воздействий. Испытуемые обладают памятью и обучаемостью. Если эксперимент состоит из нескольких серий, то первые воздействия не проходят для них бесследно и сказываются на появлении эффектов от последующих воздействий.
Большинство причин нарушения внешней валидности связано с особенностями психологического эксперимента, проводимого с участием человека, которые отливают психологическое исследование от эксперимента, осуществляемого специалистами других естественных наук.

27. Влияние ситуации эксперимента на его результаты.
Все психологи признают значение влияния ситуации эксперимента на его результаты. Так, выявлено, что процедура эксперимента оказывает большее воздействие на детей, чем на взрослых. Объяснения этому находят в особенностях детской психики:
1. Дети более эмоциональны при общении со взрослым. Взрослый для ребенка всегда является психологически значимой фигурой. Он либо полезен, либо опасен, либо симпатичен и заслуживает доверия, либо неприятен и от него надо держаться подальше.
Следовательно, дети стремятся понравиться незнакомому взрослому либо “спрятаться” от контактов с ним. Отношения с экспериментатором определяют отношение к эксперименту (а не наоборот).
2. Проявление личностных особенностей у ребенка зависит от ситуации в большей степени, чем у взрослого. Ситуация конструируется в ходе общения: ребенок должен успешно общаться с экспериментатором, понимать его вопросы и требования. Ребенок овладевает родным языком при общении с ближним окружением, усваивая не литературный язык, а говор, наречие, “сленг”. Экспериментатор, говорящий на литературно-научном языке, никогда не будет для него “эмоционально своим”, если только ребенок не принадлежит к тому же социальному слою. Непривычная для ребенка система понятий, способов коммуникации (манера говорить, мимика, пантомима и др.) будет мощнейшим барьером при его включении в эксперимент.
3. Ребенок обладает более живым воображением, чем экспериментатор, и поэтому может иначе, “фантастически”, интерпретировать ситуацию эксперимента, чем взрослый. В частности, критикуя эксперименты Пиаже, некоторые авторы высказывают следующие аргументы. Ребенок может рассматривать эксперимент как игру со “своими” законами. Экспериментатор переливает воду из одного сосуда в другой и спрашивает ребенка, сохранилось ли количество жидкости. Ребенку правильный ответ может показаться банальным, неинтересным, и он станет играть с экспериментатором. Он может вообразить, что ему предложили посмотреть фокус с волшебным стаканчиком или поучаствовать в игре, где не действуют законы сохранения материи. Но вряд ли ребенок раскроет содержание своих фантазий. Эти аргументы могут быть лишь домыслами критиков Пиаже. Ведь рациональное восприятие ситуации эксперимента есть симптом определенного уровня развития интеллекта. Однако проблема остается нерешенной, и экспериментаторам рекомендуют обращать внимание на то, правильно ли понимает ребенок обращенные к нему вопросы и просьбы, что он имеет в виду, давая тот или иной ответ.

28. Факторы общения, которые могут искажать результаты эксперимента
Основоположником изучения социально-психологических аспектов психологического эксперимента стал С.Розенцвейг. В 1933 г. он опубликовал аналитический обзор по этой проблеме, где выделил основные факторы общения, которые могут искажать результаты эксперимента: 1. Ошибки "отношения к наблюдаемому". Они связаны с пониманием испытуемым критерия принятия решения при выборе реакции. 2. Ошибки, связанные с мотивацией испытуемого. Испытуемый может быть мотивирован любопытством, гордостью, тщеславием и действовать не в соответствии с целями
экспериментатора, а в соответствии со своим пониманием целей и смысла эксперимента.3. Ошибки личностного влияния, связанные с восприятием испытуемым личности экспериментатора. В настоящее время эти источники артефактов не относятся к социально-психологическим (кроме социально-психологической мотивации).
Испытуемый может участвовать в эксперименте: либо добровольно, либо по принуждению. Само участие в эксперименте порождает у испытуемых ряд поведенческих проявлений, которые являются причинами артефактов. Среди наиболее известных - "эффект плацебо", "эффект Хотторна", "эффект аудитории". Эффект плацебо был обнаружен медиками: когда испытуемые считают, что препарат или действия врача способствуют их выздоровлению, у них наблюдается улучшение состояния. Эффект основан на механизмах внушения и самовнушения. Эффект Хотторна проявился при проведении социально-психологических исследований на фабриках. Привлечение к участию в эксперименте, который проводили психологи, расценивалось испытуемым как проявление внимания к нему лично. Участники исследования вели себя так, как ожидали от них экспериментаторы. Эффекта Хотторна можно избежать, если не сообщать испытуемому гипотезу исследования или дать ложную ("ортогональную"), а также знакомить с инструкциями как можно более безразличным тоном. Эффект социального усиления, или эффект аудитории, был обнаружен Г.Зайонцем. Присутствие любого внешнего наблюдателя, в частности экспериментатора и ассистента, изменяет поведение человека, выполняющего ту или иную работу. Эффект ярко проявляется у спортсменов на соревнованиях: разница в результатах, показываемых на публике и на тренировке.
Зайонц обнаружил* что во время обучения присутствие зрителей смущает испытуемых и снижает их результативные показатели. Когда деятельность освоена или сводится к простому физическому усилию, то результат улучшается. После проведения дополнительных исследований были установлены такие зависимости. 1. Влияние оказывает не любой наблюдатель, а лишь компетентный, значимый для исполнителя и способный дать оценку. Чем более компетентен и значим наблюдатель, тем этот эффект существеннее. 2.Влияние тем больше, чем труднее задача. Новые навыки и умения, интеллектуальные способности более подвержены воздействию (в сторону снижения эффективности). Наоборот, старые, простые, перцептивные и сенсомоторные навыки легче проявляются, продуктивность их реализации в присутствии значимого наблюдателя повышается. 3.Соревнование и совместная деятельность, увеличение количества- наблюдателей усиливает эффект (как положительную, так и отрицательную тенденцию).
4."Тревожные" испытуемые при выполнении сложных и новых заданий, требующих интеллектуальных усилий, испытывают большие затруднения, чем эмоционально стабильные личности. 5.Действие "эффекта Зайонца" хорошо описывается законом оптимума активации Иеркса-Додсона. Присутствие внешнего наблюдателя (экспериментатора) повышает мотивацию испытуемого. Соответственно оно может либо улучшить продуктивность, либо привести к "перемотивации" и вызвать срыв деятельности.

29. Поведенческие проявления, являющиеся причинами артефактов («эффект плацебо», «эффект Хотторна», «эффект аудитории»).
Проявления эффекта плацебо связаны с неосознанным ожиданием пациента, его способностью поддаваться влиянию, степенью доверия к психологу. Этот эффект используется при изучении роли внушения в условиях воздействия медицинских препаратов, когда одной группе испытуемых дают настоящий препарат, действие которого тестируют, а другой - плацебо. Если препарат действительно имеет положительный эффект, то он должен быть больше, чем от использования плацебо. Типичный уровень положительного плацебо-эффекта в клинических исследованиях составляет 5-10%. В исследованиях также несложно вызвать и отрицательный эффект ноцебо, когда от приема «пустышки» 1-5% исследуемых испытывают дискомфорт (аллергию, тошноту, нарушение сердечной деятельности). Клинические наблюдения свидетельствуют о том, что нервный персонал приводит ноцебо-эффекты, а назначение больным лекарств, снижающих тревогу, значительно снижает тревогу у самих врачей. Такое явление было названо «плацебо-рикошет».
Эффект Хоторна (англ. Hawthorne effect) заключается в том, что условия новизны и интереса к эксперименту, повышенное внимание к самому исследованию приводят к весьма положительным результатам, что является искажением и уходом от реального положения вещей. Согласно действию эффекта Хоторна участники исследования, взволнованные своей причастностью к нему, «слишком добросовестны», поэтому действуют иначе, чем обычно. В наибольшей степени этот артефакт проявляется в социально-психологических исследованиях. Эффект был установлен группой исследователей во главе с Эльтон Мейо во время Хоторнского эксперимента (1927-1932). В частности, было доказано, что само участие в эксперименте влияет на рабочих таким образом, что они ведут себя именно так, как этого от них ожидают экспериментаторы. Исследуемые лица рассматривают свое участие в исследовании как проявление внимания к себе. Чтобы избежать эффекта Хоторна, экспериментатору нужно вести себя спокойно, принимать меры, чтобы участники не узнали гипотезу, которая проверяется.
эффект аудитории, - эффект, проявляющийся в психологическом исследовании, заключающийся в том, что присутствие любого внешнего наблюдателя, в частности экспериментатора и ассистента, изменяет поведение человека, выполняющего ту или иную работу. Эффект аудитории был обнаружен Г. Зайонцем и по-другому называется эффект Зайонца. Этот эффект ярко проявляется у спортсменов на соревнованиях, где разница в результатах, показываемых на публике, существенно отличается в лучшую сторону от результатов на тренировке. Зайонц обнаружил, что во время эксперимента присутствие зрителей смущает испытуемых и снижает их результативные показатели.


План этот применяется крайне редко. В большинстве учебников по эксперимен­тальной психологии он даже не упоминается. Кэмпбелл также утверждает, что этот план ни разу не был реализован.

Гораздо чаще, чем приведенные выше «экстравагантные» планы, применяются схемы квазиэкспериментов, которые имеют общее название «дискретные времен­ные серии». Для классификации этих планов можно выделить два основания: иссле­дование проводится 1) с участием одной группы или нескольких; 2) с одним воздей­ствием либо серией. Следует заметить, что планы, в которых реализуется серия од­нородных или разнородных воздействий с тестированием после каждого воздействия, получили в советской и российской психологической науке по традиции на­звание «формирующие эксперименты». По своей сути они, конечно, являются ква­зиэкспериментами со всеми присущими таким исследованиям нарушениями внеш­ней и внутренней валидности.

Используя такие планы, мы с самого начала должны отдавать себе отчет в том, что в них отсутствуют средства контроля внешней валидности. Невозможно про­контролировать взаимодействие предварительного тестирования и эксперименталь­ного воздействия, ликвидировать эффект систематического смешения (взаимодей­ствия состава групп и экспериментального воздействия), проконтролировать реак­цию испытуемых на эксперимент и определить эффект взаимодействия между различными экспериментальными воздействиями.

Квазиэкспериментальные планы, построенные по схеме временных серий на од­ной группе, по структуре сходны с экспериментальными планами для одного испы­туемого.

План дискретных временных серий чаще всего используется в психологии раз­вития, педагогической, социальной и клинической психологии. Суть его состоит в том, что первоначально определяется исходный уровень зависимой переменной на группе испытуемых с помощью серии последовательных замеров. Затем исследова­тель воздействует на испытуемых экспериментальной группы, варьируя независи­мую переменную, и проводит серию аналогичных измерений. Сравниваются уров­ни, или тренды, зависимой переменной до и после воздействия. Схема плана выгля­дит так:

Главный недостаток плана дискретных временных серий в том, что он не дает возможности отделить результат влияния независимой переменной от влияния фо­новых событий, которые происходят в течение исследования. Чтобы ликвидировать эффект «истории», рекомендуют использовать экспериментальную изоляцию испы­туемых.

Модификацией этого плана является другой квазиэксперимент по схеме времен­ных серий, в котором воздействие перед замером чередуется с отсутствием воздей­ствия перед замером:

Чередование может быть регулярным или случайным. Этот вариант подходит лишь в том случае, когда эффект воздействия обратим. При обработке данных, по­лученных в эксперименте, серии разбивают на две последовательности и сравнива­ют результаты тех замеров, где было воздействие, с результатами тех замеров, где оно отсутствовало. Для сравнения данных используется t -критерий Стьюдента с числом степеней свободы п - 2 (где п - число ситуаций одного типа).

Планы временных серий часто реализуются на практике (как я уже заметил, в советской педагогической психологии формирующий эксперимент считался чуть ли не единственным вариантом доказательного исследования). При их реализации час­то наблюдается известный «эффект Хотторна». Впервые его обнаружили Диксон и Ротлизбергер в 1939 г., когда проводили исследование на заводах Хотторна в Чика­го. Предполагалось, что изменение системы организации труда позволит повысить его производительность. В результате оказалось, как выявили опросы рабочих, что само по себе участие в эксперименте повысило их мотивацию к труду. Испытуемые поняли, что ими лично интересуются, и стали работать продуктивнее. Чтобы конт­ролировать этот эффект (по своей сути он не отличается от плацебо-эффекта в ква­зиэкспериментах, проводимых по методу временных серий), используется конт­рольная группа.

Схема плана временных серий для двух неэквивалентных групп, из которых одна не получает воздействия, выглядит так:

Квазиэксперимент позволяет контролировать действие фактора фоновых воздей­ствий (эффект «истории»). Обычно именно этот план рекомендуется исследовате­лям, проводящим эксперименты с участием естественных групп в детских садах, школах, клиниках или на производстве. Его можно назвать планом формирующего эксперимента с контрольной выборкой. Реализовать этот план весьма трудно, но в том случае, если удается провести рандомизацию групп, он превращается в план «истинного формирующего эксперимента».

Возможна комбинация этого плана и предыдущего, в котором чередуются серии с воздействием и его отсутствием на одной выборке.

5.2.3 Планыeх-post-facto

В заключение рассмотрим еще один специфический метод, который часто применяется в психологии. У него есть несколько наименований: экспери­мент, на который ссылаются, эксперимент ex-post-facto и т.д. Он часто применяет­ся в социологии, педагогике, а также в нейропсихологии и клинической психологии. В социологических исследованиях его часто использовали в 1930-40-е гг. Тогда же социолог Ф. С. Чейз ввел название этого метода и разработал схемы анализа дан­ных. В социологии и педагогике стратегия его применения состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В качестве воздействия (по­зитивного значения независимой переменной) выступает некоторое реальное собы­тие из их жизни. Отбирается группа «испытуемых», подвергшаяся воздействию, и группа, не испытавшая его. Отбор осуществляется на основании данных об особен­ностях «испытуемых» до воздействия; в качестве сведений могут выступать личные воспоминания и автобиографии, сведения из архивов, анкетные данные, медицин­ские карты и т.д. Затем проводится тестирование зависимой переменной у предста­вителей «экспериментальной» и контрольной групп. Данные, полученные в резуль­тате тестирования групп, сопоставляются и делается вывод о влиянии «естествен­ного» воздействия на дальнейшее поведение испытуемых. Тем самым план ex-post-facto имитирует схему эксперимента для двух групп с их уравниванием (лучше - рандомизацией) и тестированием после воздействия.

Эквивалентность групп достигается либо методом рандомизации, либо методом попарного уравнивания, при котором сходные индивиды относятся к разным груп­пам. Метод рандомизации дает более надежные результаты, но применим лишь то­гда, когда выборка, из которой мы формируем контрольную и основную группы, до­статочно велика.

Этот план реализуется во многих современных исследованиях. Типичным явля­ется исследование посттравматического стресса, который возникает у некоторых лиц, оказавшихся в ситуациях, выходящих за пределы обычного жизненного опыта, связанных с угрозой для здоровья человека и его жизни. Посттравматический стресс встречается у многих (но не у всех) участников войны, жертв насилия, свидетелей и жертв природных и техногенных катастроф и т.д. Изучение причин возникновения посттравматического стресса проводится по следующей схеме: выделяется выборка лиц, перенесших воздействие боевой ситуации, катастрофы и т.п., тестируется на предмет наличия посттравматического синдрома; результаты сопоставляются с ре­зультатами контрольной выборки. Наилучшей стратегией формирования основной и контрольной выборки является предварительный отбор «испытуемых» для тести­рования на основе анкетных данных и рандомизация групп. Но в реальности может проводиться диагностика только тех лиц, перенесших воздействие травматического фактора, которые сами обращаются с просьбой пройти обследование к психологам либо врачам. Таким образом, может существовать риск, что выборка добровольцев будет сильно отличаться от всей популяции перенесших травматическое воздей­ствие. В первую очередь эти отличия проявляются в повышенной частоте встречае­мости синдрома посттравматического стресса. Эффект воздействия травматическо­го фактора на популяцию будет преувеличен. И вместе с тем эксперимент ex-post-facto - единственно возможный способ проведения таких исследований (над этими проблемами работает лаборатория психологии посттравматических состояний Ин­ститута психологии РАН, руководитель - Н. В. Тарабрина).

Метод ex-post-facto часто применяется в нейропсихологии: травмы головного мозга, поражения определенных структур предоставляют уникальную возможность для выявления локализации психический функций. Травмы коры больших полуша­рий во время войны (в первую очередь второй мировой) дали, как это ни кощун­ственно звучит, богатейший материал нейропсихологам и нейрофизиологам, в том числе - отечественным (работы Лурии и его школы).

5.3. Корреляционное исследование

Читателю следует обратиться к гл. 6. В ней подробно изложена тео­рия психологических измерений. Детальная характеристика особенностей психо­логического измерения и тестирования необходима не только сама по себе, но и для того, чтобы можно было подойти к выяснению особенностей наиболее распростра­ненной схемы современного психологического эмпирического исследования - кор­реляционного.

Теория корреляционного исследования, основанная на представлениях о мерах корреляционной связи, разработана К. Пирсоном и подробно излагается в учебниках по математической статистике. Здесь рассматриваются лишь методические ас­пекты корреляционного психологического исследования.

Стратегия проведения корреляционного исследования сходна с квазиэкспери­ментом. Отличие от квазиэксперимента лишь в том, что управляемое воздействие на объект отсутствует. План корреляционного исследования несложен. Исследова­тель выдвигает гипотезу о наличии статистической связи между несколькими пси­хическими свойствами индивида или между определенными внешними уровнями и психическими состояниями. При этом предположения о причинной зависимости не обсуждаются.

Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными. В психологии в качестве переменных могут выступать психи­ческие свойства, процессы, состояния и др.

«Корреляция» в прямом переводе означает «соотношение». Если изменение од­ной переменной сопровождается изменением другой, то можно говорить о корреля­ции этих переменных. Наличие корреляции двух переменных ничего не говорит о причинно-следственных зависимостях между ними, но дает возможность выдвинуть такую гипотезу. Отсутствие же корреляции позволяет отвергнуть гипотезу о при­чинно-следственной связи переменных. Различают несколько интерпретаций нали­чия корреляционной связи между двумя измерениями:

1. Прямая корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой. Примером является закон Хика: скорость переработ­ки информации пропорциональна логарифму от числа альтернатив. Другой пример: корреляция высокой личностной пластичности и склонности к смене социальных установок.

2. Корреляция, обусловленная 3-й переменной. 2 переменные (а, с) связаны одна с другой через 3-ю (в), не измеренную в ходе исследования. По правилу транзитив­ности, если есть R (а, b) и R (b, с), то R (а, с). Примером подобной корреляции явля­ется установленный психологами США факт связи уровня интеллекта с уровнем доходов. Если бы такое исследование проводилось в сегодняшней России, то резуль­таты были бы иными. Очевидно, все дело в структуре общества. Скорость опозна­ния изображения при быстром (тахистоскопическом) предъявлении и словарный запас испытуемых также положительно коррелируют. Скрытой переменной, обу­словливающей эту корреляцию, является общий интеллект.

3. Случайная корреляция, не обусловленная никакой переменной.

4. Корреляция, обусловленная неоднородностью выборки. Представим себе, что выборка, которую мы будем обследовать, состоит из двух однородных групп. Напри­мер, мы хотим выяснить, связана ли принадлежность к определенному полу с уров­нем экстраверсии. Считаем, что «измерение» пола трудностей не вызывает, экстра­версию же измеряем с помощью опросника Айзенка ETI -1. У нас 2 группы: мужчи­ны-математики и женщины-журналистки. Неудивительно, если мы получим линейную зависимость между полом и уровнем экстраверсии-интроверсии: боль­шинство мужчин будут интровертами, большинство женщин - экстравертами.

Корреляционные связи различаются по своему виду. Если повышение уровня од­ной переменной сопровождается повышением уровня другой, то речь идет о поло­жительной корреляции. Чем выше личностная тревожность, тем больше риск заболеть язвой желудка. Возрастание громкости звука сопровождается ощущением по­вышения его тона. Если рост уровня одной переменной сопровождается снижением уровня другой, то мы имеем дело с отрицательной корреляцией. По данным Зайонца, число детей в семье отрицательно коррелирует с уровнем их интеллекта. Чем боязливей особь, тем меньше у нее шансов занять доминирующее положение в группе.

Нулевой называется корреляция при отсутствии связи переменных.

В психологии практически нет примеров строго линейных связей (положитель­ных или отрицательных). Большинство связей - нелинейные. Классический при­мер нелинейной зависимости - закон Йеркса-Додсона: возрастание мотивации первоначально повышает эффективность научения, а затем наступает снижение продуктивности (эффект «перемотивации»). Другим примером является связь меж­ду уровнем мотивации достижений и выбором задач различной трудности. Лица, мо­тивированные надеждой на успех, предпочитают задания среднего диапазона труд­ности - частота выборов на шкале трудности описывается колоколообразной кривой.

Математическую теорию линейных корреляций разработал Пирсон. Ее основа­ния и приложения излагаются в соответствующих учебниках и справочниках по ма­тематической статистике. Напомним, что коэффициент линейной корреляции Пир­сона г варьируется от -1 до +1. Он вычисляется путем нормирования ковариации переменных на произведение их среднеквадратических отклонений.

Значимость коэффициента корреляции зависит от принятого уровня значимости а и от величины выборки. Чем больше модуль коэффициента корреляции, тем бли­же связь переменных к линейной функциональной зависимости.

5.3.1 Планирование корреляционного исследования

План корреляционного исследования является разновидностью ква­зиэкспериментального плана при отсутствии воздействия независимой переменной на зависимые. В более строгом смысле: тестируемые группы должны быть в эквива­лентных неизменных условиях. При корреляционном исследовании все измеряемые переменные - зависимые. Фактором, определяющим эту зависимость, может быть одна из переменных или скрытая, неизмеряемая переменная.

Корреляционное исследование разбивается на серию независимых друг от друга измерений в группе испытуемых Р. Различают простое и сравнительное корреляци­онные исследования. В первом случае группа испытуемых однородна. Во втором случае мы имеем несколько рандомизированных групп, различающихся по одному или нескольким определенным критериям. В общем виде план такого исследования описывается матрицей вида: Р х О (испытуемые х измерения). Результатом этого исследования является матрица корреляций. Обработку данных можно вести, срав­нивая строки исходной матрицы или столбцы. Коррелируя между собой строки, мы сопоставляем друг с другом испытуемых; корреляции же интерпретируются как ко­эффициенты сходства-различия людей между собой. Разумеется, Р -корреляции можно вычислять лишь в том случае, если данные приведены к одной шкальной раз­мерности, в частности с помощью Z-преобразования:

Коррелируя между собой столбцы, мы проверяем гипотезу о статистической свя­зи измеряемых переменных. В этом случае их размерность не имеет никакого значе­ния.


Такое исследование называется структурным, так как в итоге мы получаем мат­рицу корреляции измеренных переменных, которая выявляет структуру связей меж­ду ними.

В исследовательской практике часто возникает задача выявить временные кор­реляции параметров или же обнаружить изменение структуры корреляций парамет­ров во времени. Примером таких исследований являются лонгитюды.

План лонгитюдного исследования представляет собой серию отдельных замеров одной или нескольких переменных через определенные промежутки времени. Лонгитюдное исследование - это промежуточный вариант между квазиэкспериментом и корреляционным исследованием, так как время интерпретируется исследовате­лем как независимая переменная, определяющая уровень зависимых (например, личностных черт).

Полный план корреляционного исследования представляет собой параллелепи­пед Р х О х Р, грани которого обозначаются как «испытуемые», «операции», «вре­менные этапы».

Результаты исследования можно анализировать по-разному. Помимо вычисле­ния Р- и О- корреляций возникает возможность сравнения матриц Р х О , получен­ных в разные периоды времени, путем подсчета двухмерной корреляции - связи двух переменных с третьей. То же самое касается и матриц Р х Т и Т х О.

Но чаще исследователи ограничиваются обработкой другого типа, проверяя ги­потезы об изменении переменных во времени, анализируя матрицы Р х Т по отдель­ным измерениям.

Рассмотрим основные типы корреляционного исследования.

1. Сравнение двух групп. Этот план лишь условно можно отнести к корреляци­онным исследованиям. Он применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного психологического свойства или состояния. Допустим, у вас есть желание выяснить, отличаются ли мужчины и женщины по уровню экстраверсии. Для этого вы должны создать две репрезентативные выборки, уравненные по прочим значимым для экст­раверсии-интроверсии параметрам (по параметрам, влияющим на уровень экстра­версии-интроверсии), и провести измерение с помощью теста EPQ. Средние ре­зультаты у 2 групп сравниваются с помощью t -критерия Стьюдента. При необходи­мости сравниваются дисперсии показателя экстраверсии по критерию F.

Простейшее сопоставление 2 групп содержит в себе источники ряда артефактов, характерных для корреляционного исследования. Во-первых, возникает проблема рандомизации групп - они должны четко разделяться по выбранному критерию. Во-вторых, реальные измерения происходят не одновременно, а разновременно:

R" О 1 -

R" - О 2

В-третьих, хорошо, если тестирование внутри группы проводят одновременно. Если же отдельных испытуемых тестируют в разное время, то на результате может сказаться влияние временного фактора на величину переменной.

Пол без особых усилий (в том числе без хирургического воздействия) поменять сегодня нельзя, но можно перейти из одной учебной группы в другую, а также из класса в класс.

Если исследователь задался целью сравнить две учебные группы по уровню ус­певаемости, он должен позаботиться о том, чтобы не произошло их «перемешива­ния» в ходе исследования.

Эффект неодновременности измерении в двух группах (в случае предположения о значимости этого фактора) можно было бы «убрать» введением двух контрольных групп, но ведь тестировать их тоже придется в другое время. Удобнее разделить пер­воначальные группы пополам и тестирование (по возможности) провести по следу­ющему плану:

R" О 1 -

R" - О 2

__________________

R" О 3 -

R" - О 4

Обработка результатов для выявления эффекта последовательности осуществ­ляется методом двухфакторного анализа 2 х 2. Сравнение естественных (нерандо­мизированных) групп ведется по тому же плану.

2. Одномерное исследование одной группы, в разных условиях. План этого ис­следования аналогичен предыдущему. Но по своей сути он близок к эксперименту, так как условия, в которых находится группа, различаются. В случае корреляцион­ного исследования мы не управляем уровнем независимой переменной, а лишь кон­статируем изменение поведения индивида в новых условиях. Примером может слу­жить изменение уровня тревожности детей при переходе из детского сада в 1-й класс школы: группа одна и та же, а условия различные.

Главные артефакты этого плана - кумуляция эффектов последовательности и тестирования. Кроме того, искажающее влияние на результаты может оказывать временной фактор (эффект естественного развития).

Схема этого плана выглядит очень просто: А О 1 В О 2 , где А и В - разные условия. Испытуемые могут отбираться из генеральной популяции случайным образом или представлять собой естественную группу.

Обработка данных сводится к оценке сходства между результатами тестирова­ния в условиях А и В. Для контроля эффекта последовательности можно произвес­ти контрбалансировку и перейти к корреляционному плану для двух групп:

А О 1 В О 2

В О 3 А О 4

В этом случае мы можем рассматривать А и В как воздействия, а план - как квазиэксперимент.

3. Корреляционное исследование попарно эквивалентных групп. Этот план ис­пользуется при исследовании близнецов методом внутрипарных корреляций. Дизи-готные или монозиготные близнецы разбиваются на две группы: в каждой - один близнец из пары. У близнецов обеих групп измеряют интересующие исследователя психические параметры. Затем вычисляется корреляция между параметрами (О -корреляция) или близнецами (Р -корреляция). Существует множество более слож­ных вариантов планов психогенетических исследований близнецов.

4. Для проверки гипотезы о статистической связи нескольких переменных, ха­рактеризующих поведение, проводится многомерное корреляционное исследова­ние. Оно реализуется по следующей программе. Отбирается группа, которая пред­ставляет собой либо генеральную совокупность, либо интересующую нас популя­цию. Отбираются тесты, проверенные на надежность и внутреннюю валидность. Затем группа тестируется по определенной программе.

R А(О 1) В(О 2) С (О 3) D(О 4) .... N(О n),

где А, В, С... N - тесты, О i - операция тестирования.

Данные исследования представлены в форме матрицы: т х п, где т - количе­ство испытуемых, п - тесты. Матрица «сырых» данных обрабатывается, подсчиты­ваются коэффициенты линейной корреляции. Получается матрица вида т х п, где п - число тестов. В клеточках матрицы - коэффициенты корреляции, по ее диаго­нали - единицы (корреляция теста с самим собой). Матрица симметрична относи­тельно этой диагонали. Корреляции оцениваются на статистические различия сле­дующим образом: сначала r переводится в Z -оценки, затем для сравнения r приме­няется t -критерий Стьюдента. Значимость корреляции оценивается при ее сопос­тавлении с табличным значением. При сравнении r эксп. и r теор. принимается гипотеза о значимом отличии корреляции от случайной при заданном значении точности (a= 0,05 или a= 0,001). В некоторых случаях возникает необходимость вычисле­ния множественных корреляций, частных корреляций, корреляционных отношений или редукции размерности - уменьшения числа параметров.

Для уменьшения числа измеренных параметров используются различные мето­ды латентного анализа. Применению их в психологическом исследовании посвяще­но множество публикаций. Главной причиной артефактов, возникающих при прове­дении многомерного психологического тестирования, является реальное физиче­ское время. При анализе данных корреляционного исследования мы отвлекаемся от неодновременности проводимых измерений. Кроме того, считается, что результат последующего измерения не зависит от предыдущего, т. е. не существует эффекта переноса.

Перечислим основные артефакты, которые возникают в ходе применения этого плана:

1. Эффект последовательности - предшествующее выполнение одного теста мо­жет повлиять на результат выполнения другого (симметричный или асимметрич­ный перенос).

2. Эффект научения - при выполнении серии различных тестовых испытаний у участника эксперимента может повышаться компетентность в тестировании.

3. Эффекты фоновых воздействий и «естественного» развития приводят к неконт­ролируемой динамике состояния испытуемого в ходе исследования.

4. Взаимодействие процедуры тестирования и состава группы проявляется при ис­следовании неоднородной группы: интроверты хуже сдают экзамены, чем экст­раверты, «тревожные» хуже справляются со скоростными тестами интеллекта. Для контроля эффектов последовательности и переноса следует пользоваться тем же приемом, что и при планировании экспериментов, а именно - контрбалан­сировкой. Только вместо воздействий меняется порядок проведения тестов.

Таблица 5.14

Для 3 тестов полный план корреляционного исследования с контрбалансиров­кой выглядит следующим образом:

1-я группа: А В С

2-я группа: С А В

3-я группа: В С А

где А, В, С - различные тесты. Однако я не знаю ни одного случая, когда бы в отече­ственных корреляционных исследованиях контролировались эффекты тестирова­ния и переноса.

Приведу один пример. Нам необходимо было выявить, как влияет вид задания на успешность выполнения сменяющих одна другую задач. Мы предположили, что для испытуемых не безразлично, в какой последовательности им даются тесты. Были выбраны задания на креативность (из теста Торренса) и на общий интеллект (из теста Айзенка). Задачи давались испытуемым в случайном порядке. Оказалось, что если задание на креативность выполняется первым, то скорость и точность реше­ния задачи на интеллект снижается. Обратного эффекта не наблюдалось. Не вдава­ясь в объяснения этого явления (это сложная проблема), заметим, что здесь мы столкнулись с классическим эффектом асимметричного переноса.

5. Структурное корреляционное исследование. От предшествующих вариан­тов эта схема отличается тем, что исследователь выявляет не отсутствие или нали­чие значимых корреляций, а различие в уровне значимых корреляционных зависи­мостей между одними и теми же показателями, измеренными у представителей раз­личных групп.

Поясним этот случай примером. Допустим, нам необходимо проверить гипотезу о том, влияет ли пол родителя и пол ребенка на сходство или различие их личност­ных черт, например уровня нейротизма по Айзенку. Для этого мы должны провести исследование реальных групп - семей. Затем вычисляются коэффициенты корре­ляции уровней тревожности родителей и детей. Получаются 4 основных коэффици­ента корреляции: 1) мать-дочь; 2) мать-сын; 3) отец-дочь; 4) отец-сын, и два дополнительных: 5) сын-дочь; 6) мать-отец. Если нас интересует лишь сравне­ние сходства-различия первой группы корреляций, а не исследование ассортативности, то мы строим 4-клеточную таблицу 2 х 2 (табл. 5.14).

Корреляции подвергаются Z -преобразованию и сравниваются по t- критерию Стьюдента.

Здесь приведен простейший пример структурного корреляционного исследования. В исследовательской практике встречаются более сложные версии структурных корреляционных исследований. Чаще всего они проводятся в психологии индивидуально­сти (Б. Г. Ананьев и его школа), психологии труда и обучения (В. Д. Шадриков), пси­хофизиологии индивидуальных различий (Б. М. Теплов, В. Д. Небылицын, В. М. Ру-салов и др.), психосемантике (В. Ф. Петренко, А. Г. Шмелев и др.).

6. Лонгитюдное корреляционное исследование. Лонгитюдное исследование - вариант квазиэкспериментальных исследовательских планов. Воздействующей пе­ременной психолог, проводящий лонгитюдное исследование, считает время. Оно яв­ляется аналогом плана тестирования одной группы в разных условиях. Только усло­вия считаются константными. Результатом любого временного исследования (в том числе и лонгитюдного) является построение временного тренда измеряемых пере­менных, которые могут быть аналитически описаны теми или иными функциональ­ными зависимостями.

Лонгитюдное корреляционное исследование строится по плану временных се­рий с тестированием группы через заданные промежутки времени. Помимо эффектов обучения, последовательности и т.д. в лонгитюдном исследовании следует учи­тывать эффект выбывания: не всех испытуемых, первоначально принимавших учас­тие в эксперименте, удается обследовать через какое-то определенное время. Воз­можно взаимодействие эффектов выбывания и тестирования (отказ от участия в последующем обследовании) и т.д.

Структурное лонгитюдное исследование отличается от простого лонгитюда тем, что нас интересует не столько изменение центральной тенденции или разброса ка­кой-либо переменной, сколько изменение связей между переменными. Такого рода исследования широко распространены в психогенетике.

Мотивация испытуемого рассматривается главным образом как интерес к данному эксперименту. Если интерес отсутствует или слаб, то трудно рассчитывать на полноценность выполнения испытуемым предусмотренных в эксперименте заданий и на надежность его ответов. Слишком высокий интерес, «перемотивация», также чревата неадекватностью ответов испытуемого. Поэтому для получения исходно приемлемого уровня мотивации экспериментатор должен самым серьезным образом подойти к формированию контингента испытуемых и подбору стимулирующих их мотивацию факторов. В качестве таких факторов могут выступать состязательность, различные виды вознаграждения, интерес к своим показателям, профессиональный интерес и др.
Психофизиологические состояния испытуемых рекомендуется не только поддерживать на одном уровне, но и оптимизировать этот уровень, т. е. испытуемые должны находиться в «нормальном» состоянии. Следует убедиться, что до проведения опыта у испытуемого не было сверхзначимых для него переживаний, у него достаточно времени для участия в эксперименте, он не голоден и т. п. Во время проведения эксперимента не следует излишне возбуждать или подавлять испытуемого. Если же эти условия выполнить не удается, то проведение эксперимента лучше отложить.
Из рассмотренных характеристик переменных и способов их контроля становится понятой необходимость тщательной подготовки эксперимента при его планировании. В реальных условиях экспериментирования добиться 100 %-го контроля всех переменных невозможно, однако различные психологические эксперименты значительно отличаются друг от друга степенью контроля переменных. Рассмотрению вопроса оценки качества эксперимента посвящен следующий раздел.

4.5. Валидность и надежность эксперимента

Для конструирования и оценки экспериментальных процедур используются понятия: идеальный эксперимент, эксперимент полного соответствия и бесконечный эксперимент.
Идеальный эксперимент – это эксперимент, организованный таким образом, что экспериментатор изменяет лишь независимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя параметры, но и ряд других условий.
Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность. Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность – главный признак хорошо проведенного эксперимента.
Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента: фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание. Если они не контролируются, то приводят к появлению соответствующих эффектов.
Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной. Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т. п.). Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих. Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта. Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок. Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом. Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп.
Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.
Эксперимент полного соответствия – это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности. От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.
К факторам, угрожающим внешней валидности, относят следующие:
реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений);
эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);
фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);
фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).
Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии – клинической, педагогической, организационной, поскольку в случае невалидного исследования его результаты ничего не дадут при переносе их в реальные условия.
Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых. Однако суть эксперимента состоит именно в том, чтобы на основе ограниченного числа проб или при помощи ограниченной группы испытуемых выявить причинно-следственные связи между явлениями. Поэтому бесконечный эксперимент не только невозможен, но и бессмыслен. Для достижения высокой надежности эксперимента количество проб или число испытуемых должно соответствовать изменчивости изучаемого явления.
Следует отметить, что при увеличении числа испытуемых повышается и внешняя валидность эксперимента, так как его результаты могут быть перенесены на более широкую популяцию. Для проведения экспериментов с группой испытуемых необходимо рассмотреть вопрос об экспериментальных выборках.

4.6. Экспериментальные выборки

Как указывалось выше, эксперимент может проводиться либо с одним испытуемым, либо с группой испытуемых. Эксперимент с одним испытуемым проводится лишь в некоторых специфических ситуациях. Во-первых, это ситуации, когда индивидуальными различиями испытуемых можно пренебречь, т. е. испытуемым может быть любой человек (если в эксперименте изучаются его особенности в отличие, например, от животного). В других ситуациях, напротив, испытуемый представляет собой уникальный объект (гениальный шахматист, музыкант, художник и др.). Возможны также ситуации, когда от испытуемого требуется особая компетентность как результат обучения или неординарного жизненного опыта (единственный выживший в авиационной катастрофе и т. п.). Одним испытуемым ограничиваются и в тех случаях, когда повторение данного эксперимента с участием других испытуемых невозможно. Для экспериментов с одним испытуемым разработаны особые экспериментальные планы (подробно о них см. 4.7).
Чаще эксперименты проводятся с группой испытуемых. В этих случаях выборка испытуемых должна представлять собой модель генеральной совокупности, на которую затем будут распространяться результаты исследования. Первоначально исследователь решает проблему численности экспериментальной выборки. В зависимости от цели исследования и возможности экспериментатора она может составлять от нескольких испытуемых до нескольких тысяч человек. Количество испытуемых в отдельной группе (экспериментальной или контрольной) варьируется от 1 до 100 человек. Для применения статистических методов обработки рекомендуется число испытуемых в сравниваемых группах не менее 30–35 человек. Кроме того, целесообразно увеличивать количество испытуемых по крайней мере на 5-10 % от требуемого, так как часть из них или их результатов будет «отбракована» в ходе эксперимента.
Для формирования выборки испытуемых необходимо учитывать несколько критериев.
1. Содержательный. Он заключается в том, что подбор группы испытуемых должен соответствовать предмету и гипотезе исследования. (Например, бессмысленно набирать в группу испытуемых детей двухлетнего возраста для выявления уровня произвольного запоминания.) Желательно создать идеальные представления об объекте экспериментального исследования и при формировании группы испытуемых минимально отклоняться от характеристик идеальной экспериментальной группы.
2. Критерий эквивалентности испытуемых. При формировании группы испытуемых следует учесть все значимые характеристики объекта исследования, различия в выраженности которых могут существенно повлиять на зависимую переменную.
3. Критерий репрезентативности. Группа лиц, участвующих в эксперименте, должна представлять всю часть генеральной совокупности, на которую будут распространяться результаты эксперимента. Величина экспериментальной выборки определяется видом статистических мер и выбранной точностью (достоверностью) принятия или отвержения экспериментальной гипотезы.
Рассмотрим стратегии отбора испытуемых из популяции.
Случайная стратегия заключается в том, что каждому члену генеральной совокупности предоставляется равный шанс попадания в экспериментальную выборку. Для этого каждому индивиду присваивается номер, а затем с помощью таблицы случайных чисел формируется экспериментальная выборка. Данная процедура трудноосуществима, поскольку каждый представитель интересующей исследователя популяции должен быть учтен. Кроме того, случайная стратегия дает хорошие результаты при формировании экспериментальной выборки большого объема.
Стратометрический отбор используется в том случае, если в экспериментальной выборке обязательно должны быть представлены испытуемые с определенным набором характеристик (пол, возраст, уровень образования и т. п.). Выборка составляется таким образом, чтобы в ней были равно представлены испытуемые каждой страты (слоя) с заданными характеристиками.
Стратометрический случайный отбор совмещает две предыдущие стратегии. Представителям каждой страты присваиваются номера и из них случайным образом формируется экспериментальная выборка. Данная стратегия эффективна при отборе экспериментальной выборки небольшого объема.
Репрезентативное моделирование применяется в том случае, когда исследователю удается создать модель идеального объекта экспериментального исследования. Характеристики реальной экспериментальной выборки должны минимально отклоняться от характеристик идеальной экспериментальной выборки. Если исследователю известны не все характеристики идеальной модели экспериментального исследования, то применяется стратегия приближенного моделирования. Чем точнее набор критериев, описывающих популяцию, на которую предполагается распространить выводы эксперимента, тем выше его внешняя валидность.
Иногда в качестве экспериментальной выборки используются реальные группы, при этом в эксперименте либо участвуют добровольцы, либо все испытуемые привлекаются принудительно. И в том и в другом случае нарушается внешняя и внутренняя валидность.
После формирования экспериментальной выборки экспериментатор составляет план исследования. Достаточно часто эксперимент проводится с несколькими группами, экспериментальными и контрольными, которые помещаются в разные условия. Экспериментальные и контрольные группы должны быть эквивалентными на момент начала экспериментального воздействия.
Процедура подбора эквивалентных групп и испытуемых называется рандомизацией. По мнению ряда авторов, эквивалентность групп может быть достигнута при попарном отборе. В этом случае экспериментальная и контрольная группы составляются из индивидов, эквивалентных по значимым для эксперимента побочным параметрам. Идеальный вариант для попарного отбора – привлечение близнецовых пар. Рандомизация с выделением страт заключается в подборе однородных подгрупп, в которых испытуемые уравнены по всем характеристикам, кроме интересующих исследователя дополнительных переменных. Иногда для выделения значимой дополнительной переменной все испытуемые тестируются и ранжируются по уровню ее выраженности. Экспериментальная и контрольная группы формируются так, чтобы испытуемые, обладающие одинаковыми или близкими значениями переменной, попали в разные группы. Распределение испытуемых на экспериментальную и контрольную группы может проводиться и случайным методом. Как уже указывалось выше, при большой численности экспериментальной выборки этот способ дает вполне удовлетворительные результаты.

4.7. Экспериментальные планы

Экспериментальный план – это тактика экспериментального исследования, воплощенная в конкретной системе операций планирования эксперимента. Основными критериями классификации планов являются:
состав участников (индивид или группа);
количество независимых переменных и их уровней;
виды шкал представления независимых переменных;
метод сбора экспериментальных данных;
место и условия проведения эксперимента;
особенности организации экспериментального воздействия и способа контроля.
Планы для групп испытуемых и для одного испытуемого. Все экспериментальные планы можно разделить по составу участников на планы для групп испытуемых и планы для одного испытуемого.
Эксперименты с группой испытуемых имеют следующие преимущества: возможность обобщения результатов эксперимента на популяцию; возможность использования схем межгрупповых сравнений; экономия времени; применение методов статистического анализа. К недостаткам данного типа экспериментальных планов можно отнести: влияние индивидуальных различий между людьми на результаты эксперимента; проблему репрезентативности экспериментальной выборки; проблему эквивалентности групп испытуемых.
Эксперименты с одним испытуемым – это частный случай «планов с маленьким N». Дж. Гудвин указывает на следующие причины использования таких планов: потребности в индивидуальной валидности, так как в экспериментах с большим N возникает проблема, когда обобщенные данные не характеризуют ни одного испытуемого. Эксперимент с одним испытуемым проводится также в уникальных случаях, когда в силу ряда причин невозможно привлечь много участников. В этих случаях целью эксперимента является анализ уникальных явлений и индивидуальных характеристик.
Эксперимент с маленьким N, по мнению Д. Мартина, имеет следующие преимущества: отсутствие сложных статистических подсчетов, легкость в интерпретации результатов, возможность изучения уникальных случаев, привлечение одного-двух участников, широкие возможности манипуляции независимыми переменными. Ему свойственны и некоторые недостатки, в частности сложность процедур контроля, затруднение при обобщении результатов; относительная неэкономичность по времени.
Рассмотрим планы для одного испытуемого.
Планирование временных серий. Основным показателем влияния независимой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого во времени. Простейшая стратегия: схема А – В. Испытуемый первоначально выполняет деятельность в условиях А, а затем в условиях В. Для контроля «эффекта плацебо» применяется схема: А – В – А. («Эффект плацебо» – это реакции испытуемых на «пустые» воздействия, соответствующие реакциям на реальные воздействия.) В данном случае испытуемый не должен заранее знать, какое из условий является «пустым», а какое реальным. Однако эти схемы не учитывают взаимодействия воздействий, поэтому при планировании временных серий, как правило, применяют схемы регулярного чередования (А – В – А – В), позиционного уравнивания (А – В – В – А) или случайного чередования. Применение более «длинных» временных серий увеличивает возможность обнаружения эффекта, но приводит к ряду негативных последствий – утомлению испытуемого, снижению контроля за другими дополнительными переменными и т. п.
План альтернативных воздействий является развитием плана временных серий. Его специфика заключается в том, что воздействия А и В рандомизированно распределяются во времени и предъявляются испытуемому раздельно. Затем сравниваются эффекты от каждого из воздействий.
Реверсивный план применяется для изучения двух альтернативных форм поведения. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Затем предъявляется комплексное воздействие, состоящее из специфического компонента для первой формы поведения и дополнительного для второй. Через определенное время сочетание воздействий видоизменяют. Эффект двух комплексных воздействий оценивается.
План возрастания критериев часто используется в психологии обучения. Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост воздействия. При этом следующее воздействие предъявляется лишь после выхода испытуемого на заданный уровень критерия.
При проведении экспериментов с одним испытуемым следует учитывать, что основные артефакты практически неустранимы. Кроме того, в этом случае, как ни в каком другом, проявляется влияние установок экспериментатора и отношений, которые складываются между ним и испытуемым.
Р. Готтсданкер предлагает различать качественные и количественные экспериментальные планы . В качественных планах независимая переменная представлена в номинативной шкале, т. е. в эксперименте используются два или более качественно разных условия.
В количественных экспериментальных планах уровни независимой переменной представлены в интервальных, ранговых или пропорциональных шкалах, т. е. в эксперименте используются уровни выраженности того или иного условия.
Возможна ситуация, когда в факторном эксперименте одна переменная будет представлена в количественном, а другая – в качественном виде. В таком случае план будет комбинированным.
Внутригрупповые и межгрупповые экспериментальные планы. Т.В. Корнилова определяет два типа экспериментальных планов по критерию количества групп и условий проведения эксперимента: внутригрупповые и межгрупповые. К внутригрупповым относятся планы, в которых влияние вариантов независимой переменной и измерение экспериментального эффекта происходят в одной группе. В межгрупповых планах влияние вариантов независимой переменной осуществляется в разных экспериментальных группах.
Преимуществами внутригруппового плана являются: меньшее количество участников, устранение факторов индивидуальных отличий, уменьшение общего времени проведения эксперимента, возможность доказательства статистической значимости экспериментального эффекта. К недостаткам относятся неконстантность условий и проявление «эффекта последовательности».
Преимуществами межгруппового плана являются: отсутствие «эффекта последовательности», возможность получения большего количества данных, сокращение времени участия в эксперименте для каждого испытуемого, уменьшение эффекта выбывания участников эксперимента. Главным недостатком межгруппового плана является неэквивалентность групп.
Планы с одной независимой переменной и факторные планы. По критерию количества экспериментальных воздействий Д. Мартин предлагает различать планы с одной независимой переменной, факторные планы и планы с серией экспериментов. В планах с одной независимой переменной экспериментатор манипулирует одной независимой переменной, которая может иметь неограниченное количество вариантов проявления. В факторных планах (подробно о них см. с. 120) экспериментатор манипулирует двумя и более независимыми переменными, исследует все возможные варианты взаимодействия их разных уровней.
Планы с серией экспериментов проводятся для постепенного исключения конкурирующих гипотез. В конце серии экспериментатор приходит к верификации одной гипотезы.
Доэкспериментальные, квазиэкспериментальные планы и планы истинных экспериментов. Д. Кэмпбелл предложил разделить все экспериментальные планы для групп испытуемых на следующие группы: доэкспериментальные, квазиэкспериментальные и планы истинных экспериментов. В основе этого деления лежит близость реального эксперимента к идеальному. Чем меньше артефактов провоцирует тот или иной план и чем строже контроль дополнительных переменных, тем ближе эксперимент к идеальному. Доэкспериментальные планы менее всего учитывают требования, предъявляемые к идеальному эксперименту. В.Н. Дружинин указывает, что они могут служить лишь иллюстрацией, в практике научных исследований их следует по возможности избегать. Квазиэкспериментальные планы являются попыткой учета реалий жизни при проведении эмпирических исследований, они специально создаются с отступлением от схем истинных экспериментов. Исследователь должен осознавать источники артефактов – внешних дополнительных переменных, которые он не может контролировать. Квазиэкспериментальный план применяется тогда, когда применение лучшего плана невозможно.
Систематизированные признаки доэкспериментальных, квазиэкспериментальных планов и планов истинных экспериментов приводятся в нижеследующей таблице.

При описании экспериментальных планов будем пользоваться символизацией, предложенной Д. Кэмпбеллом: R – рандомизация; X – экспериментальное воздействие; O – тестирование.
К доэксперименталъным планам относятся: 1) исследование единичного случая; 2) план с предварительным и итоговым тестированием одной группы; 3) сравнение статистических групп.
При исследовании единичного случая однократно тестируется одна группа после экспериментального воздействия. Схематично этот план можно записать в виде:
X O
Контроль внешних переменных и независимой переменной полностью отсутствует. В таком эксперименте нет никакого материала для сравнения. Результаты могут быть сопоставлены лишь с обыденными представлениями о реальности, научной информации они не несут.
План с предварительным и итоговым тестированием одной группы часто применяется в социологических, социально-психологических и педагогических исследованиях. Его можно записать в виде:
O1 XO2
В этом плане отсутствует контрольная группа, поэтому нельзя утверждать, что изменения зависимой переменной (разница между O1 и O2), регистрируемые в ходе тестирования, вызваны именно изменением независимой переменной. Между начальным и итоговым тестированием могут произойти и другие «фоновые» события, воздействующие на испытуемых вместе с независимой переменной. Этот план не позволяет контролировать также эффект естественного развития и эффект тестирования.
Сравнение статистических групп будет точнее назвать планом для двух неэквивалентных групп с тестированием после воздействия. Он может быть записан в таком виде:
XO1
O2
Этот план позволяет учитывать эффект тестирования, благодаря введению контрольной группы контролировать ряд внешних переменных. Однако с его помощью невозможно учесть эффект естественного развития, так как нет материала для сравнения состояния испытуемых на данный момент с их начальным состоянием (предварительное тестирование не проводилось). Для сравнения результатов контрольной и экспериментальной групп используют t-критерий Стьюдента. Однако следует учитывать, что различия в результатах тестирования могут быть обусловлены не экспериментальным воздействием, а различием в составе групп.
Квазиэкспериментальные планы являются своеобразным компромиссом между реальностью и строгими рамками истинных экспериментов. Существуют следующие типы квазиэкспериментальных планов в психологическом исследовании: 1) планы экспериментов для неэквивалентных групп; 2) планы с предварительным и итоговым тестированием различных рандомизированных групп; 3) планы дискретных временных серий.
План эксперимента для неэквивалентных групп направлен на установление причинно-следственной зависимости между переменными, однако в нем отсутствует процедура уравнивания групп (рандомизация). Этот план может быть представлен следующей схемой:
O1 X O2
O3 O4
К проведению эксперимента в данном случае привлекаются две реальные группы. Обе группы тестируются. Затем одна группа подвергается экспериментальному воздействию, а другая – нет. Затем обе группы повторно тестируются. Результаты первого и второго тестирования обеих групп сопоставляют, для сравнения используют t-критерий Стьюдента и дисперсионный анализ. Различие O2 и O4 свидетельствует о естественном развитии и фоновом воздействии. Для выявления действия независимой переменной необходимо сравнивать 6(O1 O2) и 6(O3 O4), т. е. величины сдвигов показателей. Значимость различия приростов показателей будет свидетельствовать о влиянии независимой переменной на зависимую. Этот план аналогичен плану истинного эксперимента для двух групп с тестированием до и после воздействия (см. с. 118). Главным источником артефактов является различие в составе групп.
План с предварительным и итоговым тестированием различных рандомизированных групп отличается от плана истинного эксперимента тем, что предварительное тестирование проходит одна группа, а итоговое – эквивалентная группа, которая подверглась воздействию:
R O1
R X O2
Главный недостаток этого квазиэкспериментального плана – невозможность контролировать эффект «фона» – влияние событий, происходящих наряду с экспериментальным воздействием в период между первым и вторым тестированием.
Планы дискретных временных серий подразделяются на несколько видов в зависимости от количества групп (одной или нескольких), а также в зависимости от количества экспериментальных воздействий (одиночного или серии воздействий).
План дискретных временных серий для одной группы испытуемых состоит в том, что первоначально определяется исходный уровень зависимой переменной на группе испытуемых с помощью серии последовательных замеров. Затем применяют экспериментальное воздействие и проводят серию аналогичных замеров. Сравнивают уровни зависимой переменной до и после воздействия. Схема этого плана:
O1O2O3O4O5O6
Главный недостаток плана дискретных временных серий в том, что он не дает возможности отделить результат влияния независимой переменной от влияния фоновых событий, которые происходят в течение исследования.
Модификацией этого плана является квазиэксперимент по схеме временных серий, в котором воздействие перед замером чередуется с отсутствием воздействия перед замером. Его схема такова:
ХO1 – O2ХO3 – O4 ХO5
Чередование может быть регулярным или случайным. Этот вариант подходит лишь в том случае, когда эффект воздействия обратим. При обработке данных, полученных в эксперименте, серии разбивают на две последовательности и сравнивают результаты замеров, где было воздействие, с результатами замеров, где оно отсутствовало. Для сравнения данных используется t-критерий Стьюдента с числом степеней свободы n – 2, где n – число ситуаций одного типа.
Планы временных серий часто реализуются на практике. Однако при их применении нередко наблюдается так называемый «эффект Хотторна». Впервые его обнаружили американские ученые в 1939 г., когда проводили исследование на заводе Хотторна в Чикаго. Предполагалось, что изменение системы организации труда позволит повысить его производительность. Однако в ходе эксперимента любые изменения в организации труда приводили к повышению его производительности. В результате оказалось, что само по себе участие в эксперименте повысило мотивацию к труду. Испытуемые поняли, что ими лично интересуются, и стали работать продуктивнее. Чтобы контролировать этот эффект, должна использоваться контрольная группа.
Схема плана временных серий для двух неэквивалентных групп, из которых одна не получает воздействия, выглядит так:
O1O2O3O4O5O6O7O8O9O10
O1O2O3O4O5O6O7O8O9O10
Такой план позволяет контролировать эффект «фона». Обычно он используется исследователями при изучении реальных групп в образовательных учреждениях, клиниках, на производстве.
Еще один специфический план, который нередко используется в психологии, называют экспериментом ex-post-facto. Он часто применяется в социологии, педагогике, а также в нейропсихологии и клинической психологии. Стратегия применения этого плана состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В качестве воздействия выступает некоторое реальное событие из их жизни. Экспериментальная группа состоит из «испытуемых», подвергшихся воздействию, а контрольная группа – из людей, не испытавших его. При этом группы по возможности уравниваются на момент своего состояния до воздействия. Затем проводится тестирование зависимой переменной у представителей экспериментальной и контрольной групп. Данные, полученные в результате тестирования, сопоставляются и делается вывод о влиянии воздействия на дальнейшее поведение испытуемых. Тем самым план ex-post-facto имитирует схему эксперимента для двух групп с их уравниванием и тестированием после воздействия. Его схема такова:

Валидность соответствие конкретного исследования принятым стандартам / безупречному эксперименту / (Дружинин В.Н.); достоверность / или степень достоверности / вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. «Валидность» – центральное понятие словаря экспериментатора: оно объединяет основные цели исследования с идеальными эталонами их достижения и реальными процедурами проведения эксперимента.

Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует / представляет / безупречный, и чем лучше эта репрезентативность, тем выше валидность эксперимента. Таким образом, повышение валидности, т.е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера реальных условий и, во-вторых, от адекватности выбора средств . Так, источники нарушения валидности (прежде всего, надежность и смешение) отдаляют реальный эксперимент от безупречного, а способы их контроля позволяют приблизиться к нему, т.е. обеспечить высокую валидность для обобщения экспериментальных результатов. Валидность полученных результатов можно оценить статистически: например, валидность теста (в корреляционном исследовании) определяется степенью корреляции результатов его выполнения с изучаемым видом деятельности испытуемых / Готтсданкер Р. /

Для конструирования и оценки экспериментальных процедур используются понятия: идеальный эксперимент, эксперимент полного соответствия и бесконечный эксперимент .

Идеальный эксперимент - это эксперимент, организованный таким образом, что экспериментатор изменяет лишь независимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя параметры, но и ряд других условий.

Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность . Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность - главный признак хорошо проведенного эксперимента.



Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента : фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание. Если они не контролируются, то приводят к появлению соответствующих эффектов.

Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной.

Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т. п.).

Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих.

Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта.

Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок.

Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом.

Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп.



Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.

Эксперимент полного соответствия - это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности . От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.

К факторам, угрожающим внешней валидности, относят следующие:

- реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений);

- эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);

- фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);

- фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).

Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии - клинической, педагогической, организационной, поскольку в случае невалидного исследования его результаты ничего не дадут при переносе их в реальные условия.

Так же выделяют следующие виды валидности:

Валидность экологическая – вид внешней валидности, характеризует соответствие процедуры и условий лабораторного исследования «естественной» реальности.

Валидность теоретическая /или прогностическая / - отношение идеального исследования к реальности.

Валидность операциональная – соответствие операций экспериментатора теоретическому описанию переменных, контролируемых в исследовании. Варьируемые экспериментатором условия должны соответствовать независимой переменной. Методики и план эксперимента должны соответствовать проверяемой гипотезе – степень этого соответствия и характеризует операциональную валидность.

Валидность конструктная – выражает адекватность метода интерпретации экспериментальных данных теории, т.е. структура экспериментального исследования выглядит следующим образом: теория – эксперимент – интерпретация – реальность./ Д.Кэмпбелл /. Конструктная валидность, по мнению Кэмпбелла, характеризует правильность интерпретации причины и экспериментального эффекта с помощью абстрактных терминов из обыденного языка или формальной теории. С точки зрения Кэмпбелла, хороший эксперимент должен:

1) выявлять временную последовательность предполагаемых причины и следствия;

2) показывать, что вероятные причины и эффект взаимосвязаны /ковариантны/;

3) исключать влияние побочных переменных, которым можно было бы объяснить экспериментальный эффект;

4) исключать альтернативные гипотезы о теоретических конструктах, объясняющих эту связь.

Валидность критериальная – отражает соответствие диагноза и прогноза, полученного на основе данных тестирования, деятельностным и жизненным показателям; включает в себя текущую и прогностическую валидность.

Валидность содержательная / очевидная / - соответствие целей и процедуры исследования обыденным представлениям испытуемого о природе изучаемого явления. Имеет мотивационное значение для испытуемых.

Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых. Однако суть эксперимента состоит именно в том, чтобы на основе ограниченного числа проб или при помощи ограниченной группы испытуемых выявить причинно-следственные связи между явлениями. Поэтому бесконечный эксперимент не только невозможен, но и бессмыслен. Для достижения высокой надежности эксперимента количество проб или число испытуемых должно соответствовать изменчивости изучаемого явления.

Следует отметить, что при увеличении числа испытуемых повышается и внешняя валидность эксперимента , так как его результаты могут быть перенесены на более широкую популяцию. Для проведения экспериментов с группой испытуемых необходимо рассмотреть вопрос об экспериментальных выборках.