Contribution to International Economy

  • Валидность экспериментального исследования. Надежность экспериментального исследования
СОДЕРЖАНИЕ:
Введение…………………………………………………………………………..2
Валидность экспериментального исследования……………………………….4
Надежность экспериментального исследования………………………………10
Заключение……………………………………………………………………….12
Список использованной литературы…………………………………………13




















Введение
Психологический эксперимент — проводимый в специальных условиях опыт для получения новых научных знаний посредством целенаправленного вмешательства исследователя в жизнедеятельность испытуемого. 
Различными авторами понятие «психологический эксперимент» трактуется неоднозначно, зачастую под экспериментом в психологии рассматривается комплекс разных самостоятельных эмпирических методов. Однако традиционно в экспериментальной психологии эксперимент считается самостоятельным методом. 
Как и в естественнонаучных экспериментах, так и в психологических краеугольным камнем считается понятие валидности и надежности: если эксперимент валиден, учёные могут обладать некоторой уверенностью в том, что ими было измерено именно то, что они хотели измерить.
Предпринимается множество мер для того, чтобы соблюдать все виды валидности. Однако быть абсолютно уверенным в том, что в каком-то, даже самом продуманном, исследовании можно совершенно соблюсти все критерии валидности, невозможно. Полностью безупречный эксперимент недостижим. 
Как в экспериментальной психологии, так и в статистике валидное измерение — такое измерение, которое измеряет то, что оно должно измерять. Безупречный эксперимент будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.
Надежность экспериментального исследования – это устойчивость результатов экспериментального исследования при его многократном проведении.
Валидность и надёжность – связанные понятия. Их соотношение может быть проиллюстрировано следующим примером. Допустим, имеются два стрелка А и В. Стрелок А выбивает 90 очков из 100, а стрелок В – только 70. Соответственно, надёжность стрелка А равна 0,90, а стрелка В – 0,70. Однако стрелок А всегда стреляет по чужим мишеням, поэтому на соревнованиях его результаты не засчитываются. Второй стрелок всегда правильно выбирает мишени. Поэтому валидность стрелка А нулевая, а стрелка В – 0,70, то есть численно равна надёжности. Если стрелок А станет правильно выбирать мишени, то его валидность тоже будет равна его надёжности. Если же он будет продолжать иногда путать мишени, то часть результатов не будет зачтена и валидность стрелка А будет ниже надёжности. В настоящем примере аналогом надёжности является точность, меткость стрелка, а аналогом валидности – тоже точность стрельбы, но не по любой, а по строго определённой «своей» мишени. Поэтому надёжный стрелок может стать валидным, не только сменив мишень, но и сменив команду. В истории известны случаи, когда тесты, признанные инвалидными для измерения одних свойств, оказались валидными для других. Значит, надёжность является необходимым условием валидности. Ненадёжное психологическое исследование не может быть валидным, и, наоборот, валидное исследование всегда надёжно. Надёжность исследования не может быть меньше его валидности; в свою очередь валидность не может превышать надёжности.  












Валидность экспериментального исследования
Валидность исследования была определена Куком и Кэмпбеллом в 1979 году как наилучшая из имеющихся апроксимаций истинных высказываний, включая высказывания, затрагивающие причинно-следственные связи. Данное определение относится к установлению точности выводов исследования и подчеркивает относительный характер истины, которой возможно достичь в социальных науках. В любом научном исследовании исследователь должен уметь ответить на следующие вопросы: существует ли зависимость между двумя переменными; носит ли эта зависимость причинный характер; является ли данная зависимость значимой; действительно ли процедуры измерения и наблюдения относятся к исследуемым конструктам; могут ли быть обобщены причинные зависимости, выявленные в ходе исследования. Выделим следующие типы валидности, относящиеся к этим вопросам. 
Валидность статистических выводов
Этот тип валидности соответствует проверке статистической значимости зависимости между двумя переменными. Такие выводы всегда являются вероятностными. Действительно, можно совершить два типа ошибок: решить, что зависимость является значимой, в то время, когда это не так, или решить, что значимая зависимость между переменными отсутствует, когда, напротив, она имеется. 
Существуют некоторые факторы, которые могут снижать валидность статистических выводов: слабая чувствительность исследований, которая проявляется при недостаточной по численности выборке или при большой изменчивости в сравниваемых группах, то есть испытуемые являются слишком разными и сильно отличаются друг от друга относительно некоторых переменных; низкая надежность методик измерения или процедур манипулирования переменными, которые используются в исследовании; факторы помех, присутствующие в условиях эксперимента; нарушение принятых правил проведения и обработки, которые установлены для различных статистических методов. 
Стратегия повышения валидности статистических выводов состоит в уменьшении вариативности ошибки путем применения, например, схемы исследования с повторными пробами или использования однородных групп. Статистическая состоятельность исследования может диагностироваться как на стадии проектирования исследования (например, проверка расчета величины выборки), так и после исследования для оценки его результатов. 
Внутренняя валидность
Внутренняя валидность один из самых важных типов валидности, который действительно касается отношений между зависимыми и независимыми переменными. Эта валидность связана с особым процедурами, которые позволяют определить, насколько выводы, сделанные в данном исследовании, достоверны. После того, как установлено существование зависимости между переменной X и переменной Y, необходимо решить, какая из переменных является причиной, а какая следствием, то есть определить направление данной взаимосвязи. Если Y наблюдается после X, то можно сказать, что X является причиной Y. 
Однако может оказаться, что отношение зависимости между X и Y вызвано третьей переменной С. Для установления внутренней валидности необходимо рассмотреть все возможности влияния третьей переменной С на переменные X и Y и исключить их. Считается, что исследование обладает внутренней валидностью, если доказано, что существует зависимость причинно-следственного типа между зависимыми и независимыми переменными. 
Причины снижения внутренней валидности исследования: 
Смешение переменных. Это одна из наибольших опасностей для валидности эксперимента. Если в ходе эксперимента какой-либо случайный фактор (не экспериментальная переменная) взаимодействует с зависимой переменной и это взаимодействие не может быть измерено отдельно от взаимодействия зависимой и независимой переменных, то влияние случайной и независимой переменных неразличимо. Проблема смешения переменных является особенно острой в тех исследованиях, где экспериментатор не может контролировать независимую переменную. 
Изменения, связанные с испытуемыми. При проверке зависимых переменных изменения, произошедшие между двумя моментами наблюдения, могут быть вызваны не независимыми переменными, а изменениями, произошедшими с самими испытуемыми (например, событиями личной жизни, изменением тех или иных свойств личности), то есть факторами «зрелости» и «истории». 
Под «зрелостью» понимаются изменения, которые произошли с испытуемым между моментом пред-теста и моментом пост-теста и которые не были связаны с влиянием независимых переменных. Например, в экспериментах по моторной координации у испытуемых может наблюдаться ее улучшение за счет тренировок в период между экспериментами. Данное влияние нельзя смешивать с влиянием независимой переменной. Под фактором «истории» подразумеваются события, которые произошли с испытуемыми и которые повлияли на результаты эксперимента. 
Влияние пред-теста. Пред-тест вызывает изменения испытуемых, и, следовательно, результаты эксперимента в некоторых случаях могут в основном зависеть от пред-теста, а не от зависимой переменной. 
Изменение навыков исследователя. Например, исследователь, спустя некоторое время, может стать более опытным в наблюдениях и, следовательно, по-другому интерпретировать поведение испытуемых. Кроме того, на исследователя могут влиять такие факторы, как усталость, что может привести к ошибкам в экспериментах. 
Регрессия к среднему. Это явление наблюдается тогда, когда индивиды подвергаются повторным испытаниям относительно одной и той же переменной. Установлено, что если испытуемые получили в первом испытании результаты, по величине близкие к высшим показателям шкалы, то при повторном эксперименте их результаты снижаются и становятся ближе к средним показателям, в то время как испытуемые, которые получили в первом испытании результаты, близкие к низшим, при повторном измерении достигают лучших показателей. Регрессия к среднему наблюдается также в случае ошибок, связанных с изменением переменной. 
Отсев. Известно, что в ходе исследования некоторые испытуемые покидают группу. Оставшиеся испытуемые, естественно, отличаются от выбывших. 
Некоторые авторы говорят также о конструктной валидности. Конструктная валидность подобна внутренней валидности и подразумевает соответствие между полученными результатами и теорией, которая лежит в основе исследования. Для того чтобы оценить конструктную валидность, необходимо исключить другие возможные теоретические объяснения результатов. Если есть сомнения в том, насколько экспериментальные результаты соотносятся с теоретическими, необходимо спланировать новый эксперимент, который позволит выбрать одно из нескольких теоретических объяснений результатов. Этот тип валидности наиболее трудно получить, потому что имеются многочис-ленные теории, с помощью которых можно объяснить соотношение переменных, полученное в эксперименте. 
Рассмотрим две причины снижения конструктной валидности. Первая – слабая связь между теорией и экспериментом. Действительно, во многих психологических исследованиях даются нечеткие операционные определения теоретических понятий. Вторая причина определяется, во-первых, тем, что испытуемые очень часто начинают играть роль «хорошего» объекта исследования и ведут себя таким образом, чтобы доставить удовольствие экспериментатору, и, во-вторых, тем, что у испытуемых, особенно в экспериментах, замеряющих их умственные способности или эмоциональную стабильность, развивается высокая тревожность относительно ожидаемой оценки. 
Валидность процедур
Третий тип валидности – это валидность процедур, которые позволяют варьировать и измерять переменные. Даже необходимость определить в операциональных терминах концептуальные переменные, значимые для исследования, уже является источником риска. Действительно, "перевод" по-нятия на уровень конкретных операций может неадекватно отразить теоретические положения исследования. 
Существуют так называемые «переменные-паразиты», которые могут активизировать изменения переменных. «Переменные-паразиты» бывают двух типов: «Переменные-паразиты» особого типа, то есть переменные, связанные только с определенными операциями, производимыми в данном исследовании; «Переменные-паразиты» общего типа, то есть переменные, связанные с экспериментальными условиями косвенно, например, с ожиданиями исследователя. 
Часто исследователь неосознанно стимулирует ответ, который он ожидает получить. Избежать этого можно, используя стратегии невмешательства в исследования и соответствующие методы измерения. При этом испытуемые не должны знать, что за ними наблюдают, что позволяет снять нежелательную мотивировку по отношению к эксперименту. 
Внешняя валидность
Под внешней валидностью понимается возможность обобщать результаты исследования, то есть распространять выводы, полученные на экспериментальной выборке, на всю генеральную совокупность. Внешняя валидность существенно зависит от способа формирования выборки. Существует три основных типа выборки: случайная выборка, гетерогенная выборка, выборка типичного случая. 
Внешнюю валидность снижает также несоответствие между явлениями, наблюдаемыми в лаборатории, и явлениями в естественных условиях. Трудно определить, имеет ли место выявленная зависимость только в лаборатории или она наблюдается и вне лаборатории. Внешняя валидность обеспе-чивается неоднократным проведением эксперимента в гетерогенных условиях. 
Необходимо решить, какой тип валидности является главным для данного исследования. Действительно, процедуры, используемые для повышения одного типа валидности, могут снижать другие типы валидности. 
Тип приоритетной валидности зависит от типа проводимого исследования. Например, если в экспериментальном исследовании устанавливается причинно-следственная зависимость между переменными, то в этом случае внутренняя валидность является основной. Напротив, при вычислении корреляционных связей между переменными невозможно установить направление причинно-следственных отношений, поэтому в данном случае внутренняя валидность не представляет интереса по сравнению с другими типами валидности. 
С понятием валидности связано понятие контроля. Под контролем понимается любое средство, используемое для исключения возможности снижения валидности исследования. На практике исследователь проверяет, какие факторы могут снизить валидность исследования и какие методы могут быть использованы для нейтрализации этих факторов. 














Надежность экспериментального исследования
Одной из важнейших характеристик научного знания является его надёжность. Как правило, надёжными считаются результаты, если при повторном измерении они повторяются.
Надежность экспериментального исследования – это устойчивость результатов экспериментального исследования при его многократном проведении. Надёжность характеризует степень успешности воспроизводства измерения.
Если воспроизводимость данных оценивать по характеру отклонения, то надёжными будут считаться те данные, которые незначительно отклоняются от первоначальных величин. Надёжными считаются данные, которые при повторном их получении в тех же процедурных условиях дают незначимые отклонения от первоначальных величин.
В любом случае, надёжность – это устойчивость результатов при приближении эксперимента к бесконечному.
Надёжность – устойчивость данных при повторных измерениях переменной или при приближении эксперимента к бесконечному, т.е. воспроизводимость результатов измерения переменных.
О высокой надежности метода говорят в том случае, когда метод точно измеряет то свойство, для измерения которого он предназначен. В качестве критериев точности можно отметить следующие:
При повторном применении метода к тем же самым испытуемым в одних и тех же условиях через определенный интервал времени результаты существенно не различаются между собой.
Действия случайных посторонних факторов не оказывают существенного влияния на результаты. В качестве посторонних факторов можно назвать следующие: эмоциональное состояние и утомление, если они не входят в круг исследуемых характеристик, температура, освещенность помещения и др. Такие посторонние случайные факторы еще называют факторами нестабильности измерительной процедуры.
При повторном применении метода к тем же самым испытуемым через определенный интервал времени в измененных условиях результаты существенно не различаются между собой. Под измененными имеется в виду следующие условия: другой экспериментатор, состояние респондента.
Существуют различные методы оценки надежности:
Ретестовый метод - повторное тестирование выборки испытуемых одним и тем же тестом через определенный интервал времени при одних и тех же условиях. Временной интервал зависит от возраста, а также событий, происходящих с испытуемым в жизни.
Тест интервал-ретест. За индекс надежности принимается коэффициент корреляции между результатами двух тестирований. Полученная высокая корреляция может быть результатом тренированности испытуемого на заданиях подобного типа; низкая корреляция может быть результатом происшедших изменений с испытуемым, а также может свидетельствовать о ненадежности теста.
Надежность взаимозаменяемых форм - повторное тестирование выборки испытуемых параллельной формой теста через минимальный интервал времени при одних и тех же условиях.











Заключение
В данной работе были рассмотрены такие понятия как валидность и надежность экспериментального исследования. На основе вышесказанного можно сделать следующий вывод.
Валидность исследования была определена Куком и Кэмпбеллом в 1979 году как наилучшая из имеющихся апроксимаций истинных высказываний, включая высказывания, затрагивающие причинно-следственные связи. 
Валидность (англ. validity) — мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам. В частности, валидность считается фундаментальным понятием экспериментальной психологии и психодиагностики.
Как в экспериментальной психологии, так и в статистике валидное измерение — такое измерение, которое измеряет то, что оно должно измерять. То есть, к примеру, при валидном измерении интеллекта измеряется именно интеллект, а не что-то другое. Безупречный эксперимент будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.
Когда говорят о степени валидности, рассматривается то, насколько результаты исследования соответствуют поставленным задачам.
Надежность экспериментального исследования – это устойчивость результатов экспериментального исследования при его многократном проведении.
Валидность и надёжность – связанные понятия.





Список использованной литературы
Аванесов В.С. Тесты в социологическом исследовании. – М., 1982.
Гильбух Ю. З. Актуальные проблемы валидации психологических тестов // Вопросы психологии, 1978. - № 5. - С. 108-118.
Готтсданкер Р. Основы психологического эксперимента. - М., 1982.
Мельников В.М., Ямпольский Л.Т. Введение в экспериментальную психологию. – М., 1985. 
Психологический словарь / под ред. А.В. Петровского, М.Г. Ярошевского. – М., 1990. 
Экспериментальная психология. Выпуск 1, 2 / Под ред. Фресс П., Пиаже Ж. - М., 1966.



Другие работы по теме: