Способы оценки надежности теста
При определении надежности теста могут быть использованы следующие методики.
Метод повторного тестирования является одним из самых распространенных. Он позволяет установить степень корреляции между результатами исследований, а также временем, в которое они были проведены. Данная методика отличается простотой и эффективностью. Тем не менее у испытуемых, как правило, повторные исследования вызывают раздражение и негативные реакции.
Метод проверки внутренней согласованности не берет во внимание постоянство получаемых при повторном исследовании результатов. Он устанавливает взаимосвязь ответов, которые были даны в рамках одного эксперимента
Вопросы теста делятся на два перечня (по определенному принципу), после чего рассчитывается коэффициент корреляции между результатами.
Метод эквивалентных форм заключается в использовании двух или более тестов с разными формулировками заданий, но с одинаковой сутью, формой и степенью сложности выполнения. О надежности теста свидетельствуют одинаковые или приближенные результаты, которые были получены с использованием одного и того же измерительного прибора или вычислительной формулы. Если же итоги сильно расходятся, то, скорее всего, они были искажены намеренно или же испытуемый не очень ответственно подошел к процессу опроса.
Внутренняя валидность и пример её нарушения
Внутренняя валидность — одна из разновидностей данного феномена. Чтобы понять её принцип, стоит рассмотреть пример, который отразит её нарушение.
Допустим, лаборатория хочет протестировать лекарство, способствующее росту. Для этого экспериментаторы отбирают несколько подростков тринадцати лет, измеряют параметры роста и дают детям лекарство.
Спустя два года снова производятся замеры, которые отражают увеличение показателей. Однако на основании изменившихся данных нельзя сделать вывод о том, что причиной перемен оказалось именно лекарство.
Нарушение внутренней валидности заключается в неучтенных факторах, которые влияют на результат исследования. В данном случае речь идёт о естественных процессах взросления. Корректный эксперимент должен был предусмотреть и их.
Методика определения определения поведения людей в различных ситуациях тоже может быть валидной или нет. Курс Викиум «Профайлинг» научит «читать людей» по невербальным признакам, выявлять скрытые намерения собеседника и прогнозировать действия оппонента.
Свежие записи
- Особенности психологии как науки и ее задачи
- Общее понятие об интеллекте
- Общая характеристика мотивационной сферы человека
- Диагностика избирательности внимания
- Конфликты как борьба животных за жизненные ресурсы
- Предмет и метод педагогической конфликтологии
- Социальная экология – наука и учебный предмет в профессиональной подготовке специалистов социальной работы
- Анализ конкретных случаев терапии
- Развитие отечественной психологии в 19 в
- Основные принципы и методы управленческой психологии 2
- Совладание с трудными жизненными ситуациями
- Методические указания для проведения практических занятий по разделам 1–3 дисциплины «Психология»
- по курсу «Психология» 2
- Психиатрия — Билеты с ответами
- Психология профессионализма. 2011/12
Сущность понятия «валидность»
Определение 1 Валидность – это комплексная характеристика методики, которая включает сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.
Данное понятие относится к тому, что эта методика измеряет и как хорошо она это делает. Те тесты, которые не обладают валидностью, для практического использования не годятся.
Уровень валидности – это её коэффициент.
На валидность теста оказывают влияние систематические факторы, привносящие в результаты искажения. К ним относятся другие психические свойства, мешающие в результатах теста проявиться тому свойству, на которое направлен тест.
Например, необходимо измерить потенциал обученности, но время исполнения строго ограничено, и допущенную ошибку исправить невозможно. Таким образом, искомое психическое свойство смешается с другим – «стрессоустойчивостью». Те, у кого стрессоустойчивость высокая, выполнять тест будут лучше. Здесь проявляется эффект систематического искажения. Отсюда, единого и универсального подхода к определению валидности не существует.
Готовые работы на аналогичную тему
- Курсовая работа Внешняя валидность и виды обобщений за пределами исследовательской ситуации 440 руб.
- Реферат Внешняя валидность и виды обобщений за пределами исследовательской ситуации 270 руб.
- Контрольная работа Внешняя валидность и виды обобщений за пределами исследовательской ситуации 190 руб.
Получить выполненную работу или консультацию специалиста по вашему учебному проекту Узнать стоимость
Исходя из того, какая сторона валидности будет рассматриваться, будут использоваться и соответствующие способы доказательства.
Замечание 1
Методика имеет столько валидностей, сколько существует критериев.
В первом понимании валидность относится к самой методике – это валидность измерительного инструмента, а проверка получила название теоретической валидизации. Второе понимание относится уже не столько к методике, сколько к цели её использования – это прагматическая валидизация.
Для использования психодиагностических методик в практических целях, они должны быть проверены по ряду формальных критериев, которые являются главным элементом методик и доказывают их эффективность и высокое качество.
Основными критериями оценок являются надежность и валидность.
Критерий валидности представляет собой источник информации об измеряемом психическом свойстве, он не зависит от теста и по отношению к нему является внешним. Говорить о валидности теста можно только тогда, когда его результаты будут сравнимы с источником истиной информации об измеряемом свойстве, т.е. с критерием.
Появились вопросы по этой теме? Задай вопрос преподавателю и получи ответ через 15 минут! Задать вопрос
В качестве критерия валидности на практике часто используется прагматический критерий, представляющий собой очевидный признак, проявляемый испытуемым независимо от исследуемого качества. Например, данные о выполнении разных заданий, контрольных проб и данные, полученные при помощи других методик, валидность которых доказана.
Специфика и задачи психологического эксперимента
Эксперимент направлен на доказательство или опровержение гипотезы, всегда проводится в особых экспериментальных условиях, искусственно созданных исследователем. Специфика психологического эксперимента заключается в некоторой его субъективности. Психология сталкивается с проблемами субъективности в теории и на практике.
Все знания, полученные в ходе психологических исследований, в той или иной мере субъективны, искажены сознанием испытуемого и экспериментатора. Поэтому получить полностью достоверные знания – это крайне сложная задача. Эксперимент должен соответствовать цели, задачам, исключать внешние воздействия и искажения результатов исследователем.
Задача психологического эксперимента – сделать доступными для наблюдения исследуемые психологические явления, свойства, состояния испытуемого. Для этого используется построение условий, в которых окажется тестируемый. Эти условия должны раскрывать исследуемое психическое свойство и исключать проявление других.
Психологический эксперимент отличается зависимостью от условий и уровня развития исследуемых явлений, требует строгого контроля, постоянства процесса, изоляции ненужных аспектов психики от изучаемых.
Высокая валидность применяемой методики позволяет снизить погрешность полученных результатов. Это важный фактор в психологических исследованиях, поскольку недостоверные результаты не несут никакой практической пользы.
Проблемы валидности
Из этого следует, что не существует единого показателя, по которому можно установить валидность психологического теста. В отличие от показателей надежности и дискриминантности, невозможно провести точные статистические расчеты, подтверждающие валидность методики. Тем не менее, разработчик должен предоставить убедительные доказательства валидности теста, что требует психологических знаний и интуиции. Хотя в классической теории тестов проблеме валидности уделяется много внимания, теоретически она никак не решается. Приоритет отдается надежности, которая обычно выражается следующим образом: валидность теста не может быть выше его надежности. Валидность — это способность теста измерять признак, для которого он предназначен. Следовательно, чем больше на результат теста или отдельного пункта влияет измеряемый признак и меньше — другие переменные (включая внешние), тем более валидным является тест. Валидность — одно из важнейших свойств психодиагностических процедур и тестов, один из основных критериев их качества.
Это понятие близко к понятию валидности, но не совсем идентично. Проблема валидности возникает при разработке и практическом применении тестов или процедур, когда необходимо установить соответствие между степенью выраженности интересующей личностной черты и методом ее измерения. Валидность показывает, что именно измеряет тест или процедура и насколько хорошо он это делает; чем более валидными они являются, тем лучше они отражают качество, для которого они были разработаны. Количественно валидность может быть выражена корреляцией результатов теста или инструмента с другими показателями — например, с успехом в выполнении смежной деятельности. Валидность может быть продемонстрирована различными способами, чаще всего комплексно. Используются и другие термины, такие как концептуальная валидность, критериальная валидность, конструктивная валидность и другие виды валидности, со своими собственными способами определения их уровня
Требование валидности очень важно, и многие критические замечания в адрес тестов или других психодиагностических процедур связаны с их сомнительной валидностью. Например, достоверность измерения интеллекта зависит от:
1) об определении интеллекта, который является особым понятием этого феномена;2) о составе тестов, разработанных в соответствии с данной концепцией3) в соответствии с эмпирическими критериями.
Разные концепции требуют разного состава элементов, поэтому вопрос концептуальной валидности очень важен. Чем больше пунктов соответствует авторской концепции интеллекта, тем увереннее можно говорить о концептуальной валидности теста. Корреляция теста с эмпирическим критерием указывает на его возможную валидность в отношении этого критерия. Чтобы определить валидность теста, всегда нужно задавать дополнительные вопросы: валиден для чего? С какой целью? В соответствии с каким критерием?
На странице курсовые работы по психологии вы найдете много готовых тем для курсовых по предмету «Психология».
Здесь темы рефератов по психологии
Читайте дополнительные лекции:
- Планирование трудовой деятельности в средней группе
- Практика применения психотехнологий коммуникации
- Методы юридической психологии
- Акцентуации характера у подростков — Возрастная динамика развития характера
- Джордж александр келли, американский психолог
- Психологические особенности девиантного поведения младших школьников
- Межкультурные различия в выражении эмоций — Происхождение эмоций
- Психологическая характеристика группы доу
- Задачи нейропсихологии
- Понятие и принципы инклюзивного образования
Что такое валидность теста?
Многие люди проходят тесты. Есть специальные психологические тесты, применяемые психологами, и другие, бульварные тесты. Что такое валидность теста, которая является важным ее критерием? Это показатель соответствия характеристики, качества, свойства к тесту, который их измеряет.
Тесты бывают разными. Они используются для измерения психофизиологических параметров человека. Самым высоким показателем валидности остается 80%. Полезность применения тестов становится в том случае, когда они позволяют получить точные данные по тем или иным конкретным характеристикам. Существует несколько подходов при изучении валидности теста:
- Конструктивная валидность, которая позволяет более глубоко изучить качества человека в ситуации, деятельности, системе.
- Валидность за критерием – изучение параметра в настоящем времени и прогнозирование его в будущем.
- Содержательная валидность – соответствие психологических конструктов, их многообразие.
- Прогностическая валидность – предсказывает развитие конкретного качества в будущем, что является затруднительным, поскольку оно может развиваться по-разному у разных людей.
Пока надежность и валидность теста не определены, его не применяют в психологической практике. Многое зависит от того, в каких областях применяются тесты. Есть учебные, профессиональные и прочие тесты, которые применяются в отдельных учреждениях для прогнозирования и выявления характеристик претендентов.
На сайте психологической помощи psymedcare.ru вы также можете пройти тесты, которые уже обладают высокой валидностью и показывают достоверные результаты.
Надёжность и валидность
Критерии надёжности рассматриваются с формальной точки зрения, тогда как содержательная сторона не учитывается.
Валидность, наоборот, обращает внимание на содержательные результаты теста. Оценивается их соответствие существующим феноменам психологии
Надёжная методика не тождественна валидной. Например, тест, оценивающий инициативность, может продемонстрировать высокие показатели надёжности и ретестовости элементов. Однако фактически результаты будут свидетельствовать о значительной силе воли, но с точки зрения содержания инициативности не подтвердят.
Таким образом, надёжность теста является высокой, а валидность — низкой.
Валидность теста это
Тест – это стандартизованное задание в результате применения, которого получаются данные о психофизиологическом состоянии человека и его личностные свойства, его знания, способности и навыки.
Валидность и надежность тестов – это два показателя, которые определяют их качество.
Валидность теста определяет степень соответствия исследуемого качества, характеристики, психологического свойства к тесту, с помощью которого они определяются.
Валидность теста является показателем его эффективности и применяемости к измерению необходимой характеристики. Самые качественные тесты имеют 80% валидности. При валидизации следует учитывать, что от контингента испытуемых и их характеристик, будет зависеть качество результатов. Получается, что один тест может быть как высоко достоверным, так и совсем невалидным.
Существует несколько подходов к определению валидности теста.
При измерении сложного психологического явления, которое имеет иерархическую структуру и его невозможно исследовать, применяя всего один тест, применяют конструктивную валидность. Она определяет точность исследования сложных, структурированных психологических явлений, качеств личности, измеряемых с помощью тестирования.
Валидность за критерием – это такой критерий теста, за которым определяется исследуемое психологическое явление в настоящий момент и прогнозирование особенностей этого явления в будущем. Для этого результаты, полученные при тестировании соотносятся со степенью развития измеряемого качества на практике, оценка специфических способностей в определенной деятельности. Если валидность теста имеет значение минимум 0,2 то применение такого теста является оправданным.
Содержательная валидность – это критерий теста, который применяется для определения соответствия области его измеряемых психологических конструктов, демонстрирует все полноту множества измеряемых показателей.
Прогностическая валидность – критерий, за которым можно предсказать характер развития исследуемого качества в будущем. Такой критерий качества теста очень ценный, если смотреть с практической стороны, но могут быть сложности, поскольку исключается неравномерность развития данного качества в разных людей.
Надежность теста – это критерий теста, который измеряет уровень стабильности результатов, полученных после тестирования, при повторном исследовании. Определяется путем вторичного тестирования спустя определенное количество времени и расчета корреляционного коэффициента результатов, полученных после первого и после второго тестирования
Также важно, учитывать особенности самой процедуры проведения тестов и социально-психологической структуры выборки. Один и тот же тест может иметь разную надежность, зависимо от пола, возраста, социального статуса исследуемых
Поэтому надежность может иногда иметь неточности, ошибки, которые истекают из самого процесса исследования, поэтому ищутся пути, как уменьшить влияние определенных факторов на тестирование. Можно утверждать о надежности теста, если она составляет значение 0,8-0,9.
Валидность и надежность тестов очень важны, потому что определяют тест, как измерительный инструмент. Когда надежность и валидность неизвестны, тест считается неприменяемым для применения.
В измерении надежности и валидность имеет место также этический контекст
Это особенно важно, когда результаты тестирования имеют значимость в использовании их для принятия жизненно важных решений людей. Одних людей принимают на работу, других отсеивают, одни студенты проходят в учебные заведения, а другие должны еще доучиться сначала, кому-то определяется психиатрический диагноз и лечение, а кто-то здоров – это все говорит о том, что подобные решения принимаются на основании изучения оценки поведения или специальных способностей
Например, человек ищущий работу, должен пройти тестирование, и его оценки есть решающими показателями при приеме на работу, узнает, что тест был не в меру валидным и надежным, он очень разочаруется.
Дискриминантная и конвергентная
Виды валидизации интересны многим. Выясним, что собой представляют дискриминантная и конвергентная валидности. От того, как психолог выявляет конструкт диагностический, зависит стратегия введения в тест установленных пунктов. Если Айзенк качество «нейротизм» определяет как независимое от интроверсии-экстраверсии, то это означает, что в его анкете должны быть поровну представлены позиции, которые будут одобрять невротичные экстраверты и интроверты.
Если же на практике окажется, что в задании пункты из квадранта «интроверсия-невротизм» будут преобладать, то с позиции теории Айзенка, это значит, что показатель «нейротизм» нагружен иррелевантным показателем – «интроверсией». Идентичный эффект появляется тогда, когда возникает перекос в выборке – если невротичных интровертов в ней будет больше, чем таких же экстравертов.
Для того чтобы избежать таких сложностей, психологи желают иметь дело с такими эмпирическими пунктами, которые информируют лишь о единственном факторе. Но реально это требование не выполняется никогда: каждый эмпирический индекс оказывается детерминирован не только тем фактором, который нам необходим, но и иными – иррелевантными проблеме измерения.
Таким образом, в отношении факторов, концептуально определяющихся как ортогональные к вымериваемому (встречающиеся с ним во всех сочетаниях), создатель теста обязан, отбирая пункты, использовать стратегию неподлинного балансирования.
Соответствие пунктов вымериваемому показателю гарантирует конвергентную валидность теста. Согласованность пунктов относительно иррелевантных источников обеспечивает валидность дискриминантную. Эмпирически она проявляется в отсутствии существенной корреляции с тестом, вымеривающим концептуально единоличное качество.
Детали
Говорят, что выводы обладают внутренней достоверностью, если причинно-следственная связь между двумя переменными правильно продемонстрирована. Обоснованный причинно-следственный вывод может быть сделан при соблюдении трех критериев:
- «причина» предшествует «следствию» во времени (приоритет во времени),
- «причина» и «следствие» имеют тенденцию происходить вместе (ковариация), и
- нет никаких правдоподобных альтернативных объяснений наблюдаемой ковариации (непредсказуемости).
В условиях научных экспериментов исследователи часто изменяют состояние одной переменной ( независимой переменной ), чтобы увидеть, какое влияние она оказывает на вторую переменную ( зависимую переменную ). Например, исследователь может манипулировать дозировкой определенного лекарства между разными группами людей, чтобы увидеть, какое влияние он оказывает на здоровье. В этом примере исследователь хочет сделать причинно-следственный вывод, а именно, что различные дозы препарата могут быть ответственны за наблюдаемые изменения или различия. Когда исследователь может уверенно отнести наблюдаемые изменения или различия в зависимой переменной к независимой переменной (то есть, когда исследователь наблюдает связь между этими переменными и может исключить другие объяснения или конкурирующие гипотезы ), тогда говорят, что причинный вывод быть внутренне действительным.
Однако во многих случаях размер эффектов, обнаруженных в зависимой переменной, может зависеть не только от
- вариации независимой переменной,
- мощность инструментов и статистические процедуры , используемые для измерения и обнаружения эффектов, и
- выбор статистических методов (см .: Достоверность статистического заключения ).
Скорее, ряд неконтролируемых (или неконтролируемых) переменных или обстоятельств может привести к дополнительным или альтернативным объяснениям (а) обнаруженных эффектов и / или (b) величины обнаруженных эффектов. Следовательно, внутренняя валидность больше зависит от степени, чем от «либо-либо», и именно поэтому исследовательские планы, отличные от истинных экспериментов, также могут давать результаты с высокой степенью внутренней достоверности.
Чтобы сделать выводы с высокой степенью внутренней достоверности, при разработке исследования могут быть приняты меры предосторожности. Как показывает опыт, выводы, основанные на прямом манипулировании независимой переменной, допускают большую внутреннюю валидность, чем выводы, основанные на ассоциации, наблюдаемой без манипуляций. Если рассматривать только внутреннюю валидность, строго контролируемые истинные экспериментальные планы (то есть со случайным выбором, случайным распределением в контрольную или экспериментальную группы, надежные инструменты, надежные процессы манипуляции и гарантии против мешающих факторов) могут быть «золотым стандартом» научных исследований
Однако сами методы, используемые для повышения внутренней достоверности, могут также ограничивать обобщаемость или внешнюю достоверность результатов. Например, изучение поведения животных в зоопарке может облегчить получение достоверных причинно-следственных выводов в этом контексте, но эти выводы могут не распространяться на поведение животных в дикой природе. В общем, типичный эксперимент в лаборатории, изучающий конкретный процесс, может не учитывать многие переменные, которые обычно сильно влияют на этот процесс в природе.
Если рассматривать только внутреннюю валидность, строго контролируемые истинные экспериментальные планы (то есть со случайным выбором, случайным распределением в контрольную или экспериментальную группы, надежные инструменты, надежные процессы манипуляции и гарантии против мешающих факторов) могут быть «золотым стандартом» научных исследований . Однако сами методы, используемые для повышения внутренней достоверности, могут также ограничивать обобщаемость или внешнюю достоверность результатов. Например, изучение поведения животных в зоопарке может облегчить получение достоверных причинно-следственных выводов в этом контексте, но эти выводы могут не распространяться на поведение животных в дикой природе. В общем, типичный эксперимент в лаборатории, изучающий конкретный процесс, может не учитывать многие переменные, которые обычно сильно влияют на этот процесс в природе.