VALORACIÓN DE TESTS PSICOMÉTRICOS  

 

 

 
 
PsicologoEscolar.COM ORIENTACIONES ARTÍCULOS

 

¿Qué es un test psicométrico?
“Un test psicométrico constituye esencialmente una medida objetiva y tipificada de una
muestra de comportamiento” (Anastasi, 1978 pág. 21)
Esta definición implica rigurosamente lo siguiente:
Una Medida Objetiva, lo que significa que el método de medición debe verse
afectado lo menos posible por interpretaciones del sujeto o del evaluador.
Así, un buen test se presenta a quien lo tiene que resolver de una manera muy clara y
concreta, sin generar dudas sobre la tarea que se le solicita. Igualmente, los criterios
de valoración de las respuestas no pueden dejar lugar a dudas por parte del
evaluador sobre si la respuesta es acertada o errónea. Y, aún más, cuando una
escala de un test se construye con preguntas que pueden responderse con una
valoración múltiple: 0, 1, ó 2, una misma puntuación global en la escala puede
obtenerse con pocas preguntas de respuesta “2” o con más preguntas de respuesta
“1”, lo cual supone un incumplimiento del requisito de objetividad.
Una Medida Tipificada, lo que significa que debe compararse con otras medidas de
sujetos, que resulten suficientemente representativas de la población. Para ello se
tienen en cuenta las puntuaciones medias y la varianza de los resultados de una
muestra de referencia. Obviamente, la comparación entre puntuaciones de sujetos
diferentes no debe realizarse con puntuaciones directas, sino con puntuaciones
“tipificadas”.
Lógicamente, los grupos de comparación no pueden ser reducidos (30, 50, 80,…
sujetos), ni encontrarse todos ellos formando parte de un mismo grupo social (en el
mismo colegio, la misma ciudad,…)
¿Cómo valorar un test psicométrico?
Debe tenerse en cuenta que vamos a establecer una comparación entre los
resultados obtenidos por un individuo y los obtenidos por un gran grupo de población
de características similares. Por ello, resultaría poco adecuado obtener grupos de
baremación (de los que se obtienen las puntuaciones tipificadas) de cuantía reducida
o procedentes de un mismo colectivo.
La Federación Europa de Asociaciones de Psicólogos (E.F.P.A.) acordó e hizo públicos
(www.efpa.eu/reports) unos criterios técnicos para valorar la calidad de los test
psicométricos. Estos criterios consideran que los grupos de baremación deben estar
constituidos por un número de 150 a 200 sujetos para considerarlo de calidad
suficiente. Evidentemente, cuanto menos diversificadas sean las muestras de
baremación, mayor debe ser el número de sujetos que las integren. Y al contrario,
cuando se consiguen unas muestras de baremación muy diversificadas y
aleatorizadas, más aceptable es un número reducido de las mismas.

Clases de test psicométricos
Los test pueden clasificarse de acuerdo con distintos y diferentes criterios. Una
clasificación útil los divide en test de:
a) Actitudes, Valores, Preferencias,... En este grupo se incluyen aquellos test en
los que se trata de medir lo que piensa el sujeto sobre un tema o aspecto de su
vida. Se incluirían aquí los test de Actitudes o Valores ante las relaciones
sociales, como el ADCA; de Adaptación, como el TAMAI o la EMA; de Autoconcepto,
etc.
b) Personalidad. Grupo en el que se incluyen aquellos test en los que se trata de
medir lo que piensa, siente y cómo actúa de manera habitual el sujeto.
Se incluirían aquí test como los EPQ, EPQ-J, 16-PF, MMPI, CPQ, etc.
Obviamente, cada uno de estos test solamente resulta adecuado para su empleo
con el grupo de población con el que se validaron y no con otros grupos.
Un error frecuente de los evaluadores consiste en emplear test, como el MMPI,
validado con población psiquiátrica, con personas mentalmente sanas, con el
supuesto objetivo de detectar anomalías psicopatológicas.
c) Rendimiento o Aptitudes. Grupo que incluye a todos los test que pretenden
medir el grado de habilidad o destreza que tiene el sujeto en un campo o área
de comportamiento. Dado que estos test realizan mediciones sobre muestras de
comportamiento, todos ellos son test de Habilidades. El evaluador, no realiza
una medida de la capacidad o aptitud del sujeto, sino que, a través de la medida
de su grado de habilidad, infiere la capacidad o aptitud del sujeto para realizar
algo.
A su vez, los test de rendimiento pueden sub-clasificarse en otras múltiples
categorías. Como pueden ser:
Habilidades intelectuales (RAVEN, IGF, WISC, TONI-2, CERVANTES, EMIN-6)
Habilidades atencionales (CARAS, TOULOUSE-PIÈRON, EMAV)
Habilidades verbales (ITPA, PLON, TALE-2000, ELA-R)
Habilidades lingüísticas (TALE-2000)
Habilidades mecánicas
Habilidades artísticas (creatividad),
Habilidades motrices
Habilidades sensoriales
Etc.

La valoración de un test psicométrico: cómo, por qué y para qué
Todo profesional que desempeñe tareas de evaluación diagnóstica se ve en la
necesidad de valorar los test psicométricos de que dispone en el mercado profesional con
la finalidad de seleccionar aquéllos que cumplan los mejores criterios para el uso al que les
destina.
Si el profesional se dedica a la intervención psicoeducativa, la evaluación previa de
los escolares le resulta imprescindible y, por lo tanto, también necesita valorar los
instrumentos de medida.
En el campo de la psicología forense, la gran responsabilidad que conlleva la
evaluación pericial de los casos en litigio, exige a los profesionales un cuidado esmerado
en la elección de test como elemento de contraste y evidencia empírica de sus
conclusiones.
Ahora bien, como en todos los campos de la ciencia, la Psicometría se encuentra
en desarrollo, siguiendo las pautas de los cambios de paradigmas conceptuales de la
Psicología. Este fenómeno es observable retrospectivamente, al constatar cómo en una
época de predominio de los postulados psicoanalíticos, los test en uso eran todos ellos de
naturaleza “proyectiva” (Fábulas de Duss, Figura Humana, H.T.P., Rorschach, CAT, TAT,
test de Luscher, Wartegg,…) mientras que en los últimos 30 años, el abandono progresivo
del psicoanálisis ha llevado a los profesionales al mayor empleo de test psicométricos.
Asimismo, un análisis de la realidad actual, transcultural, nos permite comprobar cómo en
aquellos países donde predominan todavía los planteamientos psicodinámicos (Argentina,
Chile,...) sigue predominando el empleo de test proyectivos frente a los psicométricos.
Por ello, tanto el profesional con experiencia, como el novel, necesitan disponer de
conocimientos prácticos, sencillos y rápidos para valorar la mayor o menor adecuación, a
su desempeño profesional, de test clásicos y nuevos.
¿Cómo valorar un test psicométrico?
El objetivo de esta Monografía es proporcionar un resumen claro y preciso de los
criterios de valoración de test psicométricos que puedan emplear Asesores, Orientadores y
Consultores, en sus actividades de Evaluación Psicoeducativa, aunque puede generalizarse
a diversos campos de actuación profesional de la Psicología. Evidentemente, cualquier
profesional ha cursado en sus estudios de graduación, asignaturas de Estadística,
Psicometría, Psicología Experimental, Diseño y Análisis de Datos y/o similares, por lo cual,
lo que aquí se expone no será novedoso, ni les resultará de difícil comprensión;
únicamente exponemos una visión aplicada, concreta y práctica de sus conocimientos.
En el pasado, durante nuestra formación como posgraduados, al asistir a un curso
sobre Valoración de Test Psicométricos pudimos comprobar cómo todos los participantes
agradecíamos el resumen conceptual y metodológico que suponía la realización del
mismo. Comprobamos que “no habíamos aprendido nada nuevo”, pero que “sí habíamos
integrado nuestros conocimientos previos de un modo novedoso, sencillo y eficaz”. Este es
el objetivo que pretendemos con esta Monografía, planteada con una finalidad:
proporcionar a los usuarios de los servicios de Evaluación Psicológica la posibilidad de
recibir la mejor asistencia profesional en cuanto se refiere a la evaluación diagnóstica de
las dificultades de niños y adolescentes.
La mejor asistencia profesional favorece tanto al profesional, como al usuario de
sus servicios, entendiendo por “mejor” la que resulta más “económica” en términos de
coste/beneficio; esto es: la evaluación más rápida, segura, cómoda y, sobre todo, más
fiable, aquella en cuyos resultados se puede confiar para tomar decisiones respecto a las
ayudas que necesitan los escolares para mejorar su situación de desarrollo.

¿Cómo valorar un test psicométrico?
La Valoración de un test psicométrico es un procedimiento, al que se ve enfrentado en
diversas ocasiones todo profesional de la Psicología, que puede llevarse a cabo con
distintos criterios, dependiendo del contenido y la finalidad de uso del instrumento que se
desea valorar.
De manera general, los aspectos fundamentales a tener en cuenta son los siguientes:
1A. VALIDEZ B. FIABILIDAD C. TIPIFICACIÓN D. UTILIDAD
A. VALIDEZ: Se denomina “validez de un test” al grado en que dicho test mide lo que
pretende medir. Esta es la primera condición, indispensable, que debe reunir un test de
calidad: poseer una validez óptima, dado que de no ser así el resto de criterios de
valoración posibles resultan insignificantes. Si un test pretende medir ansiedad, lo
esperable es que mida indicadores de ansiedad. Si un test pretende medir autoestima, lo
esperable es que mida indicadores de autoestima.
La validez puede estudiarse desde diversas perspectivas:
A.1. Validez de Contenido: un test posee validez de contenido cuando los elementos de
cada escala corresponden fielmente a la definición operativa de cada variable a medir.
Lo deseable, aunque no siempre sucede así, es que los autores del test hagan explícita la
definición operativa de la variable o variables que mide su test.
Si esta definición no se encuentra de manera explícita en su manual técnico, entonces
debemos considerar si, a nuestro juicio profesional, los elementos del test corresponden
realmente a manifestaciones de la variable que el profesional desea medir.
Por ejemplo: si un test se denomina de ansiedad pero incluye indicadores de depresión,
no es un test válido para medir ansiedad (véase como ejemplo el STAI, Spilberger, C.)
Lamentablemente, algunos autores, con innegable buena fe, pero confundidos por la
“fantasía de la estadística”, construyen test o escalas siguiendo un procedimiento
estadístico: el denominado análisis factorial exploratorio. Este método, que no es otra cosa
que un estudio múltiple de correlaciones entre elementos, puede inducir a errores muy
graves, ya que puede considerar que los elementos que correlacionan entre sí constituyen
una escala que mide una misma variable. Ese error es muy frecuente y se puede detectar
rápidamente, si en el manual técnico analizamos el apartado en el que se explica cómo se
construyó el test y encontramos que se llevó a cabo mediante análisis factorial. Este dato,
añadido a la ausencia de una definición operativa de cada variable (o factor) que mide el
test nos permite saber que su construcción no es válida.
Un ejemplo que usamos habitualmente para explicar este error metodológico:
Si tomamos medidas sobre el desarrollo de un niño con indicadores de lenguaje (palabras
que conoce), indicadores de conocimientos culturales o de la naturaleza, habilidades de
cálculo matemático,… e incluimos, por ejemplo, el tamaño de sus pies y la longitud de sus
orejas,…
Al estudiar a niños de edades entre 4 y 8 años, veremos que existe una correlación muy
elevada entre:
1. tamaño de los pies y tamaño de las orejas (lo cual sería un indicador de desarrollo
físico)
2. amplitud de vocabulario, conocimientos culturales y cálculo aritmético (lo cual sería
indicador de desarrollo curricular)
Pero nuestra sorpresa sería enorme al ver que un posible análisis factorial exploratorio
podría muy bien indicar que todos los indicadores están incluidos en un único factor que
podríamos denominar “índice de desarrollo”. Pues bien, a nadie se le oculta que no
podemos sumar la longitud del pie con la cantidad de palabras que conoce un niño, ya
que el resultado sería una “media estadística” que lejos de aportar información
únicamente confunde y favorece conclusiones erróneas.
Pero tiene perfecto sentido constatar la correlación entre un posible “índice de
conocimientos curriculares de vocabulario” y un “índice de desarrollo físico”, ya que entre
los 4 y los 8 años de edad el niño se desarrolla en ambas áreas.
A.2. Validez de Constructo: un test posee validez de constructo cuando las escalas que lo
constituyen, corresponden fielmente al constructo que trata de medir, definido por los
autores de test en base a los conocimientos aportados por la Psicología o las disciplinas
que corresponda.
Por ejemplo: si un test trata de medir inteligencia, entendida ésta como capacidad de
razonamiento, no puede estar compuesto, como, por ejemplo, el K-BIT, de Kaufman por
dos escalas independientes: una escala que mide vocabulario y otra que mide
razonamiento.
Por otra parte, si un test trata de medir ansiedad, que es una respuesta fisiológica, no
puede incluir una escala de pensamientos depresivos.
Como puede comprobarse fácilmente, la ausencia de validez de contenido afecta
gravemente a la validez de constructo.
A.3. Validez Predictiva o Criterial: si el test desea realizar una predicción de conducta o
comportamiento, grado en que correlaciona con un criterio externo.
No siempre se utiliza un test para efectuar predicciones, en cuyo caso, no corresponde
estudiar su validez predictiva. Sin embargo, en los casos adecuados, esta validez
predictiva debe indicarse en el manual y su valor debe ser notablemente superior al 50%.
Entiéndase que una validez predictiva del 50% equivale a lanzar una moneda al aire. El
uso del test se justifica si su predicción es notablemente superior a este 50%.
A.4. Validez Concurrente o Convergente: constituye un modo de valorar la validez de
constructo. La validez concurrente o convergente de un test hace referencia al grado en
que la medida que realiza coincide con la medida proporcionada por otro test que evalúa
la misma variable por un procedimiento diferente. Un índice de validez de un nuevo test
lo proporciona una alta correlación con otro test de validez ya constatada anteriormente
para la misma medida. De modo opuesto se puede analizar la Validez Divergente.
Se podría cuestionar la necesidad de un nuevo test cuando se dispone ya de otro que
satisface la necesidad de evaluación. Las razones son varias:
a) un test válido y fiable puede haber quedado obsoleto por aspectos meramente
formales (de forma: expresiones culturales, formato de presentación,…) lo cual justifica
que se elabore otro nuevo, superando al anterior en estos aspectos y acumulando las
bondades del anterior o anteriores.
b) un nuevo test que evalúe lo mismo que otro anterior, válido y fiable, puede justificarse
por razones de economía, ser más breve, resultar más cómoda su administración o
corrección,…
En todo caso, cuando no se dispone de un test suficientemente válido y fiable, resulta
innecesaria, por imposible, establecer la validez convergente del nuevo test. En estos
casos, a veces se informa de la escasa validez convergente del test nuevo con respecto a
otro al que se pretende sustituir por su déficit de validez o de fiabilidad.
En ocasiones, para asegurar la validez de un test para evaluar una variable y no otra u
otras, se analiza la correlación con otro/s test/s que miden otra/s variable/s y se establece
una validez divergente, en términos de muy escasa correlación con ellos.
A5. Validez Discriminante: se refiere a la posibilidad de distinguir a los sujetos
con respecto a la variable que mide el test.
Por ejemplo: un test de eficacia atencional debe asegurar que los sujetos que sacan
puntuaciones bajas tienen menos eficacia atencional que los que obtienen puntuaciones
altas. Un test de inteligencia debe asegurar que las puntuaciones bajas corresponden a
sujetos de nivel intelectual significativamente por debajo de la zona media y que las altas
corresponden a los situados significativamente por encima de la zona media.
La gran relevancia de esta validez se ha destacado en la X Conferencia de la Asociación
Europea de Evaluación Psicológica, en setiembre de 2009 (Müler Jörg Michael, Hospital
Universitario de Münster).
B. FIABILIDAD: la fiabilidad es el grado en que un test realiza la medición con exactitud.
El estudio de la fiabilidad siempre debe realizarse con posterioridad al estudio de la
validez, entendiéndose que si el test no es válido para lo que afirma medir, ¿qué sentido
tiene asegurar que es más o menos fiable? De análoga manera a la validez, la fiabilidad
de un test se puede analizar de varias maneras.
B.1. Fiabilidad Test-Retest: Grado de estabilidad temporal de la medida; un indicador de
que siempre mide igual cuando el constructo es estable. Un test que proporciona una
medida cuando se aplica en una ocasión y otra medida cuando se aplica en otra ocasión
diferente, no tiene buena fiabilidad.
B.2. Fiabilidad o Consistencia Interna: Grado en el que cada elemento de una escala del
test contribuye a dar estabilidad a la medida de cada característica. Obviamente, cada test
está constituido por diversos elementos. Se da por supuesto que cada elemento contribuye
a medir lo mismo que los demás y que su suma constituye una medida total.
Sin embargo, pudiera ser que algún elemento no contribuya de manera significativa a la
misma medida que los otros, lo que debería llevar al autor a desestimarlo.
En este aspecto conviene destacar que los valores de consistencia interna aumentan con el
número de elementos del test. Por ello, para valorar la fiabilidad es fundamental estudiar
los índices de homogeneidad de cada elemento (correlación de cada elemento con el total
de la escala de la que forma parte). Cuando estos índices son mayores de 0,3 podemos
estar seguros de la consistencia interna del instrumento.
También se suelen considerar los índices de correlación entre elementos; sin embargo, se
debe tener presente que un índice de correlación entre elementos (normalmente entre
pares-impares) elevado no es una garantía de fiabilidad del test, ya que puede haber
muchos elementos similares, formulados de manera diferente, convenientemente situados
en lugares pares o impares para asegurar un elevado índice de correlación.
Por otra parte, cuando se indican elementos cuyos coeficientes ítem-total arrojan valores
menores a 0,35 deben considerarse de baja consistencia.
Entendida la fiabilidad de un test como la cualidad que permite confiar en sus resultados,
ésta también se ve afectada por otros factores; como pueden ser:
1. Una excesiva cantidad de elementos, lo que hace que se llegue a los últimos con un
estado de fatiga física o bien con un estado de desmotivación. Las respuestas de los
últimos elementos pueden ser mucho menos fiables que los primeros, lo que afectaría a la
totalidad de la prueba. Este puede ser el caso de las Escalas BASC, bien elaboradas pero
de dudosa fiabilidad (en su aspecto práctico) por la excesiva longitud de las mismas.
Además, un test con más de 15 ó 20 elementos puede aumentar la fiabilidad de forma
errónea.
2. La presencia de elementos del test formulados en términos negativos:
No me gusta cambiar de planes ( ) Nunca ( ) A veces ( ) A menudo
Se ha comprobado en múltiples ocasiones que en castellano, la formulación negativa
afecta seriamente a la comprensión del sentido en el que deben darse las respuestas. De
hecho, al revisar las respuestas con los sujetos, con frecuencia éstos indican que lo
entendieron en sentido contrario.
3. La inclusión en la formulación de los elementos del test aspectos relacionados con la
frecuencia o intensidad de la variable a medir:
Frecuentemente cambio de planes ( ) Nunca ( ) A veces ( ) A menudo
Muchas veces pienso en hacer un viaje ( ) Nunca ( ) A veces ( ) A menudo
Tiene excesiva inquietud motora ( ) Nada ( ) Poco ( ) Bastante ( ) Mucho
Esto hace, en ocasiones, imposible responder adecuadamente a la pregunta formulada,
afectado a la confiabilidad de la medida. Curiosamente, instrumentos de amplio uso entre
los profesionales adolecen de esta deficiencia; tal es el caso de las Escalas de Conners y la
EDAH para la detección de Déficit de Atención con Hiperactividad.
4. La presencia de enunciados complejos, confusos, difíciles de entender por todos los
sujetos:
Sus esfuerzos se frustran fácilmente, es inconstante...
Su actitud es impropia y escasamente apreciable desde un punto de vista objetivo...
Si el enunciado no es claro y concreto, unos sujetos lo contestarán entendiéndolo de una
manera y otros de otra diferente, con lo que sus resultados no serán comparables entre sí
C. TIPIFICACIÓN: la tipificación de un test es el aspecto final de su valoración
psicométrica, que va ligado a su fiabilidad.
En la medida en que la tipificación-baremación es una característica del test de todo
punto fundamental, afecta seriamente a la calidad psicométrica del mismo.
Todo test que intenta situar a un sujeto con relación a un grupo de referencia debe
acreditar que ha sido aplicado a una muestra amplia y significativa de la población con la
cual se utilizará posteriormente.
Obtener estas medidas es el proceso de baremación del test. Las muestras de población
que participan en el estudio de baremación deben cumplir los siguientes requisitos:
a) ser suficientemente amplias,
b) estar diversificadas y no proceder del mismo lugar, y
c) representar adecuadamente al grupo al que pertenece la persona que será
evaluada con el test.
Además de que las muestras deben estar bien definidas y ser amplias, el proceso de
tipificación debe ser realizado con las máximas garantías; esto es, llevado a cabo por
profesionales con experiencia en la administración de test (evitando el empleo de
estudiantes, sin experiencia previa) y siguiendo estrictamente las instrucciones de
selección de sujetos y de aplicación y valoración del instrumento.
Algunos test evalúan características que se distribuyen normalmente en la población, pero
en otras ocasiones esto no es así. Por ejemplo, la distribución de los niveles de ansiedad
no suele ser normal, sino asimétrica, mientras que la de la inteligencia lógica es normal.
Por ello, todo test debería proporcionar como información relevante para su valoración las
curvas de distribución en la población con la que se obtuvieron los baremos.
Además, es muy importante conocer si el test tiene “efecto techo”. Es decir, si a partir de
cierta puntuación todos los sujetos tienen la misma.
Resulta fundamental conocer con detalle las características de la muestra de tipificación,
ya que eso permitirá al evaluador determinar la fiabilidad del test en unos u otros grupos
de población.
Por ejemplo: no se puede utilizar un test de problemas emocionales, tipificado con
muestra de población general, con sujetos de población clínica o al revés.
D. UTILIDAD PRÁCTICA: Todo test se diseña o desarrolla con cierta finalidad. Existen
test que se diseñan con fines exclusivamente de investigación, mientras que otros se
diseñan para su aplicación en la elaboración de programas de intervención educativa o
terapéutica.
Cada test puede considerarse de mayor o menor utilidad, en función de su finalidad. Así,
un test puede tener una calidad indiscutible pero, no servir al profesional para
determinada finalidad, en cuyo caso, su empleo es, sencillamente, inútil.
Los test psicométricos se pueden emplear para conocer datos sobre una población o sobre
un sujeto, siempre con una finalidad concreta:
D.1. Descriptiva: lo que se desea es conocer la distribución de puntuaciones en una o más
variables.
Ejemplo: conocer los miedos o temores de los escolares de secundaria ante los exámenes
D.2. Evaluativa: lo que se desea es integrar las medidas obtenidas con el test con otras
informaciones, para elaborar hipótesis explicativas de un fenómeno conductual o bien,
conocer la influencia de un proceso de intervención en una o más variables.
Ejemplo: encontrar una posible explicación al bajo rendimiento escolar
¿Cómo valorar un test psicométrico?
D.3. Terapéutica: se desea conocer algunas características de un sujeto para diseñar una
estrategia de tratamiento en función de las medidas obtenidas.
Ejemplo: conocer el nivel de intensidad de un trastorno depresivo o conocer factores
predisponentes de un sujeto para padecer un trastorno por estrés
D.4. Investigadora: llevar adelante una investigación básica o empírica.
El investigador puede emplear los mismos test que el profesional, dependiendo de la
finalidad de la investigación.

EN RESUMEN…
Si el lector desea un esquema-resumen de estos criterios para valorar de
una manera rápida y sencilla un test psicométrico, con vistas a su empleo
profesional, puede utilizar los cuadros de las páginas siguientes.

VALORACIÓN DE UN TEST PSICOMÉTRICO
VALIDEZ DE CONSTRUCTO
¿Se describen operativamente las variables a medir?
¿Se informa del modelo conceptual en el que está basado el test?
VALIDEZ DE CONTENIDO
¿Los elementos de cada escala corresponden a la definición operativa de cada
variable?
FIABILIDAD
¿Consistencia interna alrededor de 0.80 (para test con menos de 10
elementos)?
¿Índice de homogeneidad de cada elemento superior a 0.3, para todos,
especialmente en los test de más de 10 elementos?
¿Test-retest superior a 0.80?
TIPIFICACIÓN
¿Se describe con detalle la procedencia de la muestra?
¿Muestra superior a 150 sujetos por grupo de edad/sexo?
¿Muestra aleatorizada?
¿Muestra geográficamente amplia?
¿Muestra socio-culturalmente amplia y representativa?
¿Se proporciona descripción de la distribución de las puntuaciones en la
muestra de baremación: normal/asimétrica?
¿Sirve para diseñar una estrategia de actuación?
¿Sirve para valorar la eficacia de una estrategia de actuación?
¿Comparte el test el modelo conceptual de algún Programa de Intervención?
Para los test de habilidad: ¿incluye un registro de observación de ejecución
que permite explicar resultados incongruentes con otras fuentes de
información?
VALIDEZ PREDICTIVA
¿Está documentada de manera fiable la correlación entre la medida del test y
un criterio externo?
VALIDEZ CONCURRENTE / DIVERGENTE
¿Está documentada de manera fiable la correlación entre la medida del test y
otros test que midan la “misma variable”?
¿Está documentada de manera fiable la independencia entre la medida del
test y otros test que midan “distintas variables conceptualmente próximas”?
VALIDEZ DISCRIMINANTE
¿Está documentada de manera fiable la capacidad del test para discriminar a
los sujetos con altas y bajas “puntuaciones”?

UN EJEMPLO…de valoración de la Validez de Constructo y de Contenido

Las Escalas Magallanes de Evaluación de Hábitos Asertivos
Las Escalas Magallanes de Hábitos Asertivos se han diseñado para evaluar el grado de
asertividad con el que se suele relacionar una persona a partir de los 12 años de edad. Al
tratar de evaluar “comportamiento asertivo”, inicialmente hay que definir el constructo
“asertividad” y constatar la validez de constructo del instrumento.
Este instrumento consta de tres versiones, una que corresponde a los padres de un
adolescente, en la cual, se solicita que informen de la frecuencia de diversos
comportamientos de su hijo en estudio. Otra escala, correspondiente al profesorado tutor,
a quien se solicita que informe de diversos comportamientos de este escolar en estudio. La
última escala es un auto-informe del escolar sobre la frecuencia de diversos
comportamientos suyos.
En los tres casos, al tratar de evaluar asertividad, como “aquella clase de comportamientos
que constituyen un acto de respeto a uno mismo y a los demás”, se ha decidido elaborar
dos escalas conceptualmente diferentes entre sí: una escala “auto-asertividad” permite
evaluar el grado en que el individuo actúa con respeto a sí mismo; otra escala “heteroasertividad”,
permite evaluar el grado en que el individuo actúa con respecto hacia los
demás.
Al disponer de dos escalas, es posible valorar el estilo de comportamiento del individuo,
por comparación entre las puntuaciones obtenidas en cada escala: Pasivo, Agresivo,
Pasivo-Agresivo o Asertivo2. Así diseñado, el instrumento tiene acreditada su “validez de
constructo”, ya que “está construido” con las dos escalas que permiten describir o
identificar su estilo de conducta social, según el constructo “asertividad”. Sin embargo,
esta estructura no asegura su “validez de contenido”. Para asegurar la validez de
contenido se debe proceder a analizar cada uno de los elementos que constituyen cada
escala.
En el caso de la escala de “auto-asertividad”, todos y cada uno de los elementos deben
representar una interacción que manifieste respeto a sí mismo. De manera análoga, la
escala de “hetero-asertividad” debe estar compuesta por elementos que representen
interacciones de respeto a los demás.
Una vez constatadas ambas condiciones, podemos asegurar la validez de contenido.
Un posterior análisis de fiabilidad de ambas escalas nos permitirá constatar la consistencia
interna de cada una de ellas y el índice de homogeneidad de cada uno de los elementos,
asegurando así que los elementos están adecuadamente formulados y resultan
comprensibles para las personas que responderán al instrumento.
No se propone un índice general porque el constructo tiene dos componentes
independientes.
2 Para más detalles puede consultarse el manual del test, EMHAS
Escala de Auto-asertividad:
Expone y defiende sus ideas de manera respetuosa con los demás
Cuando se enfada, expresa su malestar de manera adecuada
Expresa sus sentimientos sin reparos, pero de manera adecuada
Se muestra enfadado/a o disgustado/a cuando no hace las tareas perfectamente
Cuando quiere algo, lo pide educadamente, de manera clara y directa
Le cuesta mucho cambiar de opinión
Cuando le preguntan algo que no sabe, lo reconoce sin buscar excusas o justificaciones
Felicita a sus compañeros/as cuando hacen algo que le gusta
Cuando no entiende algo, se enfada bastante
Cuando se equivoca busca excusas para justificarse
Cuando tiene alguna duda pregunta de manera correcta
Si necesita ayuda la pide con buenos modales
Cuando hace algo que perjudica a algún/a compañero/a lo reconoce y pide disculpas
Actúa de manera independiente, sin dejarse llevar por lo que hagan o digan los demás
Cuando cree que le critican injustamente, se defiende de manera adecuada
Sabe negarse, cortésmente, cuando los/as compañeros/as le piden que haga algo que no
quiere hacer
Escala de Hetero-asertividad:
Suele criticar a los/as demás cuando se equivocan, olvidan algo o hacen algo mal
Admite, sin enfadarse, que los demás le nieguen algo que les pide
Protesta o se enfada cuando le critican
Cuando dice algo que los demás no entienden, vuelve a explicarlo sin enfadarse
Se enfada, cuando los demás le llevan la contraria
Admite, sin enfadarse, que los demás cambien de opinión

Cuando le piden cosas, responde con buenos modales
Se molesta cuando se le hacen preguntas personales

Tomado de "¿CÓMO VALORAR UN TEST PSICOMÉTRICO? Errores Conceptuales y Metodológicos en la Evaluación PsicoEducativa".


Otros Tests:

TEST DE CI DE MENSA DINAMARCA

TEST K-BIT

AUTOEVALUACIÓN DE LA MEDIACIÓN

BADYG