PAPELES DEL PSICÓLOGO Vol. 43-1 Enero - Abril 2022

puntúa. Las escalas cuasi-ipsativas dan lugar a puntuaciones que no suman una constante para todos los individuos, pero pueden mante- ner cierta interdependencia; esto es, el problema se reduce, pero puede no eliminarse (Brown & Maydeu-Olivares, 2018). Algunos meta-análisis muestran que las pruebas cuasi-ipsativas tienen mayor validez predictiva (Salgado et al., 2015; Salgado & Táuriz, 2014) y son más robustas al falseamiento (Martínez & Salgado, 2021). Los cuatro formatos más frecuentes de las pruebas de elección forzo- sa son (ver Tabla 1): (a) elegir el ítem que mejor te describe de entre dos enunciados (PICK-PAIR), (b) elegir el ítem que mejor te describe de entre más de dos enunciados (PICK), (c) elegir el ítem que más te descri- be y el que menos (MOLE, de “MOst and LEast”), y (d) ordenar las al- ternativas según el grado en el que te describen (RANK). En cuanto a la puntuación tradicional, en los formatos PICK y PICK-PAIR se puede pun- tuar +1 en la dimensión si la polaridad del ítem elegido es positiva (ver Tabla 1) o -1, si fuera negativa (i.e., ítem inverso). En el formato RANK se pueden asignar valores entre 1 y K , siendo K el número de frases a ordenar, mientras que en el formato MOLE se pueden asignar puntua- ciones -1, 0 o 1, dependiendo de la elección concreta y la polaridad de los ítem seleccionados (ver dos ejemplos en Tabla 1). Hontangas et al. (2015, 2016) encontraron, por simulación, que el formato MOLE proporcionaba resultados similares al RANK y, en ambos casos, supe- riores al PICK. Sin embargo, Cao y Drasgow (2019) encuentran que el formato PICK es más resistente al falseamiento que el formato MOLE, indicando que este último, además, implica una mayor carga cognitiva para responder. PUNTUANDO BLOQUES DE ELECCIÓN FORZOSA DESDE LA TRI En los últimos años, se ha sugerido que muchos de los problemas de las puntuaciones en pruebas de elección forzosa pueden deberse al propio procedimiento clásico de puntuación, pudiendo superarse me- diante el modelado de las respuestas desde la Teoría de la Respuesta al Ítem (TRI; p.ej ., Brown & Maydeu-Olivares, 2011; Hontangas et al., 2015, 2016; Morillo et al., 2016). La TRI permite modelar las proba- bilidades de respuesta a los bloques en función de los niveles de ras- go, lo que posibilita alcanzar, bajo ciertas condiciones, una interpretación normativa de las puntuaciones (i.e., posibilita compara- ciones entre individuos). El uso de modelos de TRI viene acompañado de diversas ventajas (Olea et al., 2010): (a) permite evaluar la preci- sión para cada nivel de rasgo, en vez de asumir que todas las perso- nas son evaluadas con la misma fiabilidad; (b) permite obtener puntaciones en la misma escala, aun cuando se apliquen distintos ítems; y (c) permite el desarrollo de aplicaciones avanzadas, como los Test Adaptativos Informatizados (TAIs). La principal característica de los TAIs es que los ítems administrados se ajustan al nivel de rasgo que va manifestando el evaluado según sus respuestas a los ítems previos. El uso de un TAI permite obtener medidas más eficientes (igual preci- sión en menor tiempo), así como medidas con un nivel de precisión más homogéneo a través del nivel de rasgo. Se han propuesto diversos tipos de modelos de TRI para describir el proceso de comparación de ítems dentro de un bloque, de entre los que destacan el MUPP (Multi-unidimensional Pairwise Preferen- ce) y el TIRT (Thurstonian Item Response Theory). El modelo MUPP fue desarrollado por Stark et al. (2005) para blo- ques de dos ítems, cada uno midiendo una dimensión distinta. En pri- mer lugar, se define un modelo para la probabilidad de que una persona esté de acuerdo con el contenido de un ítem. Puede asumir- se que esta probabilidad sigue un modelo de dominancia (Morillo et al., 2016) o un modelo de punto ideal (Stark et al., 2005). En un modelo de dominancia la probabilidad de acuerdo con un ítem (p.ej ., “Creo que los demás tienen buenas intenciones ” ) aumenta en función del nivel de rasgo (p.ej ., la Afabilidad). En un modelo de punto ideal la función de probabilidad de respuesta es unimodal; es- to es, la probabilidad de acuerdo aumenta en función del nivel de rasgo hasta alcanzar un máximo y luego se reduce. Por ejemplo, la probabilidad de acuerdo con el ítem “A veces puedo persuadir a mis amigos de que hagan las cosas a mi manera” puede ser máxima para personas que tienen una cierta capacidad de persuasión, pero menor para personas que nunca persuaden a sus amigos o para personas que siempre les persuaden. En segundo lugar, a partir de estas probabilidades de acuerdo con los ítems, puede obtenerse la probabilidad de preferir un ítem sobre otro dentro de un bloque (ver, por ejemplo, Morillo et al., 2016). El modelo TIRT (Brown & Maydeu-Olivares, 2011) se basa en la ley del juicio comparativo de Thurstone y asume un modelo de dominan- cia. En este modelo se desglosa la respuesta a cada bloque en un con- junto de comparaciones binarias. Por ejemplo, supongamos que alguien establece que, en un bloque de tres ítems, la frase que más le representa es la B y la que menos la A. Ese ordenamiento (B > C > A) se podría representar con tres variables, una por comparación binaria: X AB = 0 (i.e., prefiere el ítem B al A), X BC = 1 (i.e., prefiere el ítem B al C) y X AC = 0 (i.e., prefiere el ítem C al A). Una vez creadas estas variables pueden estimarse los modelos de TRI mediante análisis factorial (Brown & Maydeu-Olivares, 2012). En el caso de bloques de dos enunciados, Morillo et al. (2016) muestran que, cuando se asume el modelo de dominancia, el MUPP es equivalente al TIRT. ¿Qué modelo es mejor? Los modelos MUPP de punto ideal son más flexibles, pero quizás innecesariamente complejos. La cuestión decisiva se encontraría en aceptar o no la necesidad de usar ítems con funciones de probabilidad unimodales. Ítems como “A veces puedo persuadir a mis amigos de que hagan las cosas a mi manera” suelen desecharse en el análisis psicométrico previo y con frecuencia son ambiguos e incluso frustrantes para los respondientes (Brown & Maydeu-Olivares, 2010). No obstante, algunos de los mayores éxi- tos en la aplicación de la TRI a ítems de elección forzosa se han con- seguido con modelos de punto ideal. En cualquier caso, la ventaja de usar modelos de TRI radica en ob- tener puntuaciones con menor, o incluso nula ipsatividad, aunque el grado en que esto se consigue dependerá del diseño del test, como se describe a continuación. FACTORES GENERALES QUE AFECTAN A LA EFICACIA DE LOS TEST DE ELECCIÓN FORZOSA Como se ha mencionado, los modelos de TRI no dan necesaria- mente lugar a puntuaciones con propiedades normativas. Frick et al. (2021) señalan algunos factores que afectan a la eficacia en la construcción de ítems de elección forzosa en el caso de modelos de dominancia, aunque sus conclusiones no pueden considerarse defi- nitivas. En primer lugar, su recomendación más importante es la de utilizar tanto bloques homopolares positivos, formados por ítems que miden las dimensiones en la misma dirección (p.ej ., A. Creo que es ABAD, FRANCISCO J.; KREITCHMANN, RODRIGO S.; SORREL, MIGUEL A.; NÁJERA, PABLO; GARCÍA-GARZÓN, EDUARDO; GARRIDO, LUIS EDUARDO Y JIMÉNEZ, MARCOS 31 S e c c i ó n M o n o g r á f i c a

RkJQdWJsaXNoZXIy NDY3NTY=