Sumario

Más allá de la clínica

2023, vol. 16, nº 2

Uso de cuestionarios en ciencias de la salud: nociones básicas de validación y adaptación

Autores: Balaguer Martínez JV¹

¹ Pediatra Atención Primaria. Pediatra. CAP Sant Ildefons. Cornellà de Llobregat. Barcelona. (España).

PUNTOS CLAVE

La validación de un cuestionario consiste en aplicar diferentes procedimientos que demuestren que aquel cuestionario mide un aspecto concreto.
Cuantas más evidencias se tengan sobre la validez de un cuestionario, más seguridad habrá sobre que su aplicación sea correcta.
La validación es un proceso continuo en el tiempo.
No se debe utilizar un cuestionario para un uso que no haya sido validado ni alterar su estructura.

RESUMEN

Nunca se debería utilizar un cuestionario que mida aspectos subjetivos sin que antes haya sido debidamente validado. Cualquier cuestionario validado en un idioma o entorno cultural diferente a aquel en que se pretende utilizar debe ser sometido, previamente a su uso, a un proceso de adaptación. Por otro lado, el proceso de creación de un nuevo cuestionario y su correspondiente validación es complejo y, habitualmente, supone un estudio en sí mismo. Comprobar que el cuestionario tiene una fiabilidad y validez adecuadas es imperativo para que su utilización sea correcta. Además, aspectos como que aquel cuestionario tenga una buena sensibilidad y la determinación de los puntos de corte de sus puntuaciones nos facilitarán la clasificación de los sujetos.

INTRODUCCIÓN

La investigación científica es un proceso que requiere del máximo rigor. Por ello, los datos que se recojan durante cualquier estudio deben tener la mayor calidad posible, de manera que las conclusiones que se obtengan de su análisis sean fiables. Hay datos que se pueden medir fácilmente de manera objetiva. A nadie escapa que para valorar el peso se necesita una báscula adecuadamente calibrada o para medir el perímetro craneal se necesita una cinta métrica. Pero hay una serie de aspectos cuya valoración no resulta tan sencilla porque responden a conceptos subjetivos. Valorar cuestiones como la ansiedad, la dificultad respiratoria o la adhesión a un tratamiento requieren del uso de herramientas específicas, normalmente en forma de cuestionarios o escalas. Estos deben haber sido sometidos, previamente a su uso, a un proceso de validación, de manera que el resultado que obtengamos de su aplicación sea veraz. La disciplina que estudia la validez de los cuestionarios es la psicometría.

CONCEPTOS GENERALES

Un buen cuestionario debería cumplir 4 características: viabilidad, fiabilidad, validez y sensibilidad^1,2. A continuación, se describirán brevemente estos cuatro aspectos.

Viabilidad

La viabilidad hace referencia a su facilidad de aplicación. Obedece a aspectos como el tiempo necesario para su cumplimentación, la sencillez, la brevedad y la claridad de las preguntas, la codificación y la facilidad de la interpretación de los resultados. La viabilidad se valora mediante una pequeña prueba piloto en la que se aplica el cuestionario a un grupo de unas 30 personas. Se valora el porcentaje de respuestas en blanco, el tiempo de realización o la percepción respecto a la facilidad de realizar el cuestionario por parte del usuario. En función de estos resultados se puede modificar el cuestionario con el fin de adaptarlo de manera oportuna para que su utilización sea factible.

Fiabilidad

Ninguna medición que se haga es perfecta, todas ellas están sometidas a posibles errores. Un instrumento fiable es aquel que ofrece un resultado preciso. Así, un instrumento fiable sería aquel que en repetidas mediciones ofrece resultados consistentes, o sea, las puntuaciones obtenidas en diversas mediciones son prácticamente las mismas. La fiabilidad se mide a través de los coeficientes de fiabilidad³. El resultado de estos coeficientes puede oscilar desde 0 (ausencia de fiabilidad) a 1 (máxima fiabilidad). No existe un consenso entre diferentes autores sobre qué nivel de fiabilidad sería el mínimo deseable, normalmente puntuaciones entre 0,7-0,8 se consideran como una fiabilidad aceptable, entre 0,8-0,9 sería buena y entre 0,9-1 sería excelente¹.

Según la naturaleza del cuestionario se pueden valorar diferentes aspectos para comprobar su fiabilidad. Los 3 más habituales son los siguientes:

Consistencia interna. Los cuestionarios están compuestos por varias preguntas o elementos a valorar (llamados ítems). Todos los ítems deben estar relacionados con la cualidad subjetiva que se pretende medir. A esta cualidad subjetiva se le denomina “constructo” y, a su vez, puede contener diferentes dimensiones. Por ejemplo, podemos validar una escala para detectar “riesgo de patología en la salud mental” (este sería el constructo) y que dentro de esta escala haya ítems que valoren diferentes dimensiones: un grupo de ítems valora el riesgo de TDAH, otro grupo valora el riesgo de ansiedad, otro valora el riesgo de psicosis, etc. Pues bien, la consistencia interna valora en qué grado hay relación entre las puntuaciones de los ítems y el constructo. Es una forma de evaluar la homogeneidad de los ítems y comprobar que miden un mismo constructo. El coeficiente que mide la consistencia interna es el “alfa de Cronbach”⁴.
Fiabilidad inter-observador. Para valorarla, dos o más observadores evalúan al mismo grupo de pacientes, de manera independiente, con el mismo instrumento, y se valora el grado de acuerdo entre ellos. Obviamente, la fiabilidad inter-observador tiene sentido estudiarla en escalas o cuestionarios donde sea necesaria la valoración de algún aspecto por parte de un observador. Se mide con el coeficiente de correlación intraclase (variables cuantitativas) o con el índice de Kappa (variables cualitativas)⁴. También se puede utilizar el coeficiente de correlación de Pearson, aunque este coeficiente debe ser considerado con cautela, ya que está expuesto a posibles sesgos⁵.
Fiabilidad intra-observador o test-retest. Se pasa el cuestionario que se está estudiando a un grupo de pacientes y, al cabo de un tiempo, se vuelve a pasar el mismo cuestionario al mismo grupo de pacientes. Para su estudio se debe estar seguro de que el fenómeno que se está midiendo se mantiene estable o con mínima variación en el transcurso del tiempo. El tiempo transcurrido entre una aplicación del cuestionario y otra no debe ser demasiado largo para asegurar la comparabilidad de los resultados, pero tampoco debe ser demasiado corto para evitar el “efecto aprendizaje”. Se mide con los mismos coeficientes que se mide la fiabilidad inter-observador⁴.

Validez

La validez asegura que el cuestionario mide aquello para lo que ha sido creado y no otra cosa diferente. Confirma que aquel cuestionario mide el constructo para el que ha sido diseñado. No obstante, hay que tener en cuenta que la validez de un cuestionario depende del uso que se haga de este. Un mismo cuestionario puede ser válido en un entorno determinado o en un grupo de pacientes concreto, pero no serlo si estas circunstancias cambian³. Además, la validez de un cuestionario debe entenderse como un proceso continuo y dinámico⁶; a lo largo del tiempo, a medida que se vaya aplicando aquel cuestionario a más pacientes, se conocerán más datos sobre él. En realidad, no se valida el cuestionario, se validan las puntuaciones obtenidas por el cuestionario y el uso que se puede hacer de él en determinadas circunstancias concretas.

Se considera que se pueden tener en cuenta 4 aspectos sobre la validez de un cuestionario. En función del tipo del cuestionario que se esté validando se podrán estudiar los 4 aspectos o solamente algunos de ellos:

Validez lógica o aparente. Hace referencia al grado en que los ítems de un cuestionario “aparentemente” miden aquello para lo que este se creó. Su evaluación se hará a través de la opinión de expertos en el tema, que valorarán el cuestionario y emitirán su opinión. Para ello, suele utilizarse el “método Delphi”. También puede obtenerse el juicio de personas a las que se vaya a aplicar el cuestionario en el futuro, ya que un cuestionario con poca validez aparente puede generar rechazo en las personas a las que va destinado o un alto índice de falta de respuestas^3,4.
Validez de contenido. Como ya se comentó, un constructo puede estar formado por varias dimensiones. La validez de contenido evalúa hasta qué punto todas las dimensiones teóricas que serían necesarias para una buena valoración del constructo están contempladas dentro del cuestionario. Consiste en valorar que todas las dimensiones del constructo tengan una proporción adecuada de ítems, de manera que estos ítems sean relevantes y representativos. Se valora como la validez lógica, a partir de juicios de un panel de expertos en el tema que, de manera empírica, garanticen que el contenido del instrumento sea adecuado⁷.
Validez de constructo. Consiste en hacer una valoración de hasta qué punto la herramienta refleja la teoría del fenómeno o del concepto que se quiere medir. La forma más habitual de valorarla es mediante un método estadístico denominado “análisis factorial”. Este análisis nos dará un dibujo de la estructura interna del cuestionario, sus dimensiones y la interrelación que hay entre ellas⁷. Otra forma de valorarla es a través de la comparación del cuestionario que se está estudiando con otras mediciones con las que se espera encontrar concordancia (en este caso, estaríamos hablando de validez convergente). Por ejemplo, estamos validando una escala clínica de gravedad de la crisis asmática y comparamos cómo se correlaciona el resultado de la escala con la saturación de hemoglobina de los pacientes en aquel momento.
Validez de criterio. Se puede estudiar cuando se disponga de una prueba gold standard que mida el mismo concepto y que esté adecuadamente reconocida y validada. En este caso, se aplicará la herramienta que se esté validando y la prueba gold standard y se valorará la correlación entre los resultados de ambas. En este caso, también recibe el nombre de validez concomitante o concurrente. Otra forma de valorar la validez de criterio es a través de la llamada validez predictiva. En el ejemplo de la escala que mide la gravedad de la crisis asmática, por ejemplo, estudiar cómo se correlaciona el resultado de la escala con el porcentaje de ingreso hospitalario de los pacientes.

Sensibilidad

Cualquier cuestionario busca detectar la presencia o ausencia de una determinada característica. Por tanto, actúa como cualquier otra prueba diagnóstica. Por ello, se pueden valorar los índices clásicos de las pruebas diagnósticas para el cuestionario estudiado: sensibilidad, especificidad y los valores predictivos positivo y negativo. Como los cuestionarios o escalas responden a mediciones continuas, se deben determinar uno o varios puntos de corte que separen los diferentes estados del paciente. En este sentido, la utilización de las curvas ROC es primordial².

USO, ADAPTACIÓN Y CREACIÓN DE CUESTIONARIOS

Uso de cuestionarios ya existentes

Cuando se precise utilizar un cuestionario o escala para realizar una medición, la mejor opción posible siempre será que ya exista uno que se adapte a la medición que se desea realizar y cuyo uso en aquellas determinadas circunstancias esté debidamente validado. Una búsqueda bibliográfica en las bases de datos científicas habituales nos ofrecerá resultados sobre la existencia (o no) de algún cuestionario que mida algún aspecto concreto. Otro recurso útil para localizar la existencia de cuestionarios es la web BiblioPRO (www.bibliopro.org). Para usar cualquier cuestionario se ha de saber si este es de uso libre y, en caso de duda, se debería contactar con el autor del mismo para comprobarlo. En ocasiones, es posible que se encuentre más de un cuestionario que valore el aspecto que deseamos medir. Para elegir entre varios, el cuestionario que mejor se adapte a las necesidades que se tengan, se deberá tener en cuenta hasta qué punto se adecúa a lo que se pretende medir, su calidad (cuestionario con respaldo bibliográfico y ampliamente utilizado) y su posible coste³. Obviamente, el uso de cualquier cuestionario ya existente se debe hacer siguiendo de manera estricta sus instrucciones de uso y es incorrecto modificarlo en ningún sentido.

Adaptación de cuestionarios

Es posible que, en la búsqueda de un cuestionario para realizar alguna medición, se encuentre algún cuestionario creado en un entorno cultural diferente o en un idioma distinto del necesario para la población que se pretende estudiar (normalmente, se encuentra un cuestionario en inglés). En este caso, no vale con traducir el cuestionario y aplicarlo directamente a la población a estudiar. El proceso de traducción requiere una metodología estricta (que se describirá a continuación) y, además, se deberá realizar posteriormente un proceso de validación de la traducción que asegure que los resultados de las respuestas al cuestionario traducido son equivalentes a las que se hubieran dado al cuestionario original.

Puede darse el caso de encontrar un cuestionario en el idioma necesario, pero que haya sido validado en un entorno cultural diferente. El ejemplo más habitual sería el de cuestionarios en español, pero validados en países latinoamericanos. En este caso, habría que tener en cuenta aspectos como los giros idiomáticos, el contexto cultural y las diferencias en la percepción de salud de las diferentes poblaciones⁴. Por tanto, la necesidad de una adaptación del cuestionario es prácticamente obligatoria y, por tanto, también requeriría ser sometido después de la adaptación a un proceso de validación^3,4,7.

Antes de iniciar el proceso de adaptación de un cuestionario habría que obtener el permiso del autor que tenga los derechos del cuestionario. Normalmente, se utiliza este contacto con el autor para recabar su colaboración en el proceso de adaptación.

A la hora de traducir un cuestionario a otro idioma se ha de tener en cuenta que se necesita algo más que una traducción literal del cuestionario. Se debe conseguir una traducción que refleje claramente el concepto teórico para el que fue creado el cuestionario original. Los traductores del texto deberán ser preferentemente bilingües y conocedores del entorno cultural de destino y, al menos uno de ellos, debe también ser experto en el concepto que se pretende medir⁴. Se realizarán un mínimo de 2 traducciones independientes del cuestionario que luego se consensuarán en una primera versión traducida. Esa primera versión será retrotraducida de nuevo al idioma original y se analizarán las discrepancias entre la versión original y la retrotraducida. La retrotraducción se realizará preferentemente por dos personas nativas de la lengua original del cuestionario y desconocedoras del mismo^1,8. Todo el material obtenido de las traducciones y retrotraducciones se someterá a un comité de expertos que consensuará una versión traducida de manera consensuada. La participación del autor original de la escala es deseable e importante en este comité⁷. Este proceso (traducción-retrotraducción) debe realizarse una vez como mínimo, aunque puede repetirse más veces si se considera necesario³.

Una vez se haya obtenido una versión consensuada, conviene someterla a una prueba piloto con personas de la población diana, con el fin de obtener información sobre el significado que los usuarios han atribuido a cada ítem. Se utilizarán técnicas cuantitativas que detecten patrones atípicos de respuesta, falta de respuesta, subgrupos de personas con respuestas diferentes, etc. También se puede obtener información de manera cualitativa mediante entrevistas con los usuarios. Toda la información obtenida se analizará y se modificará el cuestionario si fuera necesario⁸.

El último paso del proceso consistirá en la revisión ortográfica y sintáctica del cuestionario para obtener la versión definitiva traducida. Hasta aquí el proceso de traducción (Tabla 1).

Tabla 1. Fases de la traducción de un cuestionario. Mostrar/ocultar

Una vez tengamos la versión definitiva traducida, esta tendrá que ser validada en una muestra de la población diana. No existe consenso sobre el número adecuado de pacientes para validar un cuestionario. Una de las referencias clásicas es considerar que se necesitan entre 5 y 10 pacientes por cada uno de los ítems que tenga el cuestionario. Lo que está claro es que cuanto más grande sea la muestra utilizada mayor será la seguridad respecto a la validez del cuestionario. Muestras inferiores a 50 pacientes no serían adecuadas y lo ideal sería utilizar una muestra en torno a 200 individuos⁹.

Cuando se disponga de la muestra necesaria se realizará un análisis de fiabilidad y de validez de los resultados obtenidos. Según las características del cuestionario se podrán valorar más o menos aspectos de la fiabilidad y de la validez^4,10. En el caso de la adaptación o traducción de cuestionarios es de especial interés realizar un análisis factorial del cuestionario traducido. Esto nos permitirá comparar las dimensiones y la estructura interna del cuestionario y compararlo con la estructura interna del cuestionario original. La semejanza entre ambas estructuras internas nos permitirá afirmar la equivalencia de las medidas que realizan ambos cuestionarios³.

No hay que perder de vista que, tras el proceso de adaptación y/o traducción de un cuestionario, el objetivo es que el cuestionario resultante presente las mismas características métricas que el original, de manera que se puedan comparar los resultados de su aplicación en los diferentes ámbitos en que se haya validado⁷.

CREACIÓN DE UN CUESTIONARIO

En caso de no encontrar ningún cuestionario ya validado ni ningún cuestionario que se pueda adaptar a la medición que se pretende realizar, se estará ante la opción más laboriosa de todas: tener que crear un cuestionario de novo y validarlo. La creación de un cuestionario desde cero es una tarea ingente que requiere un esfuerzo y una inversión de tiempo importantes. Los pasos necesarios para elaborar un cuestionario vienen esquematizados en la Tabla 2.

Tabla 2. Fases de la creación de un cuestionario³. Mostrar/ocultar

El primer paso en la creación de un cuestionario, obviamente, será definir el constructo, así como las dimensiones teóricas que lo componen. Se trata de hacer una aproximación a lo que se quiera medir basada en la revisión bibliográfica sobre el tema y en las ideas u opiniones de expertos en el tema. Este proceso no es inequívoco y un mismo constructo puede definirse conceptualmente desde diferentes perspectivas teóricas⁶. Por ejemplo, existen múltiples cuestionarios para valorar la calidad de vida de las familias con algún niño asmático. Algunas tan solo hacen una aproximación al fenómeno desde el punto de vista del ajuste psicosocial, mientras que otras hacen una aproximación que incluye otras dimensiones, como pueden ser la salud general o la limitación de actividades³. El autor del cuestionario tendrá que decidir qué perspectivas teóricas considera importantes para medir aquel fenómeno.

A continuación, se tendrán que establecer las características del cuestionario que se creará. Se deberá establecer la población sobre la que se aplicará el cuestionario (adolescentes sanos, pediatras de Atención Primaria, madres que dan el pecho…), ya que esta condicionará la forma de administración y el formato del cuestionario⁶. Los cuestionarios pueden ser autoadministrados o heteroadministrados, y en estos últimos la entrevista puede realizarse directamente o de manera indirecta (normalmente por teléfono). En los cuestionarios autoadministrados las instrucciones de respuesta de los ítems deben ser muy concretas.

Teniendo en cuenta todos estos elementos, habrá llegado el momento de redactar los ítems y crear un cuestionario preliminar. Este primer cuestionario será sometido a sucesivos cribados y valoraciones hasta conformar la versión definitiva. En cuanto al número de ítems necesario, no hay reglas fijas. Esta primera versión del cuestionario se recomienda que contenga un número de ítems unas 3 veces superior al necesario³. El número final necesario de ítems es una cuestión muy variable y dependerá, fundamentalmente, del número de dimensiones que se quiera abarcar. Normalmente, los cuestionarios definitivos suelen contener entre 10 y 90 ítems⁶. Esta es la fase más complicada, ya que requiere una alta dosis de creatividad. La información para elaborar los ítems se puede obtener de diferentes fuentes: otros cuestionarios similares, observaciones clínicas, opinión de expertos o, incluso, opinión de los pacientes¹¹. En cuanto a la redacción de los ítems, tiene que ser clara y breve (Tabla 3). Una vez se tenga el redactado de los ítems se deberán asignar a alguna de las dimensiones que se hayan definido (normalmente por parte de expertos en el tema). Posteriormente, se hará un primer cribado de los ítems en el que se valorarán aspectos formales de cada ítem concreto y de la escala en general. Interesa obtener información sobre el proceso de respuesta: claridad de las instrucciones, adecuación de las preguntas, extensión de los ítems, comprensibilidad, número de respuestas (excesivo o no), orden lógico de las preguntas o tiempo necesario para responder el cuestionario. Para obtener toda esta información suele ser útil la realización de entrevistas con los participantes y los grupos focales³. De esta manera habremos obtenido la primera versión del cuestionario.

Tabla 3. Características de la redacción de los ítems de un cuestionario. Mostrar/ocultar

Esta primera versión del cuestionario se someterá a sucesivas depuraciones en base a criterios relacionados con la representatividad y relevancia de los ítems y en base a criterios psicométricos (fiabilidad y validez principalmente). La versión se pasará a un grupo piloto de unos 30-50 usuarios del cuestionario⁶. En base a las respuestas que se haya dado a los diferentes ítems se aplicarán diferentes estrategias de valoración. Básicamente, se valorará la estructura interna de la escala de manera que se eliminen los ítems que no aportan valor al cuestionario o no se ajustan bien a las dimensiones definidas del cuestionario³. La intención será obtener una versión definitiva del cuestionario lo más ajustada posible en cuanto a longitud para que refleje bien el constructo que se quiere medir. Este proceso de depuración no está exento de cierta subjetividad y es conveniente la participación de alguna persona con experiencia en valorar las características psicométricas de los cuestionarios junto a los expertos en el tema sobre el que versa el cuestionario.

Ya como último paso habrá que establecer cómo debe calcularse e interpretarse la puntuación de la escala. En ciencias de la salud lo más común es que los cuestionarios que se utilizan respondan a escalas sumativas (tipo Likert), donde la puntuación total del cuestionario corresponde a la suma de cada una de las respuestas dadas a los diferentes ítems. En caso de que sea necesario, también se deberán definir uno o más puntos de corte en las puntuaciones de la escala.

CONCLUSIÓN

La medición de aspectos subjetivos en ciencias de la salud debe realizarse mediate escalas o cuestionarios convenientemente validados. La validación de un cuestionario debe entenderse como una cuestión dinámica que va adquiriendo mayor consistencia a medida que se van valorando sus propiedades psicométricas en distintas culturas y/o poblaciones¹. Es importante tener en cuenta que no se valida el cuestionario en sí mismo, sino el uso que se pueda hacer del cuestionario en aquellas circunstancias en las que se validó³.

BIBLIOGRAFÍA

Carvajal A, Centeno C, Watson R, Martínez M, Sanz Rubiales A. ¿Cómo validar un instrumento de medida de la salud? An Sist Sanit Navar. 2011;34(1).
García de Yébenes Prous MJ, Rodríguez Salvanés F, Carmona Ortells l. Validación de cuestionarios. Reumatol Clínica. 2009;5:171-7.
Viladrich C, Doval E. Medición: fiabilidad y validez. 7.ª ed. Bellaterra: Laboratori d’Estadística Aplicada i Modelització (UAB); 2013.
Ramada Rodilla JM, Serra Pujadas C, Delclós Clanchet GL. Adaptación cultural y validación de cuestionarios de salud: revisión y recomendaciones metodológicas. Salud Pública México. 2013;55:57-66.
Schmidt ME, Steindorf K. Statistical Methods for the Validation of Questionnaires: Discrepancy between Theory and Practice. Methods Inf Med. 2006;45:409-13.
Martín Arribas MC. Diseño y validación de cuestionarios. Matronas profesión. 2004;5:23-9.
Sarabia Cobo CM, Alconero Camarero AR. Claves para el diseño y validación de cuestionarios en ciencias de la salud. Enferm Cardiol. 2019;26:69-73.
Eremenco SL, Cella D, Arnold BJ. A Comprehensive Method for the Translation and Cross-Cultural Validation of Health Status Questionnaires. Eval Health Prof. 2005;28:212-32.
Roco Videla A, Hernández Orellana M, Silva González O. What is the appropriate sample size to validate a questionnaire? Nutr Hosp. 2021;38:877-8.
Taherdoost H. Validity and Reliability of the Research Instrument; How to Test the Validation of a Questionnaire/Survey in a Research. International Journal of Academic Research in Management (IJARM). 2026;3:28-36.
Villavicencio Caparó E. Validación de cuestionarios. Odontol Act Rev Científica. 2018;1:71-6.

LECTURAS RECOMENDADAS

Renom Pinsach J. Diseño y análisis de test y cuestionarios. Barcelona: Publicacions i Edicions de la Universitat de Barcelona;2021.

Libro muy completo que, aunque no está orientado específicamente a ciencias de la salud, ofrece una visión en profundidad del tema de manera clara.

Cómo citar este artículo
Balaguer Martínez JV. Uso de cuestionarios en ciencias de la salud: nociones básicas de validación y adaptación. Form Act Pediatr Aten Prim.2023;16:80-5.