sesgo de selección y sesgo de información en Investigación Clínica

resumen

la validez interna de un estudio epidemiológico puede verse afectada por error aleatorio y error sistemático. El error aleatorio refleja un problema de precisión en la evaluación de una determinada relación exposición-enfermedad y puede reducirse aumentando el tamaño de la muestra., Por otro lado, el error o sesgo sistemático refleja un problema de validez del estudio y surge debido a cualquier error resultante de los métodos utilizados por el investigador al reclutar individuos para el estudio, de factores que afectan la participación en el estudio (sesgo de selección) o de distorsiones sistemáticas al recopilar información sobre exposiciones y resultados (sesgo de información). Otro factor importante que puede afectar la validez interna de un estudio clínico es la confusión. En este artículo, nos centramos en dos categorías de sesgo: sesgo de selección y sesgo de información., La confusión se describirá en un artículo futuro de esta serie.

© 2010 S. Karger AG, Basel

Introducción

al diseñar o interpretar un estudio clínico, un investigador tiene dos preocupaciones: la validez externa e interna del estudio. En la perspectiva moderna propuesta por Rothman, la validez externa incluye la generalización científica y Estadística., La generalización científica es la característica de un estudio epidemiológico por la que puede generar una hipótesis biológica coherente, potencialmente causal, aplicable a un conjunto más general de circunstancias clínicas o epidemiológicas que la población específica investigada . La generalización estadística es fundamental en el muestreo encuestado, en el que la muestra resultante debe ser estadísticamente representativa de la población fuente (o objetivo)., La diferencia clave entre las dos características de la validez externa es que la generalización científica se basa en la representatividad biológica más que estadística de la muestra.

la validez interna, es decir, la característica de un estudio clínico para producir resultados válidos, puede verse afectada por errores aleatorios y sistemáticos (sesgo). El error aleatorio se debe al azar y puede minimizarse aumentando el tamaño de la muestra o disminuyendo la variación en las mediciones (reduciendo el error de medición)., Sesgo es cualquier error resultante de los métodos utilizados por el investigador para reclutar individuos para el estudio, de factores que afectan la participación en el estudio (sesgo de selección) o de distorsiones sistemáticas al recopilar información sobre exposiciones y enfermedades (sesgo de información). De manera más general, sesgo es cualquier desviación en la recopilación, análisis, interpretación y publicación de datos que lleva a conclusiones que sistemáticamente subestiman o sobreestiman la verdadera relación entre una exposición dada y una enfermedad específica o cualquier otro resultado ., El sesgo no puede minimizarse aumentando el tamaño de la muestra. La mayoría de las violaciones de la validez interna pueden atribuirse a sesgo de selección, sesgo de información o confusión. En este artículo, nos centramos en algunos ejemplos de sesgo de selección y sesgo de información.

sesgo de selección

un sesgo de selección proviene de cualquier error en la selección de los participantes del estudio y / o de factores que afectan la participación en el estudio., Como consecuencia, la relación entre la exposición y la enfermedad difiere entre los incluidos en el estudio y los potencialmente elegibles para el estudio (incluidos los no participantes o no respondedores). Desde esta perspectiva, particularmente para la investigación etiológica, la validez interna es un requisito previo para la validez externa. Debido a que la relación exposición-enfermedad en los no participantes es generalmente desconocida, el sesgo de selección solo puede ser hipotético., En este artículo, consideramos 5 tipos de sesgo de selección: el sesgo de no respuesta (ejemplo 1), el sesgo de incidencia-prevalencia (ejemplos 2 y 3), el sesgo de pérdida de seguimiento (ejemplo 4), El sesgo de confusión por indicación (ejemplo 5) y el sesgo de voluntarios (ejemplo 6).

sesgo de no respuesta

Ejemplo 1

un sesgo de no respuesta ocurre cuando la no participación (no respuesta) está relacionada con la exposición y, independientemente de la exposición, con la enfermedad / resultado., Si la falta de respuesta solo está relacionada con la exposición y no con la enfermedad, esto afecta a la distribución de la exposición en el estudio, pero no al efecto observado, por ejemplo, al riesgo relativo, y, por lo tanto, no afecta a la validez interna del estudio. En un estudio hipotético que investiga la relación entre el tabaquismo y el riesgo de disfunción renal a 10 años, consideramos dos escenarios: el primero es el escenario ideal (acuerdo universal para participar en el estudio); el segundo es una situación en la que el 20% de los fumadores con hipertensión grave (I. e., fumadores con mayor riesgo de disfunción renal) no responden.

Tabla 1

escenario Ideal, investigando la relación entre el tabaquismo y el riesgo a 10 años de disfunción renal

segundo escenario. El veinte por ciento de los fumadores con hipertensión grave (es decir, los individuos con mayor riesgo de disfunción renal) no aceptan participar en el estudio (Tabla 2)., En este escenario, la tasa de no respuesta está relacionada con el estado de tabaquismo y con el riesgo de enfermedad (de hecho, independientemente del tabaquismo, los individuos con hipertensión grave son más propensos a tener disfunción renal). El RR es: RR = 0.075/0.050 = 1.5. Este RR subestima el RR verdadero de la enfermedad porque el numerador no incluye los casos con disfunción renal que podrían ocurrir en no Participantes (20% de fumadores con hipertensión grave, es decir, una población con alto riesgo de enfermedad renal)., Aunque en este ejemplo la falta de respuesta conduce a una subestimación del verdadero RR, este tipo de sesgo también puede generar una sobreestimación del RR, dependiendo de la dirección del sesgo.

Tabla 2

segundo escenario, investigando la relación entre el tabaquismo y el riesgo a 10 años de disfunción renal

sesgo de incidencia-prevalencia

un sesgo de selección particularmente común en estudios transversales es el sesgo de incidencia-prevalencia (también llamado sesgo de Neyman o sesgo de supervivencia)., Este sesgo ocurre cuando la estimación del riesgo de una enfermedad se hace utilizando datos recopilados en un momento dado en una serie de sobrevivientes en lugar de basarse en datos recopilados durante un período de tiempo (Ejemplo 2) o cuando la selección sesgada de casos produce una frecuencia distorsionada de exposición (ejemplo 3).

Ejemplo 2 (fig. 1)

consideramos un estudio de cohorte hipotético que incluye 56 individuos: 28 expuestos y 28 no expuestos a un factor de riesgo dado. El objetivo del estudio es investigar la relación entre la exposición al factor de riesgo y el riesgo de enfermedad., Se realiza un seguimiento de la cohorte durante 4 años. Durante este período, La enfermedad de interés ocurre en 5 individuos en el grupo expuesto y en 5 individuos en el grupo no expuesto. Por lo tanto, el RR de la enfermedad (expuesto vs.No expuesto) es 1. Consideramos esta figura (RR = 1) como el verdadero RR. Durante los primeros 2 años, hay una muerte en el grupo expuesto y otra muerte en el grupo no expuesto (fig. 1). Si realizamos una encuesta después de 2 años, la relación de prevalencia de enfermedad entre individuos expuestos y no expuestos es de 0.5 , Un valor que se desvía del verdadero RR (es decir, 1)., Por esta razón, debemos estimar la aparición de una enfermedad en términos de incidencia (es decir, nuevos casos que ocurren en una muestra en un intervalo de tiempo dado) en lugar de en términos de prevalencia (es decir, casos contados en un momento dado) .

Fig. 1

ejemplo hipotético de sesgo de incidencia-prevalencia (ver texto para más detalles).

Ejemplo 3

En un estudio caso-control, Tsai et al. investigó la asociación entre los factores de estilo de vida y las probabilidades de enfermedad renal terminal (ESRD) en Taiwán., Entre los posibles factores de riesgo, estos autores consideraron la asociación entre los suplementos multivitamínicos y la ERT (Tabla 3). En este estudio, la odds ratio (OR) del uso de suplementos multivitamínicos se calcula mediante la fórmula estándar: OR = (16/184)/(67/133) = 0.087/0.504 = 0.17. Una OR de 0,17 significa que las probabilidades de exposición a suplementos multivitamínicos fueron 83% más bajas en individuos con ERT que en aquellos sin esta complicación., En este estudio, la selección de casos y controles y la evaluación del uso multivitamínico se asumieron como imparciales, y consideramos que este OR es el verdadero OR.,

Tabla 3

Estado de la enfermedad en relación con los suplementos multivitamínicos

en un escenario hipotético donde la selección de casos, pero no la de los controles, está sesgada (el investigador, influenciado por el conocimiento previo del Estado de exposición, puede recoger casos principalmente entre individuos conocidos por ser usuarios de multivitaminas), la frecuencia de casos puede ser espuriosamente mayor (tabla 4). O en esta situación es: O = (32/168)/(67/133) = 0.190/0.504 = 0.38., En este escenario, el proceso de selección sesgada de casos produce una alteración importante en la estimación de OR (0,38 vs.0,17). Para evitar este problema, el proceso de selección de casos y controles debe ser idéntico e independiente del Estado de exposición (es decir, el investigador debe estar ciego al estado de exposición).,

Tabla 4

Estado de la enfermedad en relación con los suplementos multivitamínicos (escenario sesgado)

sesgo de pérdida a seguimiento

Ejemplo 4

el sesgo hasta el seguimiento ocurre en estudios de cohortes prospectivos. Con este tipo de sesgo, la verdadera relación entre la exposición y la enfermedad solo se distorsionará si las pérdidas durante el seguimiento son selectivas (no aleatorias) con respecto a la exposición y el resultado., Consideramos un estudio de cohorte hipotético que investiga la relación entre la actividad física y el riesgo de hipertensión a 10 años. Una vez más, imaginamos dos situaciones (fig. 2): el primero es el escenario ideal; el segundo es una situación en la que un individuo con baja actividad física y obesidad (es decir, un individuo con alto riesgo de hipertensión) se pierde para el seguimiento. En el escenario ideal, el RR a 10 años de hipertensión en el grupo de baja actividad física en comparación con la actividad física leve a moderada es de 2,0., En el segundo escenario, dado que la pérdida de seguimiento de individuos con baja actividad física también se ve afectada por la obesidad (que es una condición comórbida que predispone a la hipertensión independientemente de la actividad física), el RR resultante (de 1) está abiertamente subestimado.

Fig. 2

ejemplo hipotético de sesgo de pérdida A seguimiento (Ver texto para más detalles).,

confusión por indicación

Ejemplo 5

la confusión por indicación es un tipo de sesgo que se genera cuando la indicación a tratar es un factor de confusión para la relación tratamiento-resultado. Este sesgo se produce en estudios observacionales de la eficacia del tratamiento, es decir, estudios en los que la asignación de pacientes a un tratamiento específico depende de una decisión arbitraria del investigador y no de la casualidad, como en los ensayos clínicos aleatorizados . Como consecuencia, los dos grupos de estudio (activo vs., placebo) no son comparables para los factores pronósticos relevantes al inicio del estudio. En este caso, consideramos 2 estudios hipotéticos que investigan el efecto de una nueva clase de estatinas sobre la tasa de incidencia de infarto de miocardio en pacientes con hipercolesterolemia: el primero es un ensayo clínico aleatorizado, y el segundo Incluye pacientes que no se asignan aleatoriamente al grupo activo (es decir, reciben tratamiento en base a la decisión del médico). En el ensayo clínico aleatorizado, el hazard ratio de infarto de miocardio es 0,70, p. ej., los pacientes que reciben la nueva estatina tienen una tasa de riesgo de infarto de miocardio que es un 30% más baja que la de los pacientes que reciben el placebo. En el estudio observacional, los resultados son sorprendentes porque la razón de riesgo de infarto de miocardio (brazo activo frente a placebo) es de 1,10, es decir, los pacientes en tratamiento con la nueva estatina tienen una tasa de riesgo de infarto de miocardio un 10% superior a la de los pacientes con placebo., Esto se debe a que en el estudio observacional el investigador trata con mayor frecuencia a pacientes con un pronóstico basal más comprometido con la nueva estatina (un fármaco que considera de mayor eficacia en comparación con tratamientos anteriores), generando así un sesgo debido a la ausencia de comparabilidad entre los dos grupos de estudio.

sesgo voluntario

Ejemplo 6

un sesgo voluntario (o sesgo de auto-selección) ocurre cuando los individuos que se presentan como voluntarios para un estudio difieren en características clínicas relevantes de aquellos que no lo hacen., La autoelección es una amenaza para la validez interna del estudio si está relacionada con la exposición y, independientemente de la exposición, con la enfermedad/desenlace. En un estudio prospectivo, observacional, en la población general, Ganguli et al. se evaluaron las implicaciones pronósticas del sesgo de los voluntarios comparando la tasa de mortalidad en 1.366 individuos reclutados mediante esfuerzos intensivos de inscripción y en 315 voluntarios que aceptaron participar en el estudio después de un solo envío., En el momento de la inscripción, los voluntarios eran con mayor frecuencia mujeres, con mayor escolaridad y puntuación en las pruebas cognitivas y menos probabilidades de utilizar el servicio de salud en comparación con los no voluntarios. Durante el seguimiento de 6-8 años, la tasa de mortalidad fue mucho menor en los voluntarios que en el resto de los individuos. Los autores concluyeron que los estudios relacionados con la salud con poblaciones compuestas parcial o totalmente de voluntarios deben tener en cuenta un posible sesgo de voluntarios al analizar e interpretar los datos., No se puede producir un sesgo voluntario en los estudios aleatorizados en los que los sujetos son aleatorizados solo después de aceptar participar .

sesgo de información

un sesgo de información ocurre durante la recolección de datos. El tipo más importante de sesgo de información es el sesgo de clasificación errónea. Un sesgo de clasificación errónea está presente cuando la detección del Estado de exposición (sesgo de identificación de exposición) y/o la evaluación de la enfermedad (sesgo de identificación de enfermedad) está sesgada, es decir, los individuos expuestos/enfermos se clasifican como no expuestos/no enfermos y viceversa., En la práctica clínica, una fuente común de clasificación errónea se deriva de la inexactitud de algunas pruebas diagnósticas. La clasificación errónea puede ser no diferencial o diferencial.

clasificación errónea No diferencial

Ejemplo 7

en la investigación clínica la exactitud de cualquier relación exposición-enfermedad depende de la realización de la prueba diagnóstica utilizada para evaluar la exposición o para establecer la enfermedad. Aquí nos centramos en la clasificación errónea de la exposición., En la clasificación errónea no diferencial, el rendimiento de la prueba diagnóstica (es decir, la capacidad de la prueba para clasificar correctamente a los individuos como verdaderamente expuestos/no expuestos a un factor de riesgo dado) es el mismo en los casos y en los controles. En la clasificación errónea diferencial, el rendimiento de la prueba diagnóstica para la identificación de la exposición difiere entre los casos y los controles.

se considera un estudio de casos y controles] que investiga la asociación entre el SIDA y la candidiasis esofágica., En el primer escenario (escenario ideal) la presencia de candidiasis esofágica se determinó mediante el patrón oro (biopsia) y en el segundo escenario mediante un cuestionario de autoinforme, método que puede generar una clasificación errónea no diferencial (Tabla 5). La OR de candidiasis esofágica entre casos y controles se calcula como la relación entre las dos probabilidades: o = (20/480)/(5/995) = 0.042/0.005 = 8.4. Dado que la candidiasis esofágica se evaluó mediante el patrón oro (biopsia) y dado que suponemos que no hay sesgo de selección, consideramos que la OR verdadera es de 8,4.,

Tabla 5

escenario Ideal: candidiasis esofágica establecida por biopsia

para dilucidar la distorsión de la estimación de OR atribuible al uso del cuestionario, consideramos la tabla 6 en la que los individuos se la base de un cuestionario de autoinforme. En este caso, la OR de la candidiasis esofágica evaluada por el cuestionario es: o = (86/414)/(161/839) = 0.21/0.19 = 1.1., Debido a que el cuestionario de autoinforme es un método inexacto para identificar a los individuos afectados por candidiasis esofágica, la OR resultante es sesgada. Con dos categorías de exposición (Presencia / Ausencia de candidiasis esofágica) la clasificación errónea no diferencial siempre afecta a la OR hacia 1.,

Tabla 6

segundo escenario: candidiasis esofágica evaluada mediante un cuestionario de autoinforme

clasificación errónea diferencial

Ejemplo 8

En clasificación errónea diferencial el rendimiento de un ensayo para la identificación de la exposición difiere entre los casos y los controles. Consideramos un nuevo escenario hipotético en el que el cuestionario de autoinforme para la identificación de individuos afectados por candidiasis esofágica tiene un desempeño diferente en casos y controles (Tabla 7)., La OR de la candidiasis esofágica evaluada por el cuestionario de autoinforme es: o = (86/414)/(400/600) = 0.21/0.67 = 0.3. Aquí, la clasificación errónea diferencial conduce a una subestimación de la fuerza de la asociación entre la exposición y la enfermedad.,

Tabla 7

candidiasis esofágica evaluada mediante un cuestionario de autoinforme (clasificación errónea diferencial)

en general, la clasificación errónea diferencial puede aumentar o disminuir la fuerza de las asociaciones notificadas, dependiendo en la dirección de la clasificación errónea., Las causas comunes que producen una clasificación errónea son: sesgo de recuerdo (un sesgo que resulta de una memoria imprecisa de exposiciones pasadas); sesgo del entrevistador (la tendencia del entrevistador a obtener respuestas que apoyan nociones preconcebidas); sesgo del observador (resultante del conocimiento del Estado de exposición del Evaluador de resultados) y sesgo de dilución de regresión (un sesgo relacionado con la regresión a la media que se origina en estudios longitudinales que investigan la asociación entre las mediciones basales de una variable continua y el riesgo de un resultado dado) ].,

conclusiones

El sesgo es un problema inevitable en la investigación clínica y epidemiológica. Sin embargo, la correcta selección del diseño del estudio, la cuidadosa elección de los procedimientos de recolección y manejo de datos y la correcta definición de exposición y enfermedad representan estrategias de prevención importantes para minimizar los errores sistemáticos en la investigación clínica.

  1. Rothman KJ: Epidemiology. implantación. Nueva York, Oxford University Press, 2002, págs. 20 y 21.
  2. Last J (ed): A Dictionary of Epidemiology, ed 3., Oxford, Oxford University Press, 1988.
  3. Tripepi G, Jager KJ, Dekker FW, Zoccali C: medidas de efecto en la investigación epidemiológica. Nephron Clin Pract 2010; 115: c91-c93.
    recursos externos

    • Crossref (DOI)
    • Pubmed/Medline (NLM)
    • Web Web of Science

  4. Noordzij M, Dekker FW, Zoccali C, Jager KJ: medidas de frecuencia de enfermedad: prevalencia e incidencia. Nephron Clin Pract 2010; 115: c17-c20.,
    recursos externos

    • Pubmed / Medline (NLM)
    • Crossref (DOI)

  5. Tsai SY, Tseng HF, Tan HF, Chien Ys, Chang CC: End-stage renal disease in Taiwan: a case-control study. J Epidemiol 2009;19: 169-176.
    Recursos Externos

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
    • ISI Web of Science

  6. Stel VS, Zoccali C, Dekker FW, Jager KJ: El ensayo controlado aleatorizado. Nephron Clin Pract 2009; 113: c337-c342.,
    recursos externos

    • Pubmed / Medline (NLM)
    • Crossref (DOI)
    • Web Web of Science

  7. Ganguli M, Lutle ME, Reynolds MD, Dodge HH: selección aleatoria versus voluntaria para un estudio basado en la comunidad. J Gerontol A Biol Sci Med Sci 1998; 53: M39-M46.,
    recursos externos

    • Pubmed / Medline (NLM)
    • Chemical Abstracts Service (CAS)
    • Web Web of Science

  8. Hernan MA, Hernandez-Diaz s, Robins JM: a structural approach to selection bias. Epidemiology 2004; 14: 615-625.,
    recursos externos

    • Crossref (DOI)

  • Hessol NA, Schwarcz s, Ameli N, Oliver G, Greenblatt RM: Accuracy of self-reports of acquired immunodeficiency syndrome and acquired immunodeficiency syndrome-related conditions in women. Am J Epidemiol 2001; 153: 1128-1133.
  • Tripepi G, Jager KJ, Dekker FW, Zoccali C: sesgo en la investigación clínica. Kidney Int 2008; 73: 148-153.,
    recursos externos

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
    • Chemical Abstracts Service (CAS)
    • Web Web of Science

  • contactos de autor

    Dr. Giovanni tripepi, CNR-ibim

    Instituto de biomedicina, epidemiología clínica y fisiopatología de las enfermedades renales y

    hipertensión arterial, C/o Euroline de ascrizzi Vincenzo

    via Vallone Petrara n. 55/57, en–89124 Reggio Calabria (Italia)

    Tel., +39 0965 397 010, Fax +39 0965 26879, correo electrónico [email protected]

    detalles del artículo / Publicación

    Copyright / Drug Dosage / Disclaimer

    Copyright: Todos los derechos reservados. Ninguna parte de esta publicación puede ser traducida a otros idiomas, reproducida o utilizada en cualquier forma o por cualquier medio, electrónico o mecánico, incluyendo fotocopias, grabaciones, microcopias, o por cualquier sistema de almacenamiento y recuperación de información, sin el permiso por escrito del editor.,dosis del medicamento: los autores y el editor han hecho todo lo posible para garantizar que la selección del medicamento y la dosis establecidas en este texto estén de acuerdo con las recomendaciones y prácticas actuales en el momento de la publicación. Sin embargo, en vista de la investigación en curso, los cambios en las regulaciones gubernamentales y el flujo constante de información relacionada con la terapia farmacológica y las reacciones a los medicamentos, se insta al lector a verificar el prospecto de cada medicamento para cualquier cambio en las indicaciones y dosis y para advertencias y precauciones adicionales., Esto es particularmente importante cuando el agente recomendado es un medicamento nuevo y/o empleado con poca frecuencia.
    Descargo de Responsabilidad: las declaraciones, opiniones y datos contenidos en esta publicación son únicamente los de los autores y colaboradores individuales y no de los editores y el editor(es). La aparición de anuncios o / y referencias de productos en la publicación no es una garantía, respaldo o aprobación de los productos o servicios anunciados o de su efectividad, calidad o seguridad., El editor y el editor(es) declinan la responsabilidad por cualquier daño a personas o propiedad resultante de cualquier idea, método, instrucciones o productos mencionados en el contenido o los anuncios.

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *