La precisión de los resultados y su relevancia clínica

temperatura

Con esta entrada intentaremos resolver las siguientes dudas:

  • ¿Por qué fijarnos en los Intervalos de Confianza?
  • ¿Qué aportan los Intervalos de Confianza en la precisión de los resultados?
  • ¿La precisión de los resultados condiciona la interpretación de la Relevancia Clínica?
  • ¿La Relevancia Clínica condiciona la toma de decisiones?

Como ya sabemos, al hacer una lectura crítica de un artículo científico en ciencias de la salud hemos de valorar 3 grandes condiciones: la validez interna (riesgo de sesgos), los resultados y finalmente su aplicabilidad. Si alguno de estos 3 condicionantes no cumple con los requisitos mínimos imprescindibles, significa que este estudio no me sirve para tomar la decisión clínica concreta.

En el apartado de resultados, tenemos que interpretar dos conceptos: la magnitud y la precisión de los resultados descritos en el estudio. En este apunte daremos pistas para mejorar la interpretación y evaluación crítica de la precisión.

¿Cómo delimitamos la precisión de los resultados?

Los investigadores describen los resultados con los datos obtenidos de la muestra, con porcentajes (%) en caso de proporciones o con medidas de tendencia central y de dispersión (p.ej. media y desviación estándar, o mediana y rango intercuartílico) en caso de variables cuantitativas. Pero también, y más importante, deberían describir la estimación que hacen de estos resultados de la muestra a la población diana/referencia, que representa el valor real. Es decir, lo que se ha evaluado en la muestra de participantes (p.ej. la edad o la prevalencia de úlceras o la reducción de mortalidad con un determinado tratamiento) tiene que proyectarse a la población diana, que es a la que finalmente el lector del estudio tendrá que considerar para aplicar o no las conclusiones del estudio. Esta inferencia a la población diana/referencia se expresa mediante el intervalo de confianza (IC95%). Este IC95% tiene un punto central, que es la estimación puntual, que representa el valor más probable que encontraríamos en la población diana, el valor real más probable. Pero como partimos de datos de una muestra, esta estimación puntual tiene otros valores mayores y menores que también son posibles, valores que van desde el límite inferior del IC95% hasta el límite superior. Estos valores se distribuyen de forma normal, en campana de Gauss; el punto central corresponde al valor real más probable y los valores de alrededor son cada vez menos probables a medida que nos acercamos a sus extremos.

Cuantos más datos tengamos de la muestra, es decir, mayor número de participantes (tamaño de muestra o n) y/o mayor número de eventos aparecidos durante el seguimiento, más precisa podrá ser la estimación del valor real en la población diana, y más estrecho será IC95% calculado.

Concluyendo, para evaluar la precisión de los resultados tenemos que fijarnos en la amplitud del IC95%. A más datos disponibles, menor amplitud del IC95% y mayor precisión de los resultados.

Pero, ¿cómo determinamos que el IC95% es suficientemente estrecho, es decir, que los resultados son precisos?

Hemos dicho que los valores que están en el límite inferior y superior del IC95% son también posibles valores reales. Entonces la pregunta que tengo que hacerme al interpretar los resultados es: ¿Tomaría la misma decisión para mi paciente si supiera que el efecto real está en el límite inferior del IC95% que si está en el límite superior?

Un ejemplo:

Tenemos un ensayo clínico que demuestra que un nuevo medicamento es capaz de mantener el colesterol de los 100 pacientes de la muestra a 195 mg/dl de media, con una desviación estándar de 80. Esto serían los resultados “muestrales”. Con estos datos se estima que la media real en la población diana está entre 179 y 211, es decir, media de 195 con IC95% de 179 a 211. Esto son los resultados “poblacionales”, los de la “población real”. Este intervalo, 179 – 211, ¿es suficientemente estrecho o es demasiado amplio?

Para decidir tenemos que fijarnos en el efecto mínimo beneficioso para el paciente. Este valor determina el límite de la Relevancia Clínica (RC). En el material y métodos del estudio que estamos leyendo, los investigadores deberían haber determinado y descrito cual es este efecto mínimo que consideran que útil/beneficioso para el paciente (teniendo en cuenta la relevancia de los beneficios, los efectos indeseables, los costes,…del nuevo tratamiento), ya que en función de esto se calcula el tamaño de la muestra. En caso de no encontrarlo descrito en el estudio, tendremos que basarnos en recomendaciones de GPC, otros estudios, o nuestro propio criterio. Si los investigadores, o las guías señalan como objetivo mínimo tener un colesterol de < 185 (me invento este valor), está claro que los resultados del estudio que estamos leyendo no son suficientemente precisos ya que mi decisión de prescribir este nuevo tratamiento no será la misma si el el efecto real es 179 o 211. En la lectura crítica de este estudio podré afirmar que los resultados no son suficientemente precisos debido a un tamaño de muestra insuficiente. Si en lugar de 100 participantes en el estudio hubieran incluido a 300, el resultado sería una media de colesterol de 195 con IC95% de 186 a 204. Ahora, con estos datos más precisos, veo claro y de forma concluyente que el nuevo fármaco no consigue reducir el colesterol por debajo de las necesidades del paciente (<185). Tendré que buscar otro estudio que evalúe otra intervención, farmacológica o no, y que consiga mantener a los “pacientes” con un colesterol <185 de media y que el límite superior del IC95 sea inferior a esta recomendación, p.e. media de 175 con IC95% de 169 a 183.

Más ejemplos. En la siguiente imagen (fuente: Argimon 2002 enlace ) vemos representado el efecto, en forma de Reducción Absoluta de Riesgo (RAR) y su IC95%, de 5 ensayos clínicos distintos. Vemos representado el valor de Relevancia Clínica (RC) en un 20%: para recomendar el nuevo tratamiento, este debe proporcionar al paciente un beneficio >20% que el tratamiento control. Como todos los valores dentro del IC95% son posibles, solo podremos recomendar el tratamiento evaluado en el estudio B, ya que es el único que todo su IC95% está por encima del >20%, valor de la RC. El estudio E también podría ser importante; su RAR es de 25%, pero el límite inferior de su IC95 es de 15%, por debajo del límite de RC. Si hubieran hecho el estudio con un tamaño de muestra superior, el IC95% se estrecharía y posiblemente no cruzaría el valor de RC y su resultado sería concluyente, y por tanto recomendable la intervención evaluada.

El estudio D tiene todas posibilidades. La intervención evaluada puede ser menos efectiva que la intervención control, ya que el verdadero efecto real podría ser de -5% a -0,1%. Podría no haber diferencias entre la intervención evaluada y el control si el valor real fuese RAR=0% y podría también ser más beneficiosa que el control ya que la RAR real podría situarse en cualquier punto entre +0,1% y +25%. Pero incluso dentro de esta última opción, sólo recomendaremos aplicar la intervención si el beneficio real fuera >20% de RAR.

El estudio D es el único estadísticamente no significativo. Su IC95% cruza el valor nulo, el valor de RAR=0%, el valor que no descarta la hipótesis nula; no podemos descartar que el efecto observado sea consecuencia del azar.

argimon
En definitiva:

  • Todo resultado cuyo IC95% cruza el valor nulo (el “0” en diferencias absolutas, p.ej una RAR, o el “1” en medidas relativas, p.ej un RR o una OR) es un resultado estadísticamente no significativo. El valor de la p no será < a 0,05.
  • Todo resultado cuyo IC95% cruza el valor de Relevancia Clínica, es un resultado clínicamente no concluyente.

A partir de estas premisas, puedes encontrar todas las combinaciones posibles que determinan la interpretación estadística y clínica de los resultados de un estudio, como se muestra en la imagen previa.

Bibliografía

  • Argimon JM. El intervalo de confianza: algo más que un valor de significación estadística. Med Clin (Barc) [Internet]. Elsevier; 2002 Mar 23 [cited 2015 Sep 28];118(10):382–4. enlace
  • Montori VM, Kleinbart J, Newman TB, Keitz S, Wyer PC, Moyer V, et al. Tips for learners of evidence-based medicine: 2. Measures of precision (confidence intervals). Cmaj [Internet]. 2004;171(6):611–5. enlace
  • Roberto Candia B, Gianella Caiozzi A. Intervalos de confianza. Rev Méd Chile [Internet]. 2005;133:1111–5. enlace
  • Sócrates Aedo M. Intervalos de confianza para proporciones. Rev Obs Ginecol [Internet]. 2008;3(1):68–70. enlace

Xavier Basurto – xbasurto@girtual.com –

 

Si quieres estar al día de los post que vamos publicando y sobre los cursos que organizamos, inscríbete al boletín electrónico que publicamos en Girtual




Tus datos personales se incorporarán al fichero Boletín electrónico, de titularidad de Girtual SCP, para la gestión de suscripciones y el envío del boletín de la empresa. En cualquier momento puedes modificar tus datos o darte de baja enviándonos un mail a info@girtual.com


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>