Google+

Bajándole los humos a "p"

https://twitter.com/emulenews
El pasado día 2 de Agosto Steven Novella (@stevennovella )‏ publicó en "science based medicine" "0.05 or 0.005? p-value wars continue" en el que repasaba la sugerencia realizada entre otros por John P.A. Ioannidis en una editorial publicada en PsyArXiv bajo el título "Redefine Statistical Significance"creo que su traducción puede resultar de interés para quienes se quieran adentrar en el mundo de la investigación al 100% al principio me permito una floritura creo que comprensible en nuestro medio.


_________________________________


A lo largo del tiempo la FIFA ha cambiado las dimensiones del campo de juego, específicamente las del área de penalti y la altura y anchura de la portería. Lo han hecho para equilibrar las oportunidades de delanteros y portero y hacer el juego más interesante para los espectadores.

Los científicos están debatiendo ajustes similares en la significación estadística, para equilibrar el balance entre falsos positivos y falsos negativos. Como en el caso de delanteros y portero, algunos cambios son un juego de suma cero si disminuyes los falsos positivos incrementas los falsos negativos y viceversa. Donde está el equilibrio perfecto es una cuestión complicada y un tema de debate creciente.

Un artículo reciente de una larga lista de autores, incluidos grandes popes como John P.A. Ioannidis sugieren que el valor de p que habitualmente se usa como umbral de significación estadística debe cambiar de 0.05 a 0.005 para los campos de biomedicina y psiquiatría. Escriben:
"Para los campos en los que el umbral para definir significación estadística de nuevos descubrimientos es p<0,05 proponemos un cambio a p<0,005. Este simple paso podría mejorar inmediatamente la reproducibilidad de la investigación científica en muchos campos. Los resultados que actualmente se llaman "significativos" pero no alcanzan este nuevo umbral podrían pasar a llamarse "sugerentes". Si bien los estadísticos ya sabían de la relativa debilidad de usar p≈0,05 como umbral y la propuesta de bajarlo a 0,005 no es nueva, ahora una masa crítica de investigadores apoya este cambio."
El p-valor se define como la probabilidad de que los resultados de un experimento se desvíen del nulo tanto como lo hicieron o más si la hipótesis nula es correcta. Si esto te parece difícil de entender no te sientas mal. Muchos científicos no pueden dar la definición técnica correcta. Para simplificarlo, ¿cual es la probabilidad de que obtuvieras esos resultados (o mayores) si tu hipótesis no es cierta? En ciencias de la salud generalmente esto se refiere a un efecto, como la diferencia en la reducción de dolor entre un placebo y un tratamiento experimental. ¿Es estadísticamente significativa? Un p-valor de 0,05, el umbral tradicional, significa que existe un 5% de posibilidad de que obtuvieras esos resultados sin que exista un efecto real. Un p-valor de 0,005 significa que hay un 0,5% de posibilidad; un cambio de 1/20 a 1/200.

Existen importantes problemas con la sobredependencia del p-valor. Nunca se pretendió que fuera una medida de si un efecto era o no real, pero desafortunadamente el deseo humano de simplificar le ha colocado en ese papel. Además, la gente tiende a virar su significado interpretando que es la probabilidad de que el efecto sea real (en lugar de que LOS DATOS dicen lo que dicen). Sin embargo, esta inversión del significado no es válida por muchos motivos. Un estudio con un p-valor  de 0,05 no significa que haya un 95% de probabilidad de que el efecto sea real. Podría haber aún sólo una pequeña probabilidad de que el efecto sea real, dependiendo de otros factores.

Otorgar demasiada importancia al p-valor conduce de forma demostrable al llamado p-hacking. Existen formas sutiles (y no tan sutiles a veces) en las que los investigadores pueden sesgar el resultado de un estudio para traspasar el umbral mágico de 0,05 declarando sus resultados significativos y consiguiendo que se publiquen (otro grave sesgo científico -nota del trad.-). Esto a su vez conduce a un problema de reproducibilidad de la investigación y a inundar la literatura científica con una masa de estudios dudosos.

Los autores señalan esencialmente que el equilibrio entre falsos positivos y falsos negativos se ha alejado del punto óptimo. A lo largo de los años los investigadores han descubierto como jugar con el p-valor. En combinación con la tremenda presión de publicar resultados positivos y los sesgos que todos tenemos esto ha llevado a un exceso de hallazgos preliminares que mayoritariamente son falsos positivos.

Lo que los autores proponen alejaría ciertamente el equilibrio de los falsos positivos. Es una solución sencilla, pero podría no ser óptima, o no suficiente por si misma. Aunque nos guste la sugerencia de considerar 0,005 como estadísticamente significativo, y lo que esté entre 0,05 y 0,005 como "sugerente". Esto está más cerca de la verdad, y probablemente ayudará a cambiar la forma en la que los científicos y el público piensan respecto a los p-valor. Yo mismo he hecho este cambio mental. No me emociono acerca de los resultados con un p-valor cercano a 0,05. Simplemente no significa mucho.

El lado oscuro, por supuesto, es que esto aumentará el número de falsos negativos. Dado lo sobrepasada que está la literatura con los estudios con falsos positivos, creo que es un buen cambio. Además, el umbral de p-valor no es la única variable. Los autores sugieren que se podría incrementar el tamaños de un estudio un 70% para mantener el ratio de falsos negativos donde está. Visto de esta forma no se trataría de un juego de suma zero. Puedes disminuir los falsos positivos y los falsos negativos aumentando el tamaño del estudio, o su fuerza.

Siendo esto cierto puede ser difícil para algunos investigadores, especialmente los que cuentan con pocos fondos, como los investigadores jóvenes (o los de disciplinas secundarias -N. de trad-). Para las enfermedades raras o cuestiones en las que es difícil enrolar a pacientes, aún disponiendo de fondos, puede ser duro alcanzar las cifras necesarias para conseguir p<0,005. Pero ¿y qué? pueden realizar su pequeño estudio y si consiguen p-valores marginales pueden incluso publicarlos. Sólo que en vez de llamar a sus resultados "significativos" han de llamarlos "sugerentes".

Podría haber consecuencias no deseadas de este cambio, pero en vista del grave problema con los estudios de falsos positivos defiendo que hagamos el cambio y veamos qué pasa. Podemos hacer ajustes posteriormente si es necesario.

Además, no quiero poner el foco en dónde situar el p-valor para distraer de la cuestión más profunda sobre la propia utilidad del p-valor en si. Algunas revistas han ido más allá prohibiendo completamente los p-valor en favor de otros métodos de análisis estadístico. Creo que es draconiano, pero tienen la idea correcta, poner al p-valor en su lugar.

Por ejemplo, el tamaño del efecto es extremadamente importante, pero a menudo descuidado. Más importante que el p-valor es alguna medida de la relación señal/ruido. ¿Cuál es el tamaño del efecto en comparación con lo que se está midiendo y la incertidumbre del resultado? Además, los análisis bayesianos pueden ser muy útiles. Un análisis bayesiano pregunta que realmente los investigadores piensan que hacen: ¿cual es la probabilidad de mi hipótesis dados estos datos? En un comentario en Nature sobre este tema sugieren que muchos investigadores no tienen habilidades estadísticas para hacer análisis bayesianos. Nuevamente digo ¿y qué? La respuesta es mejorar las habilidades estadísticas entre el investigador medio.

Este es, de hecho, el problema inherente. Muchos investigadores no comprenden las limitaciones del p-valor, o sucumben a la tentación de depender de esta medida porque es la vía rápida a la significación estadística y la publicación. También muchos no comprenden completamente la naturaleza del p-hacking y como evitarlo. Necesitamos más sofisticación en el mínimo análisis estadístico aceptable y la metodología de la investigación en salud.

Todo indica que el equilibrio ha cambiado de forma inaceptable hacia los falsos positivos. Probablemente necesitemos un cambio cultural completo en la comunidad de investigación en salud publicando menos estudios pero más rigurosos e indicando claramente cuales son estudios preliminares y eliminando el sesgo de publicación respecto a los estudios con resultados negativos.

Este cambio en el umbral para la significación estadística no será suficiente, pero creo que es un movimiento en la dirección correcta.

EDICIÓN 21/8/2017.

Lo grande de las RRSS es que si no es la interacción es simplemente tener buenas fuentes "sintonizadas" lo que te permite seguir mejorando. En este caso gracias a @emulenews viene muy a cuento el estudio "Estimating the evidential value of significant results in psychological science"en el que se calcula el factor bayesiano de nada menos que 287000 hallazgos científicos en psicología publicados en 35515 artículos. Las conclusiones son devastadoras:
Concluimos que debido a que el umbral de aceptación se ha establecido demasiado bajo para los hallazgos en psicología, una proporción sustancial de los resultados publicados tienen un soporte de evidencia débil.
Esto apoya la medida propuesta en la editorial de la que trata el artículo que traducimos recordando que la misma por si sola no bastará para mejorar la evidencia que sostiene o debería sostener nuestro trabajo.

Temporary skin tattoos for patient identification

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4864418/figure/f1/

After our last post about an adverse event due to patient identification wristband i think is mandatory work on an alternative and better system.

As you may know i love technology and i share a lot of articles about innovations on healthcare. On the last year wearables was a main topic; made from a mix of nanocomponents(1) and new materials they promised us a "permanent" monitorization of vital signs beyond hospital walls thanks to wireless connectivity(2).

In patient identification RFID is an eternal promise a decade ago but is far from our reality, it can lead to automated systems of record and traceability but we are tired of waiting.

We need a easy cheap and practical solution now.

Yesterday in the loneliness of the swimming pool i remembered the "calcomanías" that i used to wear when i was child. It was a one picture temporary tattoo for adhere to skin easy to use, only needed some water.

Now i search about it and i find it is now a fashion and there are a do it yourself system without water to adhere to skin. They are called "tattoonies" and have a limited duration from two to seven days and are easy to remove with alcohol or acetone.

https://www.tattooforaweek.com/en/Pink-Barcode-Tattoo

With or without barcode or other technology inside i think is a good idea for patient identifier, i know there are some risk of skin reactions but healthcare and socialcare systems needs a solution for these issue.

Head don't stop

Referrals:

1)Zucca A, Cipriani C, Sudha null, Tarantino S, Ricci D, Mattoli V, et al. Tattoo conductive polymer nanosheets for skin-contact applications. Adv Healthc Mater. mayo de 2015;4(7):983-90.

2)Bandodkar AJ, Molinnus D, Mirza O, Guinovart T, Windmiller JR, Valdés-Ramírez G, et al. Epidermal tattoo potentiometric sodium sensors with wireless signal transduction for continuous non-invasive sweat monitoring. Biosens Bioelectron. 15 de abril de 2014;54:603-9.

La pulsera que nos ata #SegPac


El pasado 4 de Agosto publiqué el siguiente tuit acompañado de la imagen que encabeza esta entrada.
En dicha foto el punto indicado con * corresponde al lugar de inserción de una vía IV periférica y la zona marcada con ** es el emplazamiento de una pulsera de identificación que la paciente del caso portaba en la residencia sociosanitaria.

Bien, escribo esta entrada por la inusitada cantidad de interacciones recibidas tanto en twitter (ver hilo del tuit) como en facebook.

En primer lugar voy a recomendar la lectura del "case report" porque describe una circunstancia muy concreta lo tenéis traducido aqui.

A partir de ahí 2 observaciones.

La primera: En este caso el artículo no está enfocado en el uso de la pulsera identificativa sino en el síndrome compartimental como complicación rara de una extravasación debida a la presencia de la pulsera.

La segunda: La pulsera no fue colocada en el centro donde ocurre el EA sino que venía con la paciente desde una residencia sociosanitaria. El EA ocurre con una rapidez bastante inusitada pues el artículo relata que la vía se puso a las 22h, se revisó a las 0h y a las 4h presentaba el aspecto de la foto (o peor pues la foto es posterior).

Pese a que muchas de las interacciones han sido más bien "reactivas" respecto al uso de pulseras de identificación me quedo con aquellas que señalan su necesidad imperiosa como elemento de seguridad pero quiero señalar que ni la respuesta afirmativa del paciente ni la pulsera (o su ausencia) son las que "causan" un evento adverso relacionado con una identificación errónea del paciente.

La identificación del paciente es, digamos, un subproceso, que se debe realizar rutinariamente de forma ideal antes de cada procedimiento. El nivel de riesgo de fallo de identificación se suele decir que es muy bajo pero también es conocido que sus consecuencias suelen ser muy graves. Hay algunos estudios que investigan el fallo en el propio proceso de identificación en entornos simulados y los datos no son tranquilizadores (1).

En nuestro propio estudio indagamos la capacidad de identificación del propio paciente en un subconjunto de pacientes concreto según su estado cognitivo y confirmamos que sin importar el tipo de pregunta que se realice (abierta o cerrada) los pacientes con peor estado cognitivo según el test de Pfeiffer presentaban mayor error en su identificación (2). Ello confirma lo que el caso señala sobre la necesidad de usar las pulseras identificativas en los pacientes de ciertos grupos de riesgo.

La pulsera identificativa constituye para muchas enfermeras un obstáculo a la hora de establecer vías venosas en los miembros superiores sobre todo cuando se inicia en los extremos distales y aunque formalmente se disponga de un método de reposición de las pulseras todos sabemos lo lento que resultan ciertos trámites en los hospitales (grandes o pequeños). Tal vez pulseras que permitan abrir y cerrar serían una solución; en todo caso la revisión regular de las vías se ha de incrementar si existen circunstancias que lo aconsejean.

 
BIBLIOGRAFÍA:


1) Philip L. Henneman PL, Fisher DL, Henneman EA, Pham TA, Campbell MM, Nathanson BH. Patient identification errors are common in a simulated setting. Annals of emergency medicine 2010; 55(6): 503-9.
2) Meijome Sánchez XM, Prieto Blanco AM, Basante Rodriguez A, Gonzalez Cea A, Fernandez Colinas S.  Fallo en la identificación del paciente con deterioro cognitivo; comparación entre pregunta abierta y pregunta cerrada Comunicación en XVIII Encuentro internacional de investigación en cuidados Vitoria 2013

Indice de seguridad de etiquetado #SegPac

https://twitter.com/StopErroresMed/status/892478410580250626

Esta entrada debería titularse "El sueño de una noche de verano" pero no perdamos la confianza en que de una manera u otra se haga algo EFECTIVO para solucionar un problema que ya sabemos que existe y cuyos efectos podemos mostrar con cifras.

La gente de @StopErroresMed (http://www.stoperroresdemedicacion.org) lleva mucho tiempo mostrando los datos, los ejemplos y "empujando" por una solución al grave problema de la #Isoapariencia el pasado día 2 de Agosto lanzaron este tuit quejándose del caso omiso que una marca hace de una de las recomendaciones concretas: vinCRIStina - metoTREXATO

En el diálogo en la red hice una ironía dando a entender que pudiera ser que los laboratorios no conocieran las recomendaciones concretas sobre el envasado y etiquetado de los medicamentos para terminar con esto:
Básicamente la idea es establecer una escala con la que valorar cada presentación farmaceútica en lo que respecta a la seguridad de su etiquetado en lo que respecta a este como factor de los errores de medicación.

Ha de tenerse en cuenta que en ciertos entornos profesionales la presentación utilizada difiere de la comercializada lo que trasladaría la obligación de un etiquetado seguro a la instancia donde se realice la manipulación (normalmente fragmentación) para el uso; esto es un problema dado que, además, alguna de estas manipulaciones vienen condicionadas por normas de protección de riesgos laborales de reciente publicación.

También ha de tenerse en cuenta que estamos hablando de productos con, por lo menos, un doble envasado: la caja exterior (la que se suele dispensar en la farmacia de la calle a pacientes ambulantes) y el envoltorio individual de cada dosis que en muchos casos es que recibe el profesional que administra el medicamento.

Como ejemplos de referencia os propongo las recomendaciones de los documentos "Information desing for Patient safety. A guide to the graphic desing of medication packaging" 2º edición y "Desing for patient safety: a guide to the labelling and packaging of injectable medicines" publicados hace 10 años¡¡¡ por el  NHS.

Para el ejemplo práctico voy a referirme únicamente al envasado de medicación no inyectable en dosis unitaria que se designa como "primary packaging" que es el que solemos recibir los profesionales en los puntos de atención directa donde se administra medicación a los pacientes. La escala tendría varios puntos a comprobar; algunos serían de respuesta simple (Si/No) y otros podrían tener una puntuación gradual (No cumple/básico/óptimo); con la suma de los puntos obtenidos sobre el total posible tendríamos ese índice X/Y que señalé.


Ítem
Respuesta
Puntuación
Superficie de impresión
No reflectante
Si/No
Integridad del texto
Texto íntegro en cada dosis
Si/No
Legibilidad del texto contraste
Texto legible en cada dosis sobre el fondo
Poco/Normal/Optimo
Legibilidad del texto tamaño
Texto legible en cada dosis tamaño
Poco/Normal/Optimo
Datos completos
Principio Activo, Dosis, Caducidad
Si/No

Así pues un medicamento "ideal" desde el punto de vista de la seguridad del envasado tendría 5/5 puntos en su envase primario (unidosis). La propuesta tiene la limitación de que alguno de los parámetros es subjetivo lo que haría que surgieran diferencias entre las apreciaciones de los diferentes profesionales.

¿Quien se anima para hacer una propuesta similar para las presentaciones de medicamentos inyectables?

Por otra parte ya sabemos que en algunos entornos de trabajo los medicamentos de este tipo de presentación se mantienen durante cierto tiempo en lo que podríamos llamar "envasado transitorio" dispuestos para su uso, dicha disponibilidad es propensa al error sobre todo en áreas críticas y desde hace mucho existen a disposición sistemas de etiquetado secundario como este:

https://safetyandquality.gov.au/wp-content/uploads/2012/02/ANZCA-and-Commission-Joint-statement-on-user-applied-labelling-standardisation.pdf

Creo que se pueden exigir acciones frente a la #isoapariencia a la industria mientras dentro del sistema seguimos procesando los medicamentos sin etiquetarlos de forma adecuada, pero así no resolveremos algunos de los errores que motivan esta reivindicación.

Un último apunte para la utopía; una vez establecida este tipo de escala de forma sistemática e institucional ¿no debería incluirse dentro de los criterios a la hora de los concursos de adquisición de productos?

Does ICN knows what is a nurse and what is it for?

From long time ago when i read our "representatives" talking about nursing staff levels comparing different country comes over me a sense of weariness.

It seems that all is valid for the purpose of that people, but bad arguments only lead us to bad destinations and the key question is What is de good argument? and Where are the good data?.

Nursing have the mission of caring individual or collective health as part of a healthcare system this it will be done based on an assessment of their health status. Thus the good argument at time to speak about staffing level are the needs of the individual and population. This argument is hard to materialise and varies from global to local level.

But the big problem at the time os compare nursing staffing at international level is a certain mode of deregulation of nursing academic and laboral definitions. Each country uses several definitions for nursing related jobs from not academic voluntaries to doctorates. Even in a economic integrated space like european union healthcare workers in nursing jobs positions don't have a regulatory scheme.

I think that the logical answer for this question can come from the association of regulatory authorities of nursing like the ICN. In fact, ICN have a "definition" of nursing (you can try to perfectionate) that is a good point of departure.

But everyone can know that for a lot of reasons the health needs of a population are different and for historical, cultural and economic reasons the formation and academic status of nursing too. ICN can't change this magically but they could send a clear message about a structure of nursing titles making a framework inside of that the national governments can design layers of job positions acording patients needs.

I navigated de ICN pages searching some resource about that and i found ICHRN and inside this a document called Nursing Human Resources Planning and Management Competencies. It describes competencies for management of human resources organized in six domains and especified for four levels of work in human resources management.
Then ICN knows what is a nurse manager and what they must do, but do ICN know what do the nurses wherever they work?.

In the pages of the ICHRN there are no more information about our trouble (the page of "publications" is empty), but under the area "networks" there is a document called "Regulation Terminology" wich contains definitions of interest for our purposes like these:

or these one:


I think there are enough information to try to build the framework that i said. What do you think?


Claves para comprender un metanálisis.


Traducción de "5 tips for understanding data in meta analyses" de  Hilda Bastian 

Hay un diluvio de estudios científicos de todo tipo, miles cada día. A menudo hay varios estudios buscando respuestas sobre el mismo tema, pero puede haber docenas e incluso centenares de ellos. El metanálisis es un grupo de técnicas estadísticas que usan datos de más de un estudio para combinarlos y analizarlos como un nuevo conjunto de datos.

No se empezó a hablar de metanálisis hasta los años 70. Ahora cada día se publican docenas de artículos con metanálisis y en menos de 5 años se duplicará el número de los publicados en un año. Sin embargo, los métodos del metanálisis siguen constituyendo un misterio para mucha gente.


Este comic es un forest plot, un estilo de visualización de datos para los resultados de un metanálisis. Alguna gente les llama “blobbograms”. Cada línea horizontal con un cuadrado en el medio representa el resultado de un estudio diferente. La longuitud de esa línea horizontal representa el intervalo de confianza de sus resultados. Esto te proporciona información sobre cuanta incertidumbre existe en torno a un resultado cuanto más corta más confianza podemos tener en ese resultado (Aquí la explicación).

El cuadrado se denomina el punto estimado o el "resultado" del estudio si lo prefieres. A menudo su tamaño va acorde con el peso que el estudio tiene en el metanálisis. Cuanto más grande, más confianza debemos tener en el resultado.

El tamaño del punto estimado es un eco de la longitud del intervalo de confianza. Son dos puntos de vista de la misma información. Un cuadrado pequeño y una linea larga dan menos confianza que un gran cuadrado en una línea corta.

El diamante en la parte inferior se llama resumen estimado. Representa el resumen de los resultados de los 3 estudios combinados. No se trata sólo de sumar los resultados de los estudios y dividirlos por 3. Se trata de un promedio ponderado. Los estudios más grandes con más eventos cuentan más.

Las esquinas derecha e izquierda del diamante son los límites de su intervalo de confianza. Con cada estudio que se añada al metanálisis estas esquinas se acercarán entre ellas y se moverán a derecha o izquierda según los resultados añadidos se inclinen en una u otra dirección.

La línea central es la "linea de no efecto". Si un resultado la toca o la cruza, no será significativo estadísticamente. (Un concepto complicado explicado aquí).

En biomedicina, los forest plots son la norma. Pero en otros campos, como la psicología, el resultado de los metanálisis con frecuencia se presentan como tablas de datos. Eso significa que cada punto de datos (el principio y el final de cada intervalo de confianza y sucesivamente) son números en una columna en lugar de estar representados en un gráfico (ejemplo).

Es un trabajo pesado interpretar las tablas y es fácil perderse en los detalles. Por otra parte, la visualización de los datos puede proporcionar una rápida, fuerte y falsa impresión. Vale la pena dedicar tiempo a los detalles. He aquí 5 claves para tener una perspectiva razonable. Usaré metanálisis de estudios clínicos comparando dos grupos porque son los más comunes.

1) No pases a las conclusiones sin examinar detenidamente el contexto y la prespectiva.

Busca el tema concreto y la medida estadística. En el ejemplo falso de abajo, el tema son los resultados de una prueba de detección de algo (puede ser estancias hospitalarias o ataques cardíacos por ejemplo).

En este caso la línea vertical de "no efecto" es 1. Para otras medidas podría ser 0. Es uno porque la medida estadística es un RR (ratio de riesgo): "95% IC" es el nivel de significación para el intervalo de confianza. (aquí otra explicación). Hay una segunda línea vertical de puntos: indica donde cae el promedio de los resultados combinados.

A excepción del primero estos estudios imaginarios son bastante parecidos. Ese primer estudio no tiene mucha fuerza. Su intervalo de confianza es tan largo que el extremo izquierdo no cabe en el gráfico lo que no es bueno. Por eso tiene una flecha.
Lo que está a izquierda y derecha no es siempre lo mismo. Lo elige quien realiza el metanálisis y es su forma de enmarcar el tema. Su forma de funcionar en conjunto suele ser fácil y obvia pero no siempre.

Por ejemplo, este es uno en el que el grupo de control está en la izquierda del metanálisis y a la derecha está el resultado bueno (es sobre reducir el tamaño de las porciones, menor es mejor). Mientras que en este, el grupo control (placebo) está a la derecha, y los resultados a la izquierda son mejores. (Se trata de lágrimas artificiales sin receta para los síntomas del ojo seco.) Mientras tanto, en éste, hace dos metanálisis; en uno en la página 58 "favorece" la inmunoterapia está a la derecha y páginas más adelante está a la izquierda. Y eso no es poco frecuente.

El orden de los estudios también varía. En el gráfico de arriba los estudios están en orden cronológico. Pueden estar en orden alfabético por el nombre del estudio lo que hace más fácil encontrar información extra de otra tabla o metanálisis en el artículo. También se pueden ordenar por sus resultados.

No siempre hay una figuar de resumen de la estimación en la parte inferior del gráfico de estudios. No pienses que el de abajo es "el" resultado. Puedes tener gráficos de diferentes metanálisis. Por ejemplo uno muestrando un resumen estimado de un grupo de metanálisis de preguntas relacionadas.

2. No pierdas de vista que datos no están en el metanálisis.

Probablemente esta es la trampa más común en la que se cae en los metanálisis: No tener en cuenta que a menudo buscan en un subconjunto de resultados. Si quien recopiló los datos originales no midió la misma cuestión y de la misma forma no tendrás datos que puedas combinar de esos estudios.

He aquí un ejemplo dramático de eso. Es de la misma revisión sistemática sobre lágrimas artificiales de venta libre mencionada más arriba.

Hay 2 resultados, comparando la diferencia de medias en las escalas de síntomas a los 21, 28 días (gráfico de arriba) y 56 días.


Sólo hay 2 ensayos en el gráfico. Sin embargo se obtuvieron 43 ensayos sobre efectos de las lágrimas artificiales. Es muy frecuente que se enfoque y se informen el metanálisis de datos como el resumen de todos los estudios encontrados: "Un estudio con 43 ensayos sobre lágrimas artificiales encontró..." (más ejemplos de esto en la vida real).

Entonces surge la pregunta sobre cómo se encuentran y seleccionan los estudios. Un mentanálisis no es necesariamente una revisión sistemática, con una búsqueda cuidadosa y completa de la evidencia sobre una pregunta. Siempre hay que tener 2 niveles en mente.

¿es probable encontrar estudios relevantes? y ¿Cuales de esos se representan en este resultado metanalitico en particular?

3. Recuerda comprobar si hay signos de que los estudios pueden ser demasiado diferentes de alguna  forma.

Sólo porque puedar echar un montón de números en una marmita matematica no significa que formen parte del mismo cálculo.  Por desgracia no siempre es tan obvio como en esta señal.


Un concepto importante en metanálisis es el estudio de la heterogeneidad Una forma de decir "estos elementos nos son exactamente los mismos". La heterogeneidad puede deberse a algo que conozacas, como que un ensayo se realizó con niños y otro con adultos. Pero también hay una heterogeneidad inexplicable y puede ser un problema. Las diferencias en los resultados entre grupos y los conflictos entre estudios pueden deberse al azar, pero pueden deberse también a la heterogeneidad. (una explicación aqui).

Hay pruebas estadísticas para la heterogeneidad en metanálisis. Una prueba común es el I2, que proporciona un resultado en porcentaje. Aquí lo veis al final de la primera línea:


Es del mentanálisis de la página 58 mencionado más arriba. Combina clasificaciones de excema/dermatitits de 6 estudios para prevenirla con inmunoterapia alergénica. Fijaos sólo en el porcentaja el final: 19%. Está en la parte baja de la escala: hasta un 40% no representa un problema. Pero 75% o más lo puede ser mucho, y debe hacerte ser cauto con el resultado. Es más importante cuando los estudios son potentes, porque esta prueba estadística no es fiable con muestras pequeñas.

(La prueba estadística en la línea del medio es la de significación estadística).


4. Buscar si uno (o varios) resultados llevan la mayor parte del peso.

El peso que un estudio obtiene está relacionado con lo que se llama la precisión del estudio. La medida de la precisión depende de cuantos participantes y eventos hubo en el estudio. No importa únicamente el tamaño total del estudio.

Digamos que el evento en el que estás interesado son ataques cardíacos y estás investigando un método para reducirlos. Pero por alguna razón, ninguna persona en el grupo experimental o de control tuvo un ataque cardíaco aúnque el estudio era suficientemente grande para haber esperado varios. Este estudio tendría menos capacidad para detectar cualquier diferencia que tu método pudiera haber generado, por lo que debería tener menos peso (en el metanálisis).

Es bastante frecuente que sólo uno o un par de estudios carguen con la mayoría del peso en el metanálisis. Un estudio de Paul Glasziou y cols. encontró que el ensayo con más precisión significaba un promedio del 51% del total (del metanálisis).

Algunos estudios son tan grandes que sobrepasan a todos los demás, no importa cuantos haya. Les llamo los Hulk. Los Hulk no pueden ser puestos en duda, sólo por su tamaño nadie repetirá otro estudio como ese. Esto es genial si proporcionan una respuesta definitiva, pero no tanto si pueden no ser representativos.

El tamaño del punto estimado (resultado) y la longitud del intervalo de confianza son clave para la asignación de peso a un estudio. El metanálisis debe incluir un porcentaje para mostrar cuanto contribuye cada resultado individual al promedio. Si no lo hace puedes saberlo mirando si hay uno o dos estudios cuyo resultado está mucho más cerca del resultado resumen que los otros. (Clave: La linea punteada vertical ayuda a esto, si la ponen).

Aquí una versión extrema y actual de esto. El ensayo de la iniciativa "salud de la mujer" (WHI) probó el tratamiento hormonoal prolongado en cáncer de mama. Es un "Hulk" clásico: un estudio de investigación de 15 años con más de 160000 muejeres.

Este es un análisis 6.3.3 de Jane Marjoribanks y cols. versión 2012. Hay muchos más metanálisis que este.

Los 140 eventos en más de 160000 mujeres del WHI machacan a los 4 eventos en los dos ensayos previos más pequeños. El WHI se lleva el 95,4% del peso del promedio del resumen.


Clave: Si te sientes confuso por la medida estadística y necesitas ganar perspectiva sobre qué pasa, deberás mirar las cifras brutas de los eventos. En este caso están a la izquierda: 68 de las 9084 mujeres del grupo de tratamiento tuvieron cáncer de mama por 76 de las 8649 mujeres del grupo control. Está tocando la línea de "no efecto", luego no es un resultado estadísticamente significativo.

5. El tamaño no lo es todo, se cuidadoso con el "recuento de votos".

Una de las principales ventajas de los metanálisis es que son la alternativa más fiable que el "recuento de votos": "4 de 5 estudios muestran..."

¿Qué sucede si esos "4" son estudios pequeños y mal realizados en un grupo que no es relevante para tí (no es tu foco) y el quinto es el único ensayo bien diseñado, potente y relevante?

El ingenuo recuento de votos es un riesgo, hay más estudios que "podrían llevar a conclusiones desastrosas en varias circunstancias" escibieron Madden y Paul.

Aquí presentamos 2 metanálisis de una revisión sistemática sobre revistas biomédicas revisadas por pares. Hay también un resumen de la estimación combinada de los dos análisis. Se ha eliminado el contexto pero se ha dejado un elemento crítico extra a la derecha.


Pese a que la estimación del análisis en la parte inferiro favorece la revisión por pares no cegada, no es una respuesta definitiva. Los círculos de colores a la derecha muestran la evaluación del riesgo de sesgo de acuerdo a 4 criterios y muestran el porqué.

Sólo 1 estudio (el de arriba) tiene una valoración positiva de los cuatro criterios en un resultado, pero no es muy preciso. El segundo estudio tiene más precisión en esa pregunta, pero tiene un par de aspectos dudosos (marcados en amarillo).

Esto demuestar hasta que punto es complejo y exige juicio esta labor. Un estudio más o menos. La diferencia en juicio sobre la calidad del estudio. Enfocarse en resultados o preguntas diferentes. Cualquiera de estos cambios pueden modificar el resultado.

Una buena revisión sistemática y metanálisis puede ser de gran ayuda para clasificar estudios aparentemente en conflicto. Pero no debe sorprender que los resultados de los mentanálisis varien. Necesitamos más gente capaz de leerlos criticamente y ver porqué los mentanálisis se convierten en resultados conflictivos por si sólos.

¿Es posible el comunitarismo en sanidad?

Para comprender esta entrada es conveniente leer "El ABC del comunitarismo" de @lasindias que viene a explicar que no es que falte empleo es que falla el sistema porque hay una crisis de escala en la que los beneficios no se invierten en producir sino en especular; al mismo tiempo se está produciendo una revolución en la producción acercandose a la escala de la comunidad y, al mismo tiempo, de la abundancia entendida como la posibilidad de producir nuevas unidades o realizar nuevos servicios sin incremento de coste apreciable.

En este sistema el trabajo es en general precario y alienante pero, al mismo tiempo, el trabajo es el método para cambiar el sistema y de conquistar la propia vida gracias a la organización comunitarista.

El discurso políticamente puede gustar más o menos pero sin duda tiene el aliciente de presentar un modelo nuevo más humano y cercano; pero la pregunta es ¿es posible el comunitarismo en sanidad?.

Para responder a esta cuestión la premisa fundamental y más difícil es tratar de desprenderse de los moldes que sostienen en nuestra mente la sanidad "industrial" en cuanto a la supuesta "jerarquía" entre el conocimiento de diversas disciplinas.

A mi leyendo esa entrada me vinieron a la mente lo que dice Salva Casado, reafrimado por @Sentido_Komun , sobre que cada cama de cada hogar será el lugar de hospitalización posibilitado por uno de los factores que señalan en el artículo: la tecnología. Pero justamente esa tecnología y la inversión que requiere el hardware me hace pensar que aún está algo distante pues ahí el mencionado concepto de "abundancia" aún parece distante.

Pese a ello ya abundan los desarrollos teóricos y los pilotajes al respecto; como ejemplo os pongo esta presentación de Alfredo Alday.



En cuanto a los productos farmaceúticos es posible que en un futuro si se den las condiciones de "acercar" la producción de los mismos e incluso de investigar nuevos fármacos en comunitarismo. Hablamos claro, de los productos efectivos de uso común y no de las últimas novedades del mercado (muchas de ellas que no aportan efectividad) y del desarrollo de nuevas moléculas o de nuevos usos en entornos de simulación.

Es probable que en un futuro la tendencia al desplazamiento de equipos tecnológicos sea más común (actualmente ya hay camiones con RMN o mamógrafos desplazandose por el territorio) y no se limite a las técnicas diagnósticas sino que abarque algunos campos terapeúticos como la cirugía. En todo caso los centros de asistencia tal y como los entendemos ahora verán disminuir su dimensión disponiendose como espacios para esos recursos "pivotantes".

En cuanto al papel de los cuidados en una sanidad comunitarista no me cabe duda de que se corresponderá con sus capacidades para responder a las necesidades humanas en cercanía y a su voluntad de coordinarse con los profesionales de otros campos de conocimiento para proporcionar una atención eficaz.

En el comunitarismo el planteamiento de la sanidad se centra más en la conservación de la salud y la prevención de la enfermedad por lo tanto serán los dispositivos de cercanía a las comunidades los que predominen y la movilidad de los profesionales y no de los ciudadanos será uno de los giros a realizar según mi visión.

Ya he señalado alguna vez que en cierto modo el marco legislativo que permitiría una sanidad comunitarista existe pero por ahora el gran asegurdor público no lo contempla pues sigue centrado en "producir" soluciones y no en evitar problemas.

Es posible que a estas alturas ya os percatáseis que la pregunta que titula la entrada está mal planteada y que debería de ser ¿hasta qué punto una sanidad comunitarista puede dar servicio a una población? la respuesta está en el futuro... y en nosotr@s mism@s.

Venecian@s en escenario secundario


Esta es una entrada de opinión lo que quiere decir que no es que el lector pueda discrepar; es que debe, aunque no sé bien de que va a discrepar conmigo porque yo no tengo una opinión ciertamente formada sino un mar de dudas surgidas de mis vivencias.

Vengo observando con cierta tristeza la aparente desidia de una amplia mayoría de l@s profesionales de enfermería, en ocasiones mi tristeza me lleva a cierta agresividad icónica pero nada más lejos de mi intención que ofender a la gente que se centra en los problemas de la vida cotidiana.

También observo cómo un puñado de personas con y sin responsabilidad en gestión clínica, en la académia o en política se autoerigen en voz de esa mayoría pasiva y se embarcan en trifulcas que pronto están fuera de las aguas del conflicto de las ideas o los principios y van surcando las ruidosas pero inútiles turbulencias del bullicio mediático cuando no judicial.

Un grupo de personas que, en global, no llega (llegamos pues puede que alguien me considere incluido) al 5% del censo de la profesión en el que existen corrientes que pretenden actuar como aquella forma de gobierno con la que se dotó la Serenissima Repubblica di San Marco en la que las familias aristocráticas pugnaban por el poder en un intrincado sistema electoral "por el bien del pueblo".

Nuestros "venecianos" ostentan toda clase de características desde titulaciones académicas más o menos ostentosas, tesis doctorales de corta y pega, posiciones numantinas en partidos políticos o  visibilidad humorística o mediática pero nada de ello les (nos) libra a su pesar de ser sólo un grupúsculo, una minoría y no; no son "cualificados", no por lo menos porque ell@s mismos se autoproclamen.

Este teatrillo de ambiciones y pretensiones ocurre en un escenario secundario; compuesto por una profesión en la que si bien la vocación de  servicio parece contar mucho lo cierto es que una mayoría se enroló en ella como "mejor opción" o como "segunda opción". Una profesión que en la mayoría de los núcleos familiares donde hay enfermer@s implicadas esta es un "segundo sueldo" destinado a permitir holgura en lo cotidiano y que permite evitar conflictos en casa a la hora de gastar un poco en una opción personal. Una profesión que en una gran mayoría de los casos es ejercida por personas que tras terminar sus agotadores turnos laborales debe mantener la valoración, planificación, ejecución y evaluación de TODO en un hogar o al cargo de unos hijos o mayores dependientes... en la que NUNCA HAY RELEVO... en los cuidados.

Así pues, es comprensible que esa gran mayoría no se entere, no quiera enterarse, no se moleste en tomar acciones realmente efectivas para mejorar esa profesión... más allá de un like o un RT (y ni eso)... ¿asistir a una junta general del colegio provincial? como dijo la otra compañera que asistió conmigo el pasado día 30 de junio: Si hubiera alguna situación importante si se asistiría, si no se asiste se entiende que se está haciendo bien.

Para mi la principal demostración de esto es la contínua y contumaz confusión de la defensa de los derechos laborales y la esfera de los problemas profesionales continuamente sometidos al mercadeo de un grupo de representantes que tampoco se caracterizan por su transparencia a la hora de rendir explicaciones o de democracia en la toma de posiciones.

De la junta general, no me quejo; se me ha entregado la información por escrito, se me han respondido las aclaraciones que solicité, se ha tomado nota de mis sugerencias... no es lo óptimo pero hay posibilides de mejorar.

Me gustaría ver plasmados los principios básicos que queremos para el buen gobierno de la profesión y hacer bandera de su puesta en marcha efectiva más que señalar a un individuo o un grupo de individuos.
  • Democracia con niveles mínimos de participación necesarios para cambios estutarios y elección de cargos. Limitación de permanencia en cargos 10 años consecutivos 14 alternos.
  • Transparencia: cualquier colegiado podrá obtener actas, informes y liquidaciones de presupuestos en un plazo de 15 días.
  • Postulación de una estructura de formación y prestación del servicio profesional dentro del SNS que permita a cada quien avanzar no únicament en virtud de su antiguedad sino de su formación y capacidad.
  • Orientación científica sin adscripción política.
  • Establecimiento de colaboración con usuarios y comunidad y diálogo con otras profesiones sanitarias con orientación a un SNS equitativo, eficaz y seguro.


¿Qual cosa dice?


ARS; el 3D de la investigación

Varias veces hemos escrito en este blog de Análisis de redes sociales (2013 y 2010) principalmente porque tengo la suerte de contar aquí cerca con una referente nacional sobre el tema y pionera de su aplicación en el campo de investigación en la "gestión de personas" en sanidad: La Dra. Pilar Marqués.

Desde 2011 la Dra. Marqués y un numeroso equipo de colaboradores viene organizando de forma bianual un "Summer course" sobre esta metodología.

La edición de 2017 ha sido muy especial por muchos motivos tras una edición de ausencia la conjunción astral funcionó y he podido asistir a una buena parte del programa académico. Por otra parte el curso se desplazó, y nunca mejor dicho, a dos recintos diferentes de los usados hasa ahora; por una parte al Museo de la radio de Ponferrada y por otra al Teatro Villafranquino en Villafranca del bierzo con un interesante añadido: la realización de una etapa del camino de santiago.

Todo ello aderezado con la cercanía del equipo organizador y el profesorado participante y con otra peculariedad muy interesante; los trabajos que aportaban los alumnos más que ser exposiciones cerradas constituían "consultas abiertas" a los expertos asistentes que brindaban, en directo, un asesoramiento del que el resto de alumnos nos beneficiamos a la hora de trasladarlo a nuestros proyectos o futuros proyectos.

Desde mi modesto punto de vista el ARS constituye una metodología necesaria para dotar a la investigación en seguridad y en salud pública de una "visión 3D" imprescindible a la hora de comprender los procesos que suceden "detrás" de lo que vemos en los datos. Trataré de aclararlo con un ejemplo respecto a la higien de manos. Voy a obviar la parte de introducción sobre la necesidad de investigar sobre el tema.

Sabemos que en higiene de manos se miden algunos indicadores cuantitativos indirectos e incluso se empieza a hablar de algún indicador de resultados directo para el primer grupo está la adherencia según los estudios de observación o el indicador de litros de SHA/1000 estancias, para el segundo el seguimiento de los casos de SAMR u otros gérmenes multiresistentes. También se ha hecho investigación cualitativa y sabemos que las cuestiones de actitud, trasmisión de conocimiento y el segumiento del ejemplo de los líderes tiene su repercusión en este campo, pero ¿cómo localizar a los líderes que pueden hacer de ejemplo?, ¿cómo saber dónde y cuando es el mejor momento para trasmitir el conocimiento, la información, la llamada a la acción?. A eso nos puede ayudar el ARS.

Así pues la visión "binocular" de un estudio mixto que mida los indicadores cuantitativos clásicos y trate de conocer las actitudes del equipo respecto al tema de la higiene de manos necesitaría un ARS enfocado en localizar en las relaciones a los líderes y en los lugares de coincidencia los espacios y momentos para intervenir dotando así de un "guiado de profundidad" a la acción a desarrollar.

Mal mix mal resultado.

Hoy os traigo la traducción de la editorial publicada por Jack Needleman en BMJ Quality & Safety titulada "Nursing skill mix and patients outcomes" por varios motivos.

El primero es por el repaso que realiza al más reciente estudio del grupo de la Dra. Aiken sobre los equipos de enfermería en 6 paises europeos y su reprecusión en los resultados EN los pacientes.

El segundo es porque señala los déficits de este estudio lo que sin duda nos permitirá mejorarlos.

El tercero es porque el texto es breve pero desgrana en párrafos brillantes parte del problema de la invisibilidad de las formas más complejas de los cuidados.

En esta ocasión me he permitido varias licencias a la hora de hacer la traducción; la principal es que he traducido "Skill mix" no como "mix de habilidades" sino como "compuesto de habilidades" porque espero que con el tiempo se pueda llegar a una especie de 'indicador sintético' que caracterice la composición de una plantilla de cuidados; dicho indicador aglutinaría no sólo a técnicos y enfermeras sino que incluiria la labor de la práctica avanzada y las aportaciones de las enfermeras especialistas.

Tampoco respeto parte de la terminología empleada para designar las categorías profesionales en la editorial para tratar de adaptala a la que conocen los lectores españoles.
________________________________________________________________________________

EL COMPUESTO DE HABILIDADES ENFERMERAS Y LOS RESULTADOS EN LOS PACIENTES

Jack Needleman

En los hospitales las plantillas de enfermería suponen por lo general el mayor elemento a nivel de gasto y es frecuente que la enfermería sea tratada como un coste en vez de como una línea central del servicio. Los esfuerzos por contener los costes hospitalarios a menudo implican recortar cuidados de enfermería, reducir el número de enfermeras o sustituir a las enfermeras graduadas por personal auxiliar o no profesional.

La evidencia sustancial de estudios en EEUU, Europa y otros países del mundo relaciona la disminución de plantillas y las mayores cargas de trabajo de enfermería con resultados adversos para los pacientes como mortalidad, infecciones, caídas y estancias prolongadas. La prolongación de estancias que incrementan los costes del hospital pueden dar lugar a eventos adversos prolongando ingresos o retrasos en los cuidados debido a que son incapaces de realizar su trabajo o de preparar al paciente para el alta.(1-13)

Las consecuencias de confiar en personal con peor nivel educativo que las enfermeras graduadas universitarias empleando un compuesto de habilidades (skill mix) menor siguen sin estar bien estudiadas. Los estudios de EEUU y Canadá enfocados por lo general en el mix de enfermeras graduadas (registered nurses) y personal auxiliar (licensed práctical nurses) han demostrado de forma consistente que un compuesto de habilidades menor está asociado con mayores ratios de resultados adversos y estancias prolongadas.(7) (14-17).

El equipo de la Dra. Aiken (18) estudió la asociación entre el compuesto de habilidades con mortalidad, satisfacción de los pacientes con el hospital, frecuencia de notificación por las enfermeras de resultados adversos para los pacientes y falta de satisfacción laboral y burnout de las enfermeras usando datos de hospitales de 6 países europeos. Encontraron una variación sustancial entre unidades medico-quirúrgicas en las proporciones de profesionales de enfermería en atención directa (que incluía enfermeras graduadas, auxiliares, asistentes y otras categorías laborales que varían entre los 6 países del estudio) y que estas variaciones en el compuesto de habilidades se asociaba con la mortalidad de los pacientes, su percepción sobre los cuidados y el juicio de las enfermeras sobre la calidad y la frecuencia de los resultados adversos.

Una fortaleza de ese estudio es la variedad de medidas y fuentes de datos utilizadas. Incluye la mortalidad a 30 días de los pacientes ingresados según datos de cmbd, la calificación de los hospitales según las encuestas a usuarios y tres conjuntos de medidas derivadas de encuestas a enfermeras: la percepción de la calidad de las unidades y hospitales, la estimación de frecuencia de eventos adversos y la satisfacción laboral.

Los autores encontraron que tanto pacientes como enfermeras informaron problemas de calidad de forma significativa. Más de la mitad de los pacientes encuestados calificaron los hospitales por debajo de excelente. El promedio de enfermeras que calificaron la calidad de su unidad como normal o pobre fue del 22%, y un 18% no recomendaría su hospital a familiares o amigos. Las enfermeras que valoran que se producen eventos adversos varias veces al mes o con más frecuencia variaba del 9% para úlceras por presión al 23% para infección del tracto urinario. Las tasas de burnout e insatisfacción laboral fueron altas.

En un análisis segmentado por país y por un conjunto de características relevantes de los pacientes y hospitales, un compuesto de habilidades más rico se asoció con menores probabilidades en sus propios datos de riesgo de muerte, baja valoración del hospital por los pacientes y grados bajos de seguridad entre otros resultados no deseables. El OddsRatio para los cambios en estas medidas asociados con la mejora del compuesto de habilidades un 10% osciló entre 0.80 y 0.93. Debido a que muchas de las medidas utilizadas por los autores provienen de la encuesta realizadas a las enfermeras, se podría argumentar que es de esperar que la respuestas a la encuesta se correlacionaran con su actitud general respecto a la calidad del cuidado influyendo en sus respuestas individuales. Sin embargo, la similitud en los resultados de los análisis de las medidas derivadas de las enfermeras, la calificación de la calidad por parte de los pacientes y la mortalidad confiere fortaleza a la conclusión de que existe una asociación consistente entre el compuesto de habilidades y la calidad del cuidado.

Los autores señalan importantes limitaciones en los datos y los métodos. A estas, podría añadir que confiar en las enfermeras encuestadas para establecer el censo global y el ratio de enfermeras graduadas respecto a otros profesionales de la plantilla es impreciso. Se optó porque las enfermeras graduadas informaran sobre la plantilla y el censo de pacientes debido a las limitaciones de los datos oficiales para estimar las plantillas.(19). Se trata de una extensión del método empleado en los estudios desarrollados en EEUU, en los que se le había preguntado a las enfermeras por la carga de trabajo de su último turno.(1). Pero confiar en que las enfermeras encuestadas fueran conscientes e informaran su propia carga de trabajo, el censo total de la unidad y que contaran a las enfermeras graduadas y al resto de la plantilla tenía una imprecisión inherente. El censo de pacientes en un turno puede cambiar con los ingresos, las altas y los traslados a otras unidades y las enfermeras acuden o marchan de las unidades en respuesta a las necesidades de plantilla en cualquier lugar del hospital. Más allá de esto, el dato se basa en que la enfermera encuestada esté informada no sólo sobre su carga de trabajo sino también sobre el total del personal presente y del censo de la unidad. No se describen métodos para asegurar la fiabilidad de las cantidades informadas de modo que no se relacionasen directamente con la carga de trabajo. Estaría justificada una evaluación de la precisión de esta medida.

Una limitación que las autoras señalan pero que quiero enfatizar es la variedad entre países en la formación y cualificación de la plantilla de la las unidades que presta cuidados directos además de las enfermeras graduadas. El rango de educación y entrenamiento entre el personal de enfermería no universitario miembros de las plantillas está menos estandarizado que el de las enfermeras graduadas. Los autores buscaron controlar esa variación con la inclusión de un estadístico de efectos fijos a nivel de país, pero esto también afectará a variaciones no apreciadas en la atención hospitalaria además de la cualificación de la plantilla que no sea enfermera universitaria. El análisis estratificado por país aunque podría sufrir por baja potencia para algunos países puede proporcionar información sobre si la relación entre el compuesto de habilidades y los resultados es consistente entre países o si las diferencias en la cualificación de las plantillas y su entrenamiento u organización del trabajo entre países resulta en diferentes magnitudes para la asociación entre el compuesto de habilidades y los resultados.

A pesar de estas limitaciones, este es un estudio sólido. Añade una importante perspectiva transnacional a los estudios de EEUU sobre el compuesto de habilidades. Confirma los principales hallazgos de los trabajos previos sobre que las plantillas basadas en enfermeras no universitarias para la realización de una importante parte del trabajo de atención directa puede poner en riesgo a los pacientes respecto a un amplio rango de resultados adversos. Extiende el trabajo previo en su hallazgo de la limitación de los registros de cuidados a los pacientes y su influencia en la calificación de los hospitales.

Con la sustitución de las enfermeras graduadas por personal menos formado la intención de los hospitales, las aseguradoras y los gestores políticos es reducir costes laborales. Como observan Aiken y cols. Las plantillas de enfermería en los hospitales son frecuentemente el objetivo de las reducciones presupuestarias, y los gestores políticos sugieren la introducción de sustitutos menos formados y con menores habilidades como "asociados" (nursing associates).

Los costes sociales de estas decisiones pueden ser altos, como el exceso de mortalidad demostraría, pero estos costes no son pagados por el hospital. Lo que si paga el hospital tanto dependa de un presupuesto general como de facturar por ingreso son los costes asociados con estancias más largas, las complicaciones y los cuidados paliativos asociados con el incremento de mortalidad , los costes de eventos adversos como las úlceras por presión, las caídas con daño y las infecciones urinarias asociadas en este estudio con un bajo compuesto de habilidades (también asociados en otros estudios), y el coste para el hospital de las bajas laborales de las enfermeras debido al burnout y la insatisfacción laboral. Una cuestión crítica para los gestores hospitalarios es si el coste de los eventos adversos y las bajas excede al ahorro de costes laborales conseguido empleando plantillas menos preparadas o con un menor compuesto de habilidades.

Esta pregunta no puede ser respondida directamente por este estudio. El cambio en el número o en el ratio de los eventos adversos (excepto la mortalidad) no puede ser estimado debido a que se basa en la valoración de las enfermeras en vez de en medidas directas de la frecuencia de los eventos adversos y la dicotomización de estas medidas. Sin estas cifras, los ahorros asociados a la reducción de eventos adversos no pueden ser calculados.

El análisis de casos de negocio del coste adicional de tener enfermeras mejor preparadas y los ahorros derivados de estancias más cortas y menores tasas de eventos adversos se ha realizado en base a los estudios de EEUU. En un artículo publicado en 2006 en Health affairs usamos una aproximación de microsimulación para emular el efecto de cambiar el compuesto de habilidades sobre los cambios en las estancias y los ratios de fallo de rescate y otros 4 eventos adversos (20). Se estimó el coste de mejorar el compuesto de habilidades de las enfermeras y los ahorros de costes por estancias más cortas y reducción de EAs. Un estudio publicado en Medical care en 2014 realizó una regresión directa de los costes por ingreso sobre un robusto ajuste del riesgo del paciente, la plantilla del hospital y su compuesto de habilidades (21). Ambos estudios encontraron que un compuesto de habilidades con una mayor proporción de enfermeras graduadas resultaban rentables para los hospitales gracias a los ahorros debidos a los menores eventos adversos y las estancias más cortas. El artículo de Health affairs también encontró que la duración de la estancia es más sensible a los niveles de plantilla que al compuesto de habilidades, puede que fruto de los retrasos en la atención debidos a la falta de personal. Por contra, los eventos adversos como infecciones del tracto urinario y la neumonía hospitalaria muestran una mayor sensibilidad al compuesto de habilidades, reflejando posiblemente el papel de la formación y el entrenamiento en la detección y prevención de las complicaciones en los pacientes hospitalizados.

Los resultados del equipo de la Dra. Aiken sugieren de forma contundente que las conclusiones de los estudios en EEUU son aplicables a los hospitales europeos (a mayor compuesto de habilidades menores costes hospitalarios). Entonces ¿porqué persiste el interés en sustituir enfermeras graduadas por personal con menos habilidades?.

El sistema de pago es un factor en algunos países. En aquellos en los que los hospitales cobran en base a facturación por costes diarios la prolongación de estancias debida a cuidados retrasados o EAs incrementan los ingresos. Con esos sistemas de pago hay un incentivo para minimizar los costes de prestación del servicio no los costes de cuidados evitables u omitidos. Pero el pago por caso o por presupuesto debería estimular la toma en consideración de los costes totales de atención, incluida la compensación de los costes asociados a un mayor gasto en plantillas mejor preparadas.

Otra razón para que persista el interés en introducir profesionales menos formados es que no se comprende el trabajo de las enfermeras. La mayor parte del trabajo de las enfermeras graduadas está orientado a tareas (prestar la atención indicada, tomar las constantes vitales, ayudar al paciente a comer, caminar, ir al baño y así sucesivamente) como resultado parecerá plausible a los gestores, financiadores y políticos que personal menos entrenado y por ende menos costoso puede sustituir a las enfermeras graduadas en ese trabajo. Si bien esas tareas a pie de cama constituyen parte importante del trabajo de las enfermeras representan una visión incompleta del mismo.

La enfermería es un trabajo complejo y exigente desde el punto de vista cognitivo y de gestión. Mientras realizan esas tareas visibles, las enfermeras graduadas están monitorizando y evaluando a sus pacientes, determinando si tienen riesgo de caída, úlcera por presión u otras complicaciones y si están evolucionando como es de esperar o presentan complicaciones. Basadas en estas evaluaciones es de esperar que las enfermeras graduadas inicien las intervenciones enfermeras apropiadas o llamen para informar y consultar. La enfermeras graduadas vigilan el dolor y emprenden acciones para su control. Proporcionan educación al paciente y su familia preparándolos para el autocuidado tras el alta y proporcionándoles apoyo psicológico a aquellos que padecen enfermedades graves. Las enfermeras graduadas juegan un papel crítico en el equipo de atención, respaldando a médicos y farmacéuticos al asegurar que los tratamientos y otras indicaciones están bien prescritas y administradas sirviendo a menudo como coordinadores principales de la atención y como abogados de sus pacientes. Y estas actividades son desarrolladas para cada paciente por enfermeras que están al cargo de cuatro, cinco, seis o más pacientes al mismo tiempo, una situación que impone importantes requerimientos de gestión en priorización a pie de cama.(22).

Una visión completa del trabajo de las enfermeras graduadas ha sido el tema de numerosos artículos (23-25) pero no es completamente apreciado por quienes están fuera de la profesión. Las actividades más complejas, las cognitivas y las de gestión realizadas por las enfermeras a menudo pasan desapercibidas por ser realizadas simultáneamente con la parte del trabajo orientado a tareas y no son apreciadas. Estudios sobre la asociación del compuesto de habilidades como el del equipo de la Dra. Aiken y estudios anteriores sobre el tema o sobre cargas de trabajo y resultados en los pacientes proporcionan evidencias importantes de que cuando las plantillas de enfermería no tiene tiempo o capacitación para realizar su trabajo; los cuidados y la seguridad del paciente están en riesgo. Que la opinión pública, los financiadores, los políticos y los gestores sanitarios reconozcan este hecho y actúen en base al mismo es crítico para asegurar la prestación segura y fiable de la asistencia sanitaria.

REFERENCIAS

1 Aiken LH, Clarke SP, Sloane DM, et al. Hospital nurse staffing and patient mortality, nurse burnout, and job dissatisfaction. JAMA 2002;288:1987–93.
2 Aiken LH, Sloane DM, Bruyneel L, et al. Nurse staffing and education and hospital mortality in nine European countries: a retrospective observational study. Lancet 2014;383:1824–30.
3 Cho E, Sloane DM, Kim EY, et al. Effects of nurse staffing,
work environments, and education on patient mortality: an observational study. Int J Nurs Stud 2015;52:535–42.
4 Griffiths P. Staffing levels and patient outcomes. Nurs Manag (Harrow) 2009;16:22–3.
5 Kane RL, Shamliyan TA, Mueller C, et al. The association of registered nurse staffing levels and patient outcomes: systematic review and meta-analysis. Med Care 2007;45:1195–204.
6 Liang YW, Chen WY, Lee JL, et al. Nurse staffing, direct nursing care hours and patient mortality in Taiwan: the longitudinal analysis of hospital nurse staffing and patient outcome study. BMC Health Serv Res 2012;12:44.
7 Needleman J, Buerhaus P, Mattke S, et al. Nurse-staffing levels and the quality of care in hospitals. N Engl J Med 2002;346:1715–22.
8 Needleman J. Nurse staffing: the knowns and unknowns. Nurs Econ 2015;33:5–7.
9 Needleman J, Buerhaus P, Pankratz VS, et al. Nurse staffing and inpatient hospital mortality. N Engl J Med 2011;364:1037–45.
10 Shekelle PG. Nurse-patient ratios as a patient safety strategy: a systematic review. Ann Intern Med 2013;158(Pt 2):404–9.
11 Tourangeau AE, Doran DM, McGillis Hall L, et al. Impact of hospital nursing care on 30-day mortality for acute medical patients. J Adv Nurs 2007;57:32–44.
12 Twigg DE, Gelder L, Myers H. The impact of understaffed shifts on nurse-sensitive outcomes. J Adv Nurs 2015;71:1564–72
13 Zhu XW, You LM, Zheng J, et al. Nurse staffing levels make a difference on patient outcomes: a multisite study in Chinese hospitals. J Nurs Scholarsh 2012;44:266–73.
14 Blegen MA, Goode CJ, Spetz J, et al. Nurse staffing effects on patient outcomes: safety-net and non-safety-net hospitals. Med Care 2011;49:406–14.
15 Cho SH, Ketefian S, Barkauskas VH, et al. The effects of nurse staffing on adverse events, morbidity, mortality, and medical costs. Nurs Res 2003;52:71–9.
16 Estabrooks CA, Midodzi WK, Cummings GG, et al. The impact of hospital nursing characteristics on 30-day mortality. Nurs Res 2005;54:74–84.
17 Unruh L. Licensed nurse staffing and adverse events in hospitals. Med Care 2003;41:142–52.
18 Aiken LH, Sloan D, Griffiths P, et al. Nursing skill mix in European hospitals: association with mortality, patient ratings, and quality of care. BMJ Qual Saf 2016;[Epub ahead of print 15 Nov 2016]. doi:10.1136/bmjqs-2016-005567.
19 Sermeus W, Aiken LH, Van den Heede K, et al. Nurse forecasting in Europe (RN4CAST): rationale, design and methodology. BMC Nurs 2011;10:6.
20 Needleman J, Buerhaus PI, Stewart M, et al. Nurse staffing in hospitals: is there a business case for quality? Health Aff (Millwood) 2006;25:204–11.
21 Martsolf GR, Auerbach D, Benevent R, et al. Examining the value of inpatient nurse staffing: an assessment of quality and patient care costs. Med Care 2014;52:982–8.
22 Ebright PR, Patterson ES, Chalko BA, et al. Understanding the complexity of registered nurse work in acute care settings. J Nurs Adm 2003;33:630–8.
23 Kitson A, Conroy T, Wengstrom Y, et al. Defining the fundamentals of care. Int J Nurs Pract 2010;16:423–34.
24 Kitson AL, Muntlin Athlin A, Conroy T. Anything but basic: nursing’s challenge in meeting patients’ fundamental care needs. J Nurs Scholarsh 2014;46:331–9.
25 Needleman J. The economic case for fundamental nursing care. Nurs Leadersh (Tor Ont) 2016;29:26–36.

Postdata: El título de la entrada es un recuerdo a aquellas cintas de música "Max-mix" con la nos torturaban en los veranos hace décadas...