Google+

Tela telita tela #IQZ


En Junio una compañera me preguntó sobre la evidencia disponible respecto al uso de gorros de tela en el área quirúrgica (y por extensión en otras áreas especiales).

Apremiado por la vida y sin otra intención que dar una respuesta con algo de fundamento realicé una pequeña y restringida búsqueda que me brindó la ocasión de diseccionar los diversos aspectos de la cuestión como:

*De existir algún riesgo o problema no se limitaría al uso de gorros quirúrgicos sino a otras prendas como chaquetas y objetos como mochilas que el personal quirúrgico acarrea a diario.
*Aparejado al uso de este tipo de prendas está la frecuencia y características de su lavado.
*Es inegable que este es un factor que no se puede estudiar de forma aislada a la hora de vincularlo a los resultados en los usuarios.

Encontré alguna documentación algo vieja pero muy específica que cito abajo.

Pero lo más interesante lo encontré en la página de la AORN y se trata de una tabla que compendia 123 referencias sobre el tema de la vestimenta quirúrgica con toda clase de documentos desde estudios experimentales en laboratorio hasta guías de práctica clínica.

En todo caso no pude obtener una conclusión tajante sobre el tema, pero hoy me he decido a compartir un artículo publicado en Julio de este año que, además, toca también los aspectos de la prevención de infección de herida quirúrgica de un proyecto que parece hermano gemelo de #IQZ.

El artículo es Análisis multicentríco de las prácticas de control de infección identifica el subconjunto asociado con un mejor rendimiento respecto a la infección de herida quirúrgica.

Davis CH, Kao LS, Fleming JB, Aloia TA, Bass BL, Cali JR, et al. Multi-Institution Analysis of Infection Control Practices Identifies the Subset Associated with Best Surgical Site Infection Performance: A Texas Alliance for Surgical Quality Collaborative Project. Journal of the American College of Surgeons. 1 de octubre de 2017;225(4):455-64.

En un conjunto de hospitales de Texas afiliados en una alianza por la calidad quirúrgica se estudió la implementación de 38 medidas de control de infección agrupadas en 6 categorías (Vestimenta, Preparación, Intraoperatorio, Profilaxis antibiotica, Cuidados postquirúrgicos y otros) mediante una escala de 4 puntos y los ratios locales de infección. Estos datos se compararon con los ratios de riesgo del informe de 2016 del colegio americano de cirujanos. La adhrencia a las medidas se comparó con los 7 mejores centros y con los 7 peores.

Sobre la vestimenta quirúrgica el estudio puntuaba si cirujanos y anestesistas llevaban la ropa de quirófano fuera del hospital, si los cirujanos la llevaban a las unidades de hospitalización o urgencias, si cirujanos o anestesistas empleaban gorros personales (de tela) en quirófano, si los anestesistas usaban chaquetas personales en quirófano, si los cirujanos llevan bolsos o maletines sin cubrir al quirórfano, si los cirujanos llevaban calzas cubre zapatos en el quirófano o si el personal circulante se cubre los brazos.

En los resultados se refleja que los cirujanos llevan los uniformes de quirófano a las plantas (en 17 hospitales de 76% a 100%; en los otros 3 hospitales de 51% a 75%), que de 25% a 50% de los cirujanos y 51% a 75% del personal de anestesia que usa gorros de tela personales en quirófano, de 51% a 75% de los anestesistas usa chaqueta personal en quirófano, de 26% a 50% de los cirujanos lleva bolsos o maletines personales sin cubrir al quirófano, de 26% a 50% de los cirujanos usan calzas para cubrir sus zapatos, y que entre 51% y 75% del personal de quirófano que cubre sus antebrazos.
En todo caso ninguno de estos datos se relacionaron significativamente con uns mayor tasa de infección como refleja la tabla a continuación.


Ahh, por cierto; del análisis se desprende que las medidas relativas a la preparación de la piel antes de la cirugía, la higiene de la herida quirúrgica y la existencia de información transparente sobre el ratio de infección se correlacionan con el ratio de infección así que sería conveniente poner el foco en estos aspectos y dejar de perseguir al personal por sus gorros.

Otra bibliografía:

*DISPERSAL OF STAPHYLOCOCCUS AUREUS BY PATIENTS AND SURGICAL STAFF
D.W. Bethune. M.B. Durh
THE LANCET Volume 285, Issue 7383, 27 February 1965, Pages 480-483

*DESIGN OF OPERATING-ROOM DRESS FOR SURGEONS
Robert Blowers.
THE LANCET Volume 286, Issue 7414, 2 October 1965, Pages 681-683

*EFFECT OF CLOTHING ON DISPERSAL OF STAPHYLOCOCCUS AUREUS BY MALES AND FEMALES
Joyce Hill, Anthony Howell, Robert Blowers.
THE LANCET Volume 304, Issue 7889, 9 November 1974, Pages 1131-1133

*Patient draping and staff clothing in the operating theatre: a microbiological study.Bergman, B. R., Hoborn, J. & Nachemson, A. L. (1985). Scnad J. Infect Dis 17, 421-426

Sacando la integral del cuidado

X. M. Meijome CC BY-SA 4.0 https://creativecommons.org/licenses/by-nc-sa/4.0/
Siendo una integral básicamente "una generalización de la suma de infinitos sumandos, infinitamente pequeños." Podríamos buscar la integral de la función salud-enfermedad y veríamos como esos infinitos sumandos infinitamente pequeños componen el cuidado.
Siempre digo que lo mejor de las tecnologías está en la conversación y creo que no es posible "pintar" en un monologo (como esta entrada escrita por una sola persona) toda la riqueza de una buena conversación con múltiples voces y visiones, pero vale la pena intentarlo.

El pasado 23 de Agosto M. Tome Lopez (@visitadora) lanzó este tuit que recordaba uno de aquellos documentos de Estándares y Recomendaciones del ministerio de sanidad y consumo centrado en el la necesidad de tener normas para determinar las plantillas de las unidades de hospitalización polivalentes de agudos.
A partir de ahí se generó una enorme conversación con múltiples participantes que no enumero para no dejarme a nadie sin mencionar pero quiero destacar que aún estando en desacuerdo con los argumentos o las formas de algun@s me atrevo a decir que, salvo el que suscribe, ha pasado por ahí buena parte del acervo intelectual futuro de la enfermería española.

Como toda conversación multitudinaria y espontánea gozó de una enorme flexibilidad a costa de ser caótica por lo que derivó en múltiples hilos tocando varios temas.

El motivo inicial de la conversación era la necesidad de usar herramientas que permitieran ajustar las plantillas de enfermería (y su "compuesto de habilidades" añado) a las necesidades de los usuarios y que ese ajuste fuese lo más "normativo" posible pero también flexible y multidireccional.

Como no podía ser de otra forma salieron a relucir tanto las normativas y recomendaciones de EEUU (Pennsylvania, California...), UK y Portugal como las herramientas que podrían ayudar a materializarlas y los estudios que evidencian en esos entornos que esa forma de adecuar las plantillas ofrece mejores resultados tanto en salud a las personas como en rendimiento de los centros y del sistema de salud.

Entiendo que se tenga prisa; es perentorio detener la hemorragia de eventos adversos ligados al exceso de presión asistencial y la omisión de cuidados, pero las herramientas a adoptar han de tener en cuenta las características diferenciales del SNS y de la estructura de profesiones sanitarias que décadas de sinrazón y dejadez nos han traído.

Entiendo también que la saturación de proyectos "luminosos" en los que abunda la imagen fácil y escasea la higiene ética de los políticos ocurrentes indigne a quienes queremos tener recursos suficientes para cubrir las necesidades de los pacientes a nuestro cargo y me gustaría ver una solución real entre tanto destello.

Por otra parte y como era de esperar también surgió en la conversación la necesidad de "saber lo que hacemos" (las infinitas acciones infinitamente pequeñas -o no-) por ahí entramos en los registros de cuidados, los sistemas TIC de registro, las taxonomías (NNN y ATIC sobre todo), el RD de 2010 sobre CMBD y el informe de cuidados y llegamos a la necesaria modelización del cuidado partiendo de sus axiomas.
He dicho muchas veces que tenemos un problema de actitud si, pero también tenemos un problema con las herramientas tanto a pie de cama como a nivel de gestión e investigación (en #cuidadosybits tenéis más información) pero creo que tiene razón quien señala que:
Llevamos casi 20 años reinventando el Proyecto SIGNO, y durante esos 20 años, nos han estado entreteniendo con la excusa de “medir” y no actuar, no modificar esos ratios.
No conozco ninguna otra profesión, y mucho menos sanitaria, en la cual se definan hasta la saciedad las tareas que realiza y posteriormente se cronometre el tiempo dedicado a cada una de esas tareas para calcular las necesidades de plantilla. Si no fuera dramático y ridículo, podríamos decir que se trata de una estrategia brillante para “marear la perdiz”.
Se están recorriendo 17 caminos diferentes en parte por la propia estructura política del estado y los intereses particulares de personas eminentes y en parte porque desde el inicio de la implantación de las tecnologías se han recogido los vicios ancestrales del sistema y se han ido acumulando parche sobre parche sin una estrategia ni un plan más allá de la foto y el voto.

Yo mantengo mi esperanza en que la inteligencia colectiva y multiversatil nos ayudará a salir de esto pero hay que respirar profundo y no cejar en el empeño.

Tenemos algunas claves; para conocer las necesidades de los usuarios en cada entorno de trabajo podemos emplear algunas escalas; de esas valoraciones, de la propia situación clínica del paciente y de lo planificado por otros miembros del equipo de salud dependerán los objetivos a conseguir y las acciones a realizar. 

Así pues como si se tratase de un cálculo integral por aproximación tendríamos una medida "superior" de necesidades y una "inferior" de acciones para cubrirlas. Ambas deberían llevar al paciente a su mejor momento de salud posible.
De I, KSmrq, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=2359630
De I, KSmrq, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=2359630
El código en el que se escriban tanto valoraciones como acciones ha de ir evolucionando y adaptándose a la potencia de la tecnología existente lo importante sería que desde un principio el registro no fuese un fin en si sino una herramienta tanto para la atención al individuo como para la adecuación de los recursos a las necesidades a nivel de unidad, de centro, de área y de comunidad.




Nota: Es evidente que no soy matemático ni pretendo serlo, sirva esto para excusar las barbaridades inexactas cometidas en un campo de exactitud tan exquisita.

¿Y si lo hacemos al reves? Definamos lo básico


Una de las constantes en las últimas "tuitversaciones" sobre el ejercicio profesional tanto si hablamos de cuestiones clínicas como de distribución y organización de recursos que tanto los puestos de trabajo singularizados para la práctica avanzada como las especialidades están escasamente desarrollados.

Se atribuye a esta falta de "despliegue" de las capacidades de la profesión tanto peso en todas sus facetas que bien parece que no hay actividad profesional que pueda reconocerse si no es "especializada" o "avanzada".

Ya en este blog hemos comentado que en esa carrera hacia adelante de la especialización se ha caído en el error de imitar a otros con similares problemas de "roce" y también hemos mostrado que lo que llamamos "compuesto de habilidades" (skillmix) tiene un papel esencial en la aparición de eventos adversos.

Tras darle vueltas (en concreto 100 a la piscina de 25 metros) he caido en la cuenta de que lo que nadie hace es definir cual sería el puesto de trabajo básico, el cimiento de todo ese edificio de capacidades y, también hay que decirlo, títulos e ínfulas.

Creo que para acertar con tal definición la "prueba del algodón" sería:
¿Puede tal puesto ser ejercido por un profesional recién titulado sin un incremento significativo del riesgo de eventos adversos (ligados al cuidado) y con seguridad física y mental para el propio profesional?
Hagan sus propuestas y ampliaremos esta entrada con el debate.

Cuando surge la tecnología cambia la evidencia

Hace 6 años para ilustrar la necesidad de usar estudios que no son ensayos clínicos aleatorizados (ECA) a la hora de generar evidencia científica citabamos un artículo-broma de 2003 que traducimos como "Uso del paracaídas para prevenir la muerte y el traumatismo mayor relacionado con exposición gravitacional". El artículo simulaba la realización de una revisión sistemática sobre el tema que se quedaba "en blanco" porque no se encontraron ECAs sobre el tema e invitaba a los defensores acérrimos de este tipo de estudios a ser voluntarios en su realización.

Pues bien, aunque el propio artículo-broma hace referencia a un caso excepcional de supervivencia a una gran "exposición gravitacional" como justificación de la necesidad de hacer ECAs al respecto lo cierto es que les faltaba un comparador adecuado e voila¡ aquí lo tenemos:



Así que, una vez más una nueva tecnología y/o una nueva forma de usar elementos que ya se conocían provocan que aquello que parecía imposible de conseguir. Esto representa un reto tanto para los profesionales clínicos que quieren aprovechar estas oportunidades para sus pacientes como para los gestores que deben aquilatar la incorporación de estas alternativas.

Tanto unos como otros necesitan de forma perentoria estudios que les ayuden a decidir y a argumentar sus decisiones, pero necesitan aún más herramientas que les permitan evaluar la fiabilidad de esos estudios y es ahí donde veo la principal diferencia entre el SNS y el NHS.

¿Cuando resucitarán los 17 taifas y el califa a la agencia de calidad del SNS para coordinar los diversos pero dispersos esfuerzos que de manera tan dispar se realizan ahora?

Esperemos que pronto.

Bajándole los humos a "p"

https://twitter.com/emulenews
El pasado día 2 de Agosto Steven Novella (@stevennovella )‏ publicó en "science based medicine" "0.05 or 0.005? p-value wars continue" en el que repasaba la sugerencia realizada entre otros por John P.A. Ioannidis en una editorial publicada en PsyArXiv bajo el título "Redefine Statistical Significance"creo que su traducción puede resultar de interés para quienes se quieran adentrar en el mundo de la investigación al 100% al principio me permito una floritura creo que comprensible en nuestro medio.


_________________________________


A lo largo del tiempo la FIFA ha cambiado las dimensiones del campo de juego, específicamente las del área de penalti y la altura y anchura de la portería. Lo han hecho para equilibrar las oportunidades de delanteros y portero y hacer el juego más interesante para los espectadores.

Los científicos están debatiendo ajustes similares en la significación estadística, para equilibrar el balance entre falsos positivos y falsos negativos. Como en el caso de delanteros y portero, algunos cambios son un juego de suma cero si disminuyes los falsos positivos incrementas los falsos negativos y viceversa. Donde está el equilibrio perfecto es una cuestión complicada y un tema de debate creciente.

Un artículo reciente de una larga lista de autores, incluidos grandes popes como John P.A. Ioannidis sugieren que el valor de p que habitualmente se usa como umbral de significación estadística debe cambiar de 0.05 a 0.005 para los campos de biomedicina y psiquiatría. Escriben:
"Para los campos en los que el umbral para definir significación estadística de nuevos descubrimientos es p<0,05 proponemos un cambio a p<0,005. Este simple paso podría mejorar inmediatamente la reproducibilidad de la investigación científica en muchos campos. Los resultados que actualmente se llaman "significativos" pero no alcanzan este nuevo umbral podrían pasar a llamarse "sugerentes". Si bien los estadísticos ya sabían de la relativa debilidad de usar p≈0,05 como umbral y la propuesta de bajarlo a 0,005 no es nueva, ahora una masa crítica de investigadores apoya este cambio."
El p-valor se define como la probabilidad de que los resultados de un experimento se desvíen del nulo tanto como lo hicieron o más si la hipótesis nula es correcta. Si esto te parece difícil de entender no te sientas mal. Muchos científicos no pueden dar la definición técnica correcta. Para simplificarlo, ¿cual es la probabilidad de que obtuvieras esos resultados (o mayores) si tu hipótesis no es cierta? En ciencias de la salud generalmente esto se refiere a un efecto, como la diferencia en la reducción de dolor entre un placebo y un tratamiento experimental. ¿Es estadísticamente significativa? Un p-valor de 0,05, el umbral tradicional, significa que existe un 5% de posibilidad de que obtuvieras esos resultados sin que exista un efecto real. Un p-valor de 0,005 significa que hay un 0,5% de posibilidad; un cambio de 1/20 a 1/200.

Existen importantes problemas con la sobredependencia del p-valor. Nunca se pretendió que fuera una medida de si un efecto era o no real, pero desafortunadamente el deseo humano de simplificar le ha colocado en ese papel. Además, la gente tiende a virar su significado interpretando que es la probabilidad de que el efecto sea real (en lugar de que LOS DATOS dicen lo que dicen). Sin embargo, esta inversión del significado no es válida por muchos motivos. Un estudio con un p-valor  de 0,05 no significa que haya un 95% de probabilidad de que el efecto sea real. Podría haber aún sólo una pequeña probabilidad de que el efecto sea real, dependiendo de otros factores.

Otorgar demasiada importancia al p-valor conduce de forma demostrable al llamado p-hacking. Existen formas sutiles (y no tan sutiles a veces) en las que los investigadores pueden sesgar el resultado de un estudio para traspasar el umbral mágico de 0,05 declarando sus resultados significativos y consiguiendo que se publiquen (otro grave sesgo científico -nota del trad.-). Esto a su vez conduce a un problema de reproducibilidad de la investigación y a inundar la literatura científica con una masa de estudios dudosos.

Los autores señalan esencialmente que el equilibrio entre falsos positivos y falsos negativos se ha alejado del punto óptimo. A lo largo de los años los investigadores han descubierto como jugar con el p-valor. En combinación con la tremenda presión de publicar resultados positivos y los sesgos que todos tenemos esto ha llevado a un exceso de hallazgos preliminares que mayoritariamente son falsos positivos.

Lo que los autores proponen alejaría ciertamente el equilibrio de los falsos positivos. Es una solución sencilla, pero podría no ser óptima, o no suficiente por si misma. Aunque nos guste la sugerencia de considerar 0,005 como estadísticamente significativo, y lo que esté entre 0,05 y 0,005 como "sugerente". Esto está más cerca de la verdad, y probablemente ayudará a cambiar la forma en la que los científicos y el público piensan respecto a los p-valor. Yo mismo he hecho este cambio mental. No me emociono acerca de los resultados con un p-valor cercano a 0,05. Simplemente no significa mucho.

El lado oscuro, por supuesto, es que esto aumentará el número de falsos negativos. Dado lo sobrepasada que está la literatura con los estudios con falsos positivos, creo que es un buen cambio. Además, el umbral de p-valor no es la única variable. Los autores sugieren que se podría incrementar el tamaños de un estudio un 70% para mantener el ratio de falsos negativos donde está. Visto de esta forma no se trataría de un juego de suma zero. Puedes disminuir los falsos positivos y los falsos negativos aumentando el tamaño del estudio, o su fuerza.

Siendo esto cierto puede ser difícil para algunos investigadores, especialmente los que cuentan con pocos fondos, como los investigadores jóvenes (o los de disciplinas secundarias -N. de trad-). Para las enfermedades raras o cuestiones en las que es difícil enrolar a pacientes, aún disponiendo de fondos, puede ser duro alcanzar las cifras necesarias para conseguir p<0,005. Pero ¿y qué? pueden realizar su pequeño estudio y si consiguen p-valores marginales pueden incluso publicarlos. Sólo que en vez de llamar a sus resultados "significativos" han de llamarlos "sugerentes".

Podría haber consecuencias no deseadas de este cambio, pero en vista del grave problema con los estudios de falsos positivos defiendo que hagamos el cambio y veamos qué pasa. Podemos hacer ajustes posteriormente si es necesario.

Además, no quiero poner el foco en dónde situar el p-valor para distraer de la cuestión más profunda sobre la propia utilidad del p-valor en si. Algunas revistas han ido más allá prohibiendo completamente los p-valor en favor de otros métodos de análisis estadístico. Creo que es draconiano, pero tienen la idea correcta, poner al p-valor en su lugar.

Por ejemplo, el tamaño del efecto es extremadamente importante, pero a menudo descuidado. Más importante que el p-valor es alguna medida de la relación señal/ruido. ¿Cuál es el tamaño del efecto en comparación con lo que se está midiendo y la incertidumbre del resultado? Además, los análisis bayesianos pueden ser muy útiles. Un análisis bayesiano pregunta que realmente los investigadores piensan que hacen: ¿cual es la probabilidad de mi hipótesis dados estos datos? En un comentario en Nature sobre este tema sugieren que muchos investigadores no tienen habilidades estadísticas para hacer análisis bayesianos. Nuevamente digo ¿y qué? La respuesta es mejorar las habilidades estadísticas entre el investigador medio.

Este es, de hecho, el problema inherente. Muchos investigadores no comprenden las limitaciones del p-valor, o sucumben a la tentación de depender de esta medida porque es la vía rápida a la significación estadística y la publicación. También muchos no comprenden completamente la naturaleza del p-hacking y como evitarlo. Necesitamos más sofisticación en el mínimo análisis estadístico aceptable y la metodología de la investigación en salud.

Todo indica que el equilibrio ha cambiado de forma inaceptable hacia los falsos positivos. Probablemente necesitemos un cambio cultural completo en la comunidad de investigación en salud publicando menos estudios pero más rigurosos e indicando claramente cuales son estudios preliminares y eliminando el sesgo de publicación respecto a los estudios con resultados negativos.

Este cambio en el umbral para la significación estadística no será suficiente, pero creo que es un movimiento en la dirección correcta.

EDICIÓN 21/8/2017.

Lo grande de las RRSS es que si no es la interacción es simplemente tener buenas fuentes "sintonizadas" lo que te permite seguir mejorando. En este caso gracias a @emulenews viene muy a cuento el estudio "Estimating the evidential value of significant results in psychological science"en el que se calcula el factor bayesiano de nada menos que 287000 hallazgos científicos en psicología publicados en 35515 artículos. Las conclusiones son devastadoras:
Concluimos que debido a que el umbral de aceptación se ha establecido demasiado bajo para los hallazgos en psicología, una proporción sustancial de los resultados publicados tienen un soporte de evidencia débil.
Esto apoya la medida propuesta en la editorial de la que trata el artículo que traducimos recordando que la misma por si sola no bastará para mejorar la evidencia que sostiene o debería sostener nuestro trabajo.