Tres estudios, tres preguntas sobre la voz del paciente
Los tres artículos que trabajaremos en la sesión sincrónica examinan, desde ángulos distintos, un mismo problema: cómo integrar la perspectiva y las necesidades del paciente oncológico —y del paciente con enfermedad limitante de vida en general— en puntos críticos de su trayectoria clínica. Urgencias y herramientas digitales son dos puertas; los artículos ancla las atraviesan de formas complementarias.
Unidad3.3 Emergency care · 3.4 Digital toolsTiempo de lectura≈ 45 minutos en totalFormatoSíntesis crítica en español + enlaces al original
Cómo leer este documento
Léelo despacio · vuelve a los artículos originales
Estas síntesis son punto de partida, no sustituto del artículo. Cada una te ofrece contexto, diseño, resultados, interpretación de los autores, crítica metodológica, conexión con Colombia, y tres preguntas para que llegues a la sesión con la conversación ya comenzada. Los datos numéricos están tomados verbatim del texto original; si notas algo que no cuadra con el artículo fuente, avísame.
Dos de los tres artículos están en acceso abierto vía PubMed Central, así que tendrás los PDF directamente. El tercero requiere el acceso institucional de SINABI. Recomendación: abre al menos una vez cada PDF durante tu lectura para familiarizarte con la estructura IMRaD real de una publicación en JAMA o en Academic Emergency Medicine.
La tarea obligatoria por escrito no son estas lecturas en sí, sino las cinco preguntas disparadoras que recibirás por separado en Moodle. Estas lecturas son el insumo para responderlas.
Acceso abierto completo vía PubMed Central. Recomendación: abre el artículo en PMC y descarga el PDF oficial desde allí. El suplemento con el protocolo completo y el plan de análisis estadístico también está disponible en PMC.
El contexto y la pregunta que buscan responder
Los autores abren el artículo con una cifra que debería hacerte detenerte un momento: entre las personas de 65 años o más en Estados Unidos, la mitad visita un servicio de urgencias durante el último mes de vida, y tres cuartos lo hacen durante los seis meses previos a la muerte. El servicio de urgencias, por tanto, no es una excepción en la trayectoria del paciente con enfermedad avanzada; es un punto de contacto recurrente. Y sin embargo, la atención en urgencias no se ha adaptado a las necesidades y preferencias de estos pacientes, muchos de los cuales preferirían recibir cuidado en casa.
Otro dato contextual que conviene notar: los equipos de cuidados paliativos están presentes en más de dos tercios de los hospitales estadounidenses y en el 98% de los centros oncológicos designados por el National Cancer Institute. Pero la consulta a estos equipos suele estar disponible solo de lunes a viernes en horario laboral. Los pacientes que llegan a urgencias en crisis fuera de ese horario simplemente no acceden a cuidado paliativo especializado aunque lo necesiten.
¿Una intervención multicomponente que entrene al personal de urgencias en habilidades primarias de cuidados paliativos reduce la tasa de admisión hospitalaria en adultos mayores con enfermedad grave limitante de la vida?
El equipo de PRIM-ER (Primary Palliative Care for Emergency Medicine) llegó a esta pregunta después de haber demostrado previamente, en un estudio citado aquí con la referencia 24, que la consulta especializada de cuidados paliativos disparada desde urgencias mejoraba la calidad de vida a 12 semanas en pacientes con cáncer avanzado. La limitación de ese hallazgo previo era la dependencia de personal especialista en cuidados paliativos, que escasea en muchos lugares. La pregunta nueva de este ensayo es si los cuidados paliativos primarios —habilidades básicas que cualquier clínico puede aprender— pueden ser enseñados y desplegados por la fuerza laboral de urgencias.
Lo que hicieron · diseño del estudio
Ensayo clínico aleatorizado por clúster, con diseño por cuñas escalonadas (stepped-wedge)
Veintinueve servicios de urgencias de Estados Unidos participaron como clústeres. Cada servicio recibió la intervención en un momento distinto, asignado al azar, siguiendo la lógica del diseño stepped-wedge: al final del ensayo todos los clústeres han recibido la intervención, pero se compara el período antes versus después para cada uno. La aleatorización se hizo entre mayo 2019 y diciembre 2021, con una pausa de 6 meses entre marzo y septiembre de 2020 por la pandemia.
Concepto clave · diseño stepped-wedge
A diferencia del ECA paralelo clásico donde un grupo recibe la intervención y otro no, el diseño por cuñas escalonadas asigna el momento de cruce. Todos los clústeres terminan recibiendo la intervención, lo cual es éticamente más aceptable cuando se considera que la intervención podría beneficiar. Pero metodológicamente requiere controlar cuidadosamente las tendencias temporales, porque todo lo que cambie en el tiempo (nuevas guías clínicas, pandemia, rotación de personal) puede confundirse con el efecto de la intervención.
La intervención PRIM-ER tenía cuatro componentes activos:
Educación multidisciplinaria basada en evidencia sobre cuidados paliativos primarios.
Talleres con simulación sobre comunicación en enfermedad grave.
Apoyo a la decisión clínica integrado al flujo de trabajo.
Ciclos de auditoría y retroalimentación al personal clínico del servicio.
La población elegible fueron pacientes de 66 años o más con al menos 12 meses de enrolamiento previo en Medicare y un Gagne comorbidity score mayor a 6, que representa un riesgo de mortalidad a corto plazo superior al 30%. Se excluyó a pacientes de hogares geriátricos. El desenlace primario fue la admisión hospitalaria desde urgencias. Los desenlaces secundarios incluyeron uso subsecuente de atención en salud (unidad de cuidados intensivos, revisitas a urgencias, uso de hospicio, uso de atención domiciliaria, readmisión) y supervivencia a 6 meses.
Lo que encontraron · los resultados principales
64,4% → 61,3%
Tasa de admisión hospitalaria en el período pre-intervención versus post-intervención. Diferencia absoluta −3,1% (IC 95%: −3,7 a −2,5). Odds ratio ajustado 1,03 (IC 95%: 0,93 a 1,14) — NO estadísticamente significativo.
El ensayo incluyó 98.922 visitas iniciales a urgencias. La mediana de edad fue 77 años (RIC 71-84), 50% mujeres, 13% pacientes Black y 78% White, con Gagne comorbidity score mediano de 8. El hallazgo principal es claro: la intervención no redujo significativamente la admisión hospitalaria. Aunque la diferencia absoluta bruta parece mostrar una caída de 3 puntos porcentuales, una vez ajustado por las tendencias temporales del diseño stepped-wedge el odds ratio es 1,03 con intervalo de confianza que cruza 1.
Los desenlaces secundarios cuentan la misma historia. La admisión a unidad de cuidados intensivos bajó de 7,8% a 6,7% (OR ajustado 0,98). Las revisitas a urgencias bajaron de 34,2% a 32,2% (OR ajustado 1,00). El uso de hospicio pasó de 17,7% a 17,2% (OR ajustado 1,04). El uso de atención domiciliaria pasó de 42,0% a 38,1% (OR ajustado 1,01). La readmisión hospitalaria bajó de 41,0% a 36,6% (OR ajustado 1,01). La mortalidad pasó de 28,1% a 28,7% (OR ajustado 1,07). Ningún desenlace secundario mostró diferencia estadísticamente significativa atribuible a la intervención.
Concepto clave · ensayo negativo versus ensayo fallido
Un ensayo "negativo" es aquel cuyos resultados no muestran el efecto esperado, pero cuyo diseño, ejecución y análisis son metodológicamente sólidos. Un ensayo "fallido" es aquel cuyo diseño o ejecución impide responder la pregunta. PRIM-ER es claramente lo primero. Reclutó casi 99.000 visitas, mantuvo rigor estadístico, ajustó por las tendencias temporales del stepped-wedge, y reporta sus hallazgos sin maquillaje. Los ensayos negativos bien hechos cierran caminos que la comunidad científica ya no tiene que volver a recorrer, y son tan valiosos como los positivos.
Cómo los autores interpretan su propio hallazgo
Los autores proponen varias explicaciones posibles. Reconocen que la intervención consistía exclusivamente en educación y retroalimentación al personal, sin cambios estructurales en flujos de trabajo ni en disponibilidad de equipos de cuidados paliativos. Sugieren que la transformación cultural en servicios de urgencias de alta rotación requiere más que entrenamiento del personal; requiere cambios en la infraestructura de atención.
También destacan la heterogeneidad entre los 29 servicios: lo que podía funcionar en un centro académico con alta densidad de personal de cuidados paliativos disponible para interconsulta no necesariamente funcionaba en los demás. La pandemia, además, interrumpió la implementación durante seis meses críticos, lo que pudo haber diluido el efecto acumulativo de la intervención.
Un matiz interpretativo importante: los autores sugieren que el desenlace primario elegido —admisión hospitalaria— puede no haber sido el adecuado para capturar beneficios reales en calidad de cuidado. Un paciente con enfermedad grave correctamente admitido para control sintomático no es un "fracaso" del cuidado paliativo. Los desenlaces que los pacientes y familias valoran —concordancia con preferencias, control sintomático, lugar de muerte, satisfacción familiar— no fueron medidos en este estudio.
Lo que hay que leer con cuidado · crítica metodológica
Aspectos que conviene interrogar
Primero, la elección del desenlace primario. Admisión hospitalaria es un desenlace binario y operacionalmente claro, pero semánticamente problemático en cuidado paliativo. Si un paciente con enfermedad grave prefiere morir en hospital con control de síntomas porque el hogar no es un entorno seguro para esa fase final, la admisión no es un fracaso; es concordancia con preferencias. El ensayo carece de instrumentos para distinguir esos dos casos.
Segundo, la contaminación entre clústeres. Los 29 servicios participaban en consorcios académicos con intercambio habitual de personal, formación conjunta y rotación de residentes. Es plausible que el entrenamiento de la intervención se haya filtrado de forma difusa a los clústeres aún no intervenidos durante el período pre, atenuando la diferencia medida.
Tercero, la interrupción por pandemia. Una pausa de 6 meses en un ensayo cuyo mecanismo de efecto es el cambio cultural progresivo en servicios de urgencias probablemente deshace buena parte de la consolidación previa. Los autores lo reconocen pero no cuantifican el impacto.
Cuarto, los conflictos de interés declarados. Varios coautores reportan recibos personales de compañías farmacéuticas y honorarios de organizaciones profesionales. Ninguno es directamente proporcional al desenlace del ensayo, pero el ejercicio de leer la sección "Conflict of Interest Disclosures" es formativo en sí mismo para quienes aprenden a leer ensayos en JAMA.
Por qué este artículo importa para Colombia
Conexión con el SGSSS y con los vacíos de evidencia local
Colombia no tiene, al día de hoy, ni un solo ensayo clínico aleatorizado publicado sobre integración de cuidados paliativos en servicios de urgencias. Tampoco existe una descripción sistemática, con datos RIPS, de cuántos pacientes oncológicos colombianos visitan urgencias en el último trimestre de vida, cuántas de esas visitas son evitables, y cuántas terminan en muerte hospitalaria no concordante con las preferencias del paciente y su familia.
Replicar PRIM-ER en Colombia sería demasiado ambicioso como primer paso: requeriría financiamiento multicéntrico que no existe, infraestructura de monitoreo que tampoco, y una cohorte base que ni siquiera hemos caracterizado. Pero producir la descripción de base —una cohorte retrospectiva con datos RIPS y registros de aseguradoras en una red de hospitales de mediana complejidad del SGSSS— es una pregunta de investigación perfectamente viable en el horizonte de dos años de una maestría. Piensa en municipios PDET con IPS de segundo nivel, o en hospitales regionales de Boyacá, Nariño o Cauca como posibles escenarios de partida.
Preguntas para llevar a la sesión
Si el desenlace "admisión hospitalaria" no capturó lo que importaba en cuidado paliativo, ¿qué desenlace elegirías tú si diseñaras una réplica parcial de este estudio en un hospital colombiano de mediana complejidad? Justifica con al menos dos argumentos.
La intervención PRIM-ER fue solo educación y retroalimentación al personal. ¿Qué tres cambios estructurales agregarías para que el entrenamiento pudiera traducirse en cambio real de práctica en un servicio de urgencias del SGSSS?
¿Qué diferencias operacionales entre un servicio de urgencias colombiano de mediana complejidad y uno académico estadounidense harían más —o menos— probable que esta intervención produjera efecto aquí?
· · ·
02
Unit 3.4 · Digital tools
La voz del paciente como intervención
Basch E, Schrag D, Henson S, Jansen J, Ginos B, Stover AM, et al. (Alliance PRO-TECT · AFT-39).
Acceso abierto completo vía PubMed Central. Complementario recomendado: Basch E et al., JAMA 2017 (PMC5817466), que reporta el efecto sobre supervivencia global en la versión monocéntrica previa del mismo sistema de monitoreo.
El contexto y la pregunta que buscan responder
Los pacientes con cáncer en tratamiento experimentan síntomas frecuentes relacionados con la enfermedad y con las terapias: dolor, náusea, fatiga, disnea, tristeza, ansiedad. Los autores citan evidencia previa que muestra que estos síntomas con frecuencia no son detectados ni tratados oportunamente. El modelo tradicional de atención oncológica asume que el paciente reportará espontáneamente los síntomas en la próxima cita o llamará si algo empeora. Pero el paciente muchas veces no llama a tiempo, o el síntoma escala silenciosamente y termina en una visita a urgencias evitable o en una hospitalización que podría haberse prevenido.
Desde hace una década el grupo de Basch viene desarrollando sistemas de reporte electrónico de síntomas que permiten al paciente, no al clínico, registrar frecuencia, intensidad e interferencia con la vida diaria. El estudio monocéntrico original de 2017 mostró que este tipo de intervención prolongaba la supervivencia global cinco meses en pacientes con cáncer metastásico. Pero aquel primer estudio fue en un solo centro académico de altos recursos. Quedaba abierta la pregunta de validez externa.
En pacientes con cáncer metastásico recibiendo tratamiento sistémico en centros oncológicos comunitarios, ¿el monitoreo semanal electrónico de síntomas con alertas clínicas automatizadas mejora función física, control sintomático y calidad de vida a tres meses, comparado con atención usual?
El ensayo PRO-TECT es la versión multicéntrica con validez externa del hallazgo original. Fue diseñado como estudio con doble desenlace primario (función física a 3 meses + supervivencia global), pero en diciembre 2020, antes del análisis de datos, se modificó el protocolo para dejar solo supervivencia global como desenlace primario. La función física pasó a desenlace secundario clave. El artículo publicado en 2022 reporta los desenlaces secundarios; los datos de supervivencia aún no estaban disponibles al momento de la publicación.
Lo que hicieron · diseño del estudio
Ensayo clínico aleatorizado por clúster, multicéntrico
Cincuenta y dos prácticas oncológicas comunitarias en 25 estados de Estados Unidos, pertenecientes a la red nacional Alliance for Clinical Trials in Oncology. Aleatorizadas 1:1 a intervención ePRO versus atención usual, con estratificación por designación rural/urbana del US Census. Catorce de las 52 prácticas (26,9%) eran rurales, siete por grupo. Entre octubre 2017 y marzo 2020 se enrolaron 1.191 pacientes (la meta original era 1.200; la pandemia forzó a detener el reclutamiento con 99,3% de la meta alcanzada).
La intervención tenía varios componentes activos:
Encuesta semanal electrónica con ítems del PRO-CTCAE sobre nueve síntomas: dolor, náusea, vómito, estreñimiento, diarrea, disnea, insomnio, depresión, y capacidad de ingesta oral.
Incluía además estado funcional ECOG auto-reportado, caídas, y dificultades financieras.
Disponible en inglés, español y mandarín, vía internet o vía sistema telefónico automatizado.
Recordatorio automatizado si el paciente no completaba la encuesta en 24 horas; llamada de refuerzo del personal clínico si no completaba en 72 horas.
Alertas en tiempo real al equipo clínico cuando un síntoma alcanzaba nivel grave o empeoraba respecto al reporte previo.
Concepto clave · qué es PRO-CTCAE
El Patient-Reported Outcomes version of the Common Terminology Criteria for Adverse Events es un sistema desarrollado por el National Cancer Institute de Estados Unidos que permite al paciente reportar síntomas directamente, con sus propias palabras, usando escalas Likert validadas. Contiene ítems que miden frecuencia, intensidad e interferencia con la vida diaria. Su validez psicométrica ha sido documentada en múltiples cohortes internacionales. El ensayo de Basch usa un subconjunto de ítems PRO-CTCAE seleccionados por su prevalencia en cáncer avanzado.
Los desenlaces secundarios reportados en este artículo son función física, control sintomático y calidad de vida relacionada con la salud a los 3 meses, todos medidos con el cuestionario EORTC QLQ-C30 (escala 0-100 puntos; puntajes más altos indican mejor estado). Para función física, la diferencia mínima clínicamente importante establecida es de 2 a 7 puntos; para control sintomático y calidad de vida no hay MCID establecido formalmente.
Lo que encontraron · los resultados principales
+ 2,47 + 2,56 + 2,43
Diferencia media en puntos EORTC QLQ-C30 a los 3 meses, brazo intervención vs. control. Función física: +2,47 (IC 95%: 0,41-4,53; p=0,02). Control sintomático: +2,56 (IC 95%: 0,95-4,17; p=0,002). Calidad de vida: +2,43 (IC 95%: 0,90-3,96; p=0,002). Todas estadísticamente significativas.
La mediana de edad fue 63 años (rango 28-93), 58,3% mujeres, 79,5% pacientes White, 16,8% Black o African American en el brazo ePRO. Un dato importante del perfil poblacional: 39,4% de los participantes tenían educación secundaria o menor, y 16,9% tenían experiencia limitada con internet. A los 3 meses, el 97,3% permanecía en el estudio y el 97,1% de ellos había completado el QLQ-C30. La adherencia a la encuesta semanal fue notable: 63,7% la completaba vía internet y 36,3% vía teléfono automatizado.
Más allá del promedio, el análisis de respondedores muestra que los pacientes del grupo ePRO tuvieron odds significativamente mayores de experimentar beneficio clínicamente relevante (definido como cambio de 5 puntos o más): para función física OR 1,35 (IC 95%: 1,08-1,70; p=0,009); para control sintomático OR 1,50 (IC 95%: 1,15-1,95; p=0,003); para calidad de vida OR 1,41 (IC 95%: 1,10-1,81; p=0,006).
Matiz importante · cuán grande es "+2,5 puntos"
Una mejoría de 2,47 puntos en una escala 0-100 puede parecer modesta. Pero en función física la diferencia mínima clínicamente importante está establecida entre 2 y 7 puntos, por lo que el efecto observado cae dentro del umbral clínicamente relevante. Además, el análisis de respondedores muestra que los pacientes del grupo ePRO fueron significativamente más propensos a mejorar en 5 o más puntos y menos propensos a empeorar en 5 o más puntos. El efecto es modesto en puntos absolutos pero robusto en distribución.
Cómo los autores interpretan su propio hallazgo
Los autores son cuidadosos en llamar a sus hallazgos "provisionales" hasta que esté disponible el desenlace primario de supervivencia. Pero interpretan los resultados secundarios como consistentes con la hipótesis de trabajo del equipo: el monitoreo electrónico de síntomas funciona a través de dos mecanismos combinados. Por un lado, empodera al paciente: al reportar regularmente, el paciente se vuelve más consciente de sus síntomas y de su trayectoria, lo cual cambia su relación con la enfermedad y con el tratamiento. Por otro lado, reduce el retraso entre síntoma y atención: la alerta automática fuerza al equipo clínico a actuar temprano.
Un sistema ePRO sin alertas efectivas al clínico es un registro muerto. Un sistema con alertas pero sin engagement del paciente es un formulario ignorado. Los dos mecanismos, combinados, producen el efecto. Los autores sugieren que integrar el monitoreo electrónico de síntomas en el tratamiento oncológico rutinario puede mejorar desenlaces importantes para los pacientes, y que existen oportunidades de reembolso por parte de aseguradoras que podrían facilitar la implementación.
Lo que hay que leer con cuidado · crítica metodológica
Aspectos que conviene interrogar
Primero, los desenlaces reportados son secundarios. El protocolo original declaraba función física y supervivencia como co-primarios. El cambio de protocolo en diciembre 2020 —antes del análisis de datos, según declaran los autores— dejó solo supervivencia como primario. El artículo publicado es, por tanto, el reporte de desenlaces secundarios. Los propios autores advierten que las conclusiones deben interpretarse como "provisionales" hasta que supervivencia esté disponible. Esto no descalifica los hallazgos, pero sí modula cómo deben citarse.
Segundo, la población del estudio. 79,5% pacientes White, solo 2,4% hispanos en el brazo intervención. La validez externa a poblaciones rurales colombianas, a comunidades indígenas o afrocolombianas con distinta alfabetización digital, a contextos con brecha de conectividad estructural, es una pregunta completamente abierta.
Tercero, la caja negra del algoritmo de alertas. El artículo describe que las alertas se disparan cuando un síntoma alcanza umbral o empeora respecto al reporte previo, pero los umbrales específicos están en el material suplementario, no en el cuerpo del texto. Replicar el sistema exigiría acceso a esa información, más implementación técnica no trivial.
Cuarto, los conflictos de interés. Dr. Basch, el primer autor, reporta honorarios de varias compañías relacionadas con sistemas de ePRO y es propietario de Carolina Informatics. Los autores también declaran que Basch y Schrag son editores asociados de JAMA, aunque aclaran que no participaron en la decisión editorial sobre este artículo. El patrón es transparente pero merece ser notado. Un estudio sobre ePRO conducido por investigadores con intereses comerciales en ePRO no invalida sus resultados; sí obliga a leerlos con los ojos bien abiertos.
Por qué este artículo importa para Colombia
Conexión con el contexto colombiano
La intervención de Basch tiene evidencia robusta de efecto sobre calidad de vida e indicios previos de efecto sobre supervivencia. Pero la intervención asume tres cosas que en Colombia no son obvias: acceso del paciente a dispositivo digital propio, conectividad a internet estable, y capacidad operativa del equipo clínico para responder a alertas en horas, no en semanas. Las tres condiciones son estándar en el sistema de salud estadounidense que describe el artículo; ninguna lo es en zonas rurales colombianas.
Las preguntas de investigación colombiana que se abren aquí son múltiples y todas viables en horizonte de maestría: ¿cómo se adapta culturalmente PRO-CTCAE para población oncológica del piedemonte amazónico, del Pacífico chocoano, o del Catatumbo? ¿Qué modelo híbrido —digital combinado con promotor comunitario— podría funcionar en zonas con brecha digital? ¿Se mantiene el efecto sobre calidad de vida cuando el tiempo de respuesta del sistema es estructuralmente más lento? ¿Qué adaptaciones requiere el algoritmo de alertas para que funcione en IPS donde el oncólogo ve pacientes cada 21 días y no semanalmente? Una cohorte piloto de 30 pacientes en una IPS oncológica colombiana es un protocolo defendible desde MORECare.
Preguntas para llevar a la sesión
Si solo pudieras conservar uno de los dos mecanismos causales propuestos (empoderamiento del paciente por auto-reporte, alerta automatizada al clínico) porque el sistema de salud colombiano no puede financiar ambos, ¿cuál conservarías y qué argumentos darías?
¿Qué adaptaciones lingüísticas, tecnológicas y operativas requeriría PRO-CTCAE para usarse con pacientes oncológicos de una comunidad indígena Wayuu, o con pacientes afrocolombianos del Chocó? Menciona al menos tres adaptaciones específicas.
Si el efecto absoluto es pequeño (+2,5 puntos en EORTC QLQ-C30) pero clínicamente relevante, ¿cómo argumentarías ante una aseguradora del SGSSS que vale la pena financiar esta intervención? ¿Qué desenlace económico adicional necesitarías medir para fortalecer el caso?
· · ·
03
Revisión sistemática · Tamizaje en urgencias
Catorce instrumentos, una pregunta abierta
Kirkland SW, Yang EH, Garrido Clua M, Kruhlak M, Campbell S, Villa-Roel C, Rowe BH.
Este artículo es de acceso restringido en Wiley. Para acceder al PDF completo ingresa a través de SINABI — la biblioteca virtual de la UAN, base Wiley Online Library. Si tienes dificultad para acceder, contacta al docente: el PDF completo está disponible en el material de la asignatura. La síntesis a continuación se construyó sobre el texto completo del artículo.
El contexto y la pregunta que buscan responder
Con el aumento de visitas a urgencias de pacientes con enfermedad avanzada y de fin de vida, la iniciativa internacional Choosing Wisely ha recomendado desde 2013 la integración temprana de cuidados paliativos en urgencias. Pero identificar qué pacientes tienen necesidades paliativas no atendidas —y hacerlo en el ambiente caótico, con alta rotación y poco tiempo que caracteriza a un servicio de urgencias— es operacionalmente difícil. Múltiples instrumentos de tamizaje se han desarrollado con la intención de asistir al personal clínico en esta tarea, pero no hay consenso sobre cuál funciona mejor.
La revisión de Kirkland actualiza una revisión previa de 2016 (George et al.) que incluía apenas siete estudios. Desde entonces se ha publicado una cantidad sustancial de nueva evidencia que justifica una síntesis renovada.
¿Cuáles son los instrumentos de tamizaje disponibles para identificar pacientes adultos con necesidades paliativas no atendidas en urgencias, y cuáles son sus propiedades psicométricas?
Lo que hicieron · diseño de la revisión sistemática
Revisión sistemática con protocolo registrado en PROSPERO (CRD42018086178), siguiendo PRISMA
Búsqueda conducida por bibliotecaria experta en OVID Medline, OVID EMBASE, OVID Health and Psychosocial Instruments, EBSCO-CINAHL, Scopus, ProQuest Dissertations and Theses Global, Cochrane Library y PROSPERO. Búsquedas actualizadas hasta agosto 2021. Sin límites de idioma ni año. Búsqueda complementaria en literatura gris incluyendo Google Scholar, registros de ensayos clínicos, bibliografías de revisiones conocidas y resúmenes de congresos de medicina de urgencias. Cribado y extracción independiente por dos revisores con resolución de desacuerdos por consenso.
Criterios de inclusión: estudios que evaluaran un instrumento de tamizaje aplicado a pacientes adultos en servicios de urgencias para identificar necesidades paliativas no atendidas. No se exigía grupo control ni estándar de referencia ni reporte de propiedades psicométricas para ser incluido. Se excluyeron revisiones, editoriales y reportes de casos.
Evaluación de calidad metodológica con QUADAS y STARD para estudios que reportaban propiedades psicométricas; con Newcastle-Ottawa Scale para estudios observacionales que no las reportaban. Síntesis narrativa con medianas de medianas y rangos intercuartílicos. Sin meta-análisis formal debido a la heterogeneidad.
De 5.491 títulos únicos tamizados tras eliminar duplicados, 35 estudios fueron incluidos, que evaluaron 14 instrumentos distintos.
Lo que encontraron · los resultados principales
Tres instrumentos concentran la mayor parte de la evidencia empírica:
La Surprise Question (SQ) — 12 estudios. Una sola pregunta que el clínico se hace a sí mismo: "¿Me sorprendería si este paciente muriera en los próximos 12 meses?". Respuesta "no me sorprendería" = tamizaje positivo. Algunos estudios usan versión modificada a 30 días.
El P-CaRES (Palliative Care and Rapid Emergency Screening tool) — 8 estudios. Primero identifica condiciones limitantes de vida (demencia avanzada, enfermedad del SNC, cáncer, EPOC, enfermedad renal crónica, cirrosis, shock séptico en mayores de 65, o discreción del clínico por alta probabilidad de muerte acelerada). Si hay al menos una, evalúa factores de riesgo de necesidades no atendidas (visitas a urgencias u hospitalizaciones en los 6 meses previos, síntomas no controlados, deterioro funcional, incertidumbre sobre metas de cuidado, distrés del cuidador, respuesta positiva a SQ). Positivo si al menos una condición + dos o más factores de riesgo.
El SPEED (Screening for Palliative and End-of-life care needs in the Emergency Department) — 4 estudios. 13 ítems organizados en cinco dominios: físico, psicológico, social, espiritual, terapéutico. Existe versión corta de 5 ítems. Los estudios se centraron en pacientes con cáncer activo o falla cardíaca terminal.
De los 35 estudios, solo 12 reportaron propiedades psicométricas formales. De estos, 9 evaluaron la SQ, principalmente para predecir mortalidad. Los demás instrumentos están mucho menos caracterizados psicométricamente.
63% · 75% · 32% · 91%
Sensibilidad mediana (IQR 38-78%), especificidad mediana (IQR 57-84%), VPP mediano (IQR 16-40%), VPN mediano (IQR 88-95%) de la Surprise Question para predecir mortalidad a 1 o 12 meses, sobre 9 estudios.
Un hallazgo fino: la SQ funciona sustancialmente mejor como predictor a 12 meses que a 30 días. La sensibilidad a 30 días osciló entre 12% y 43%; a 12 meses entre 57% y 89%. La especificidad a 30 días fue entre 82% y 95%; a 12 meses entre 40% y 79%. Es decir: la pregunta "¿me sorprendería que este paciente muriera en los próximos 30 días?" tiene muy baja capacidad de identificar a los que efectivamente fallecerán en ese lapso. La versión original de 12 meses es la que tiene mejor desempeño.
Matiz importante · SQ en pacientes oncológicos
El estudio de Verhoef 2020 (Países Bajos, n=245, pacientes con cáncer en fase terminal) reportó para la SQ sensibilidad 89%, especificidad 40%, VPP 85% y VPN 50%. Son cifras sustancialmente distintas del promedio de la revisión. Una revisión sistemática independiente (Downar 2017, CMAJ) también documentó que la SQ funciona peor en pacientes con condiciones no oncológicas. Esto es directamente relevante para el caso de Carmen y para nuestra sesión: en pacientes oncológicos la SQ probablemente habría funcionado.
P-CaRES y SPEED: buena validez de contenido, propiedades psicométricas escasas
Aquí la evidencia requiere lectura cuidadosa. El P-CaRES y el SPEED tienen validez de contenido documentada en sus estudios de desarrollo (George 2015 para P-CaRES; Richards 2011 para SPEED). Pero la revisión encontró muy pocos estudios que reporten sus propiedades psicométricas formales cuando se aplican en urgencias.
El único estudio comparativo con P-CaRES es Howard 2021 (Estados Unidos, n=58 pacientes de 80 años o más), que comparó el desempeño cuando el instrumento lo aplicaban capellanes clínicos entrenados versus médicos de urgencias. Los datos reportados: VPP 34% (capellanes) versus 44% (médicos); VPN 76% (capellanes) versus 88% (médicos). Ningún estudio reportó sensibilidad ni especificidad formales del P-CaRES aplicado en urgencias. El SPEED, por su parte, tiene un estudio que reporta validez concurrente alta con el instrumento NEST (coeficiente alfa de Cronbach entre 0,716 y 0,991), pero ningún estudio reporta sensibilidad ni especificidad formales.
31% · 32% · 62%
Proporción mediana de pacientes identificados como con necesidades paliativas no atendidas usando SQ (IQR 15-49%), P-CaRES (IQR 30-55%) y SPEED (IQR 52-72%). La alta variabilidad refleja tanto heterogeneidad real de las poblaciones estudiadas como diferencias operacionales en cómo se aplicaron los instrumentos.
Un instrumento que merece mención por sus cifras llamativas es el A-qCPR (estudio único de Wang 2021, Taiwán, n=4627): sensibilidad 99% y VPN 99% para predecir mortalidad a 12 meses. Es el instrumento con mejor desempeño reportado en toda la revisión. La limitación es obvia: un solo estudio, un solo centro asiático, sin replicación independiente. El A-qCPR combina variables clínicas ya disponibles en la historia clínica (edad, qSOFA, cáncer, estado funcional, orden de no reanimación), lo cual podría facilitar su operacionalización pero también hace que el hallazgo dependa de la calidad y completitud de los registros fuente.
Qué pasa después del tamizaje positivo — el dato crítico
Este hallazgo merece subrayado porque es el que vuelve relevante todo el ejercicio de tamizaje. Entre pacientes identificados como con necesidades paliativas no atendidas, la proporción que efectivamente recibió consulta de cuidados paliativos fue baja:
Consulta basada en urgencias: entre 1,4% (Kirkland 2021) y 12% (Haydar 2019).
Consulta durante hospitalización: entre 8% (Minor 2013) y 55% (Glick 2018).
Consulta post-egreso: entre 5% (Verhoef 2020) y 29% (Kirkland 2021).
Solo los estudios que combinaron tamizaje con intervención activa de derivación lograron tasas del 32% al 47%.
La lección metodológica es contundente: tamizar sin dispositivo de derivación posterior es casi inútil. La identificación del paciente es necesaria pero insuficiente; sin el mecanismo operativo que traduce la identificación en atención efectiva, el esfuerzo se pierde.
Cómo los autores interpretan sus hallazgos
Los autores son deliberadamente cautelosos. Sostienen que no hay evidencia suficiente para recomendar un instrumento sobre los otros para implementación generalizada. Argumentan que, dado el costo y la disponibilidad limitada de servicios de cuidados paliativos en urgencias/hospital, los instrumentos de tamizaje aplicados a pacientes con condiciones limitantes de vida necesitan sensibilidad y especificidad del 90% o mayor para justificar su uso sistemático. Ninguno de los 14 instrumentos identificados alcanza consistentemente ese umbral.
Calculan, con una probabilidad pre-prueba del 30% (la proporción mediana de pacientes con necesidades no atendidas en las poblaciones estudiadas), que las razones de verosimilitud de la SQ son insuficientes para confirmar o descartar con certeza: un resultado positivo lleva la probabilidad post-prueba de 30% a 45%; un resultado negativo la lleva de 30% a 18%. Usar la SQ estrictamente resultaría en derivar un número grande de pacientes que no se beneficiarían del cuidado paliativo.
Los autores recomiendan investigación adicional para caracterizar el desempeño de P-CaRES y SPEED, y estudios de implementación pragmáticos —no solo de rendimiento diagnóstico— para saber si el tamizaje efectivamente mejora desenlaces para el paciente, no solo si identifica pacientes correctamente.
Lo que hay que leer con cuidado · crítica metodológica
Aspectos que conviene interrogar
Primero, la heterogeneidad del estándar de referencia. Los estudios incluidos usan definiciones distintas de "necesidad paliativa no atendida": algunos usan muerte confirmada por registros oficiales; otros usan derivación efectiva a cuidados paliativos; otros usan juicio clínico de experto; otros usan una combinación. Esto compromete la comparabilidad directa de las propiedades psicométricas entre instrumentos. Cuando un instrumento A y un instrumento B se miden contra estándares distintos, sus cifras de sensibilidad y especificidad no son estrictamente comparables.
Segundo, el conflicto de intereses declarado. Los propios autores, en la sección Conflict of Interest, aclaran que todos excepto la bibliotecaria (Campbell) fueron coautores de uno de los estudios incluidos en la revisión (Kirkland 2021). Es transparente y se declara en el texto, y el procedimiento que adoptaron para minimizar sesgo —que ese estudio específico fuera evaluado por un autor distinto del que lo había coautorado— es defendible. Pero es un dato metodológicamente importante que los estudiantes deben notar como ejemplo de cómo se reportan conflictos en una revisión sistemática.
Tercero, la validez externa a Latinoamérica. Los 35 estudios fueron mayoritariamente en Estados Unidos, Canadá, Europa y algunos en Asia. El único estudio latinoamericano es un resumen de congreso de Tineo 2020 en Perú, con muestra pequeña y sin propiedades psicométricas formales. La aplicabilidad directa de los instrumentos al sistema colombiano es una hipótesis no comprobada.
Cuarto, la ausencia de desenlaces centrados en el paciente. La mayoría de los estudios midió mortalidad o consulta paliativa como desenlaces, no concordancia con preferencias del paciente, control sintomático, satisfacción familiar, o calidad del lugar de muerte. Tamizar bien no es lo mismo que cuidar bien. Un instrumento con excelente desempeño psicométrico puede ser irrelevante si lo que detecta no se traduce en mejor cuidado.
Por qué este artículo importa para Colombia
Conexión con el contexto colombiano
Este artículo es, probablemente, el que más directamente conecta con preguntas de investigación viables dentro del horizonte de una maestría colombiana. Ninguno de los 14 instrumentos identificados ha sido validado transculturalmente al español colombiano siguiendo metodología COSMIN. La validación transcultural de P-CaRES, SPEED, o incluso la Surprise Question aplicada a contexto colombiano, es un proyecto factible en dos años, que produce un artículo publicable en revista indexada y deja un instrumento útil al sistema de salud.
Una pregunta distinta pero igualmente viable: un estudio de implementación pragmático que combine tamizaje (con cualquier instrumento razonable) con dispositivo de derivación activa en un hospital colombiano de mediana complejidad —como el Hospital Regional de Moniquirá que hemos trabajado en sesiones anteriores, o una IPS oncológica en un municipio PDET— puede responder la pregunta de si el tamizaje en urgencias efectivamente aumenta la derivación a cuidados paliativos en el SGSSS. Dado que el artículo muestra que sin derivación activa el tamizaje es casi inútil, un ensayo pragmático que pruebe esa hipótesis en Colombia es altamente relevante tanto científica como operativamente.
Preguntas para llevar a la sesión
Si tuvieras que recomendar hoy UN instrumento de tamizaje para un hospital de mediana complejidad en Boyacá, ¿cuál elegirías y qué tres argumentos específicos darías para defenderlo frente a los otros dos?
El artículo muestra que tamizar bien sin un dispositivo de derivación activa produce tasas de consulta paliativa de apenas 1,4% a 12% en urgencias. ¿Qué componentes debería tener un dispositivo de derivación eficaz en el SGSSS colombiano para llevar esa cifra al rango 32-47% que documentan los estudios con intervención activa?
La Surprise Question funciona mejor a 12 meses que a 30 días, y mejor en pacientes oncológicos que no oncológicos. ¿Qué implicaciones tiene esto para elegir el instrumento de tamizaje adecuado según el tipo de paciente (oncológico vs. no oncológico) y el propósito del tamizaje (identificación temprana de trayectoria vs. planeación inmediata al final de la vida)?
Una última cosa antes de cerrar
Estos tres artículos dialogan entre sí más de lo que podrían parecer a primera vista. Grudzen muestra un ensayo negativo bien hecho sobre una intervención multicomponente; Basch muestra un ensayo positivo sobre una intervención con mecanismo causal claro; Kirkland muestra que la evidencia disponible sobre tamizaje es insuficiente para recomendaciones firmes. Los tres, juntos, componen una lección sobre epistemología de la evidencia en cuidados paliativos: qué sabemos, qué no sabemos, y qué no podemos todavía afirmar con confianza.
La tarea del investigador en cuidados paliativos colombiano no es repetir estas preguntas; es formular las suyas propias, con estos artículos como mapa de puntos de partida. Nos vemos el 24 de abril.