Según la BBC, Inglaterra extravió 16 mil casos de COVID-19 por mal uso del Excel

El mal uso del software Excel de Microsoft fue la razón por la que casi 16.000 casos de coronavirus no se denunciaron en Inglaterra. Y parece que la culpa fue de Public Health England (PHE), en lugar de un contratista externo.

El problema fue causado por la forma en que la agencia reunió los registros producidos por firmas comerciales pagadas para analizar las pruebas de hisopos del público, para descubrir quién tiene el virus. Archivaron sus resultados en forma de listas basadas en texto, conocidas como archivos CSV, sin problemas.

PHE había establecido un proceso automático para reunir estos datos en planillas de Excel para que luego pudieran cargarse en un sistema central y estar disponibles para el equipo de prueba y rastreo del NHS (el legendario National Health Service), así como para otros paneles de computadoras del gobierno.

El problema es que los propios desarrolladores de PHE eligieron un formato de archivo antiguo para hacer esto, conocido como XLS. Como consecuencia, cada plantilla podría manejar solo alrededor de 65,000 filas de datos en lugar del millón de filas de las que Excel es teóricamente capaz.

Y dado que cada resultado de la prueba creaba varias filas de datos, en la práctica significaba que cada plantilla estaba limitada a unos 1.400 casos. Cuando se alcanzó ese total, simplemente se dejaron de lado los otros.

Para un poco de contexto: el formato de archivo XLS de Excel se remonta a 1987. Fue reemplazado por XLSX en 2007. Si se hubiera utilizado, se habría manejado 16 veces el número de casos.

Como mínimo, eso habría evitado que ocurriera el error hasta que los niveles de prueba fueran significativamente más altos de lo que son hoy.

Un experto sugirió que incluso un estudiante de informática de secundaria sabría que existen mejores alternativas. «Excel siempre estuvo destinado a personas que jugaban con un montón de datos para que los registros de una pequeña empresa», comentó el profesor Jon Crowcroft de la Universidad de Cambridge. «Cuando necesitas hacer algo más serio, construyes algo a medida que funcione; hay docenas de otras cosas que podrías hacer. Pero no usarías XLS. Nadie empezaría con eso».

Hablando en la Cámara de los Comunes, el Secretario de Salud Matt Hancock sugirió que el problema había surgido como resultado de que PHE usaba un «sistema heredado» y que hace dos meses se tomó una decisión para reemplazarlo.

Sin embargo, es de suponer que este problema específico no se había detectado. De lo contrario, PHE se habría dado cuenta de que la falla entraría en vigencia antes de que se completara la actualización.

Hancock fue desafiado a poner otros diagramas de procesos de datos relevantes en el dominio público, de modo que se pudieran encontrar otras fallas ocultas en el aparato digital del gobierno.

Pero aunque el ministro dijo que vería lo que era posible, agregó: «El desafío de un error de tamaño máximo de archivo es que no necesariamente aparecería en ese tipo de diagramas de flujo».

En su defensa, la agencia dijo que detectó la mayoría de los casos en uno o dos días después de que los registros se filtraran por su red.

La falla no impidió que los pacientes obtuvieran sus resultados, pero retrasó que los rastreadores de contacto vean los detalles. El secretario de salud «en la sombra» del laborismo, Jonathan Ashworth, denunció que se habían puesto en riesgo vidas porque el proceso de rastreo de contactos se había retrasado.

«Miles de personas [eran] felizmente inconscientes de que habían estado expuestas a Covid, lo que podría propagar este virus mortal en un momento en que las admisiones hospitalarias están aumentando», dijo a la Cámara de los Comunes. «Esto no es solo un desastre. Es mucho peor».

Para manejar el problema, PHE ahora está dividiendo los datos de los resultados de la prueba en lotes más pequeños para crear una mayor cantidad de plantillas de Excel. Eso debería garantizar que no se repita el error.

Pero los expertos reconocen que el torpe sistema actual debe ser reemplazado por algo más avanzado que excluya a Excel, lo antes posible.

VIABBC