El día más largo para Pixar después de borrar por error Toy Story 2 y no disponer de copia de seguridad

Un trabajador borró por error los ficheros de Toy Story 2 y la empresa no disponía de una copia de seguridad.

A finales de los 90, Pixar estaba inmersa en un proyecto muy ambicioso que podía catapultar la compañía de animación cuando todavía no era propiedad de Disney. Para esta nueva película, que también se haría íntegramente mediante animación por ordenador, disponían de un presupuesto que triplicaba el anterior film, Toy Story.

El presupuesto inicial era de 90 millones de dólares pero seguramente hubieran añadido de buen gusto una partida extraordinaria para elaborar y gestionar las copias de seguridad de todos los ficheros del proyecto si hubieran sabido por adelantado lo que pasaría aquella fatídica tarde de invierno de 1998.

Hace más de veinte años, no existían las soluciones avanzadas de copias de seguridad de las que disponemos actualmente ni tampoco éramos conscientes del riesgo de no disponer de un buen plan de contingencia, especialmente cuando se trabaja de forma colaborativa en un mismo proyecto, como en el caso de Toy Story 2, un proyecto en el que 150 personas trabajaban intensamente sobre un servidor que alojaba las diferentes escenas del film. Cada escena contenía centenares de archivos que eran creados y modificados continuamente por diferentes creativos especializados en diferentes disciplinas.

Todos los trabajadores tenían los mismos derechos de acceso a los datos, y todos ellos podían hacerlo de manera simultánea. Algún trabajador, por error, ejecutó el comando /bin/*rm -r -f * (frecuentemente utilizado en sistemas Unix/Linux) que servía para borrar todos los archivos de un directorio concreto.

La ejecución del comando se hizo en el directorio raíz del proyecto, y lo hizo con permisos de administrador, por lo cual se perdieron prácticamente todos los ficheros del film.

Sin plan de contingencia de copia de seguridad. Sin nada.

Un proceso de copias de seguridad se ejecutaba automáticamente cada día sobre una unidad de cintas (streamer). La cantidad inaudita de información generada hizo que rápidamente se llegara al máximo de capacidad que podía asumir la cinta, 4 GB. Llegados a este punto, el sistema dejó de hacer copias. Como no existía un plan de contingencia de backup que previera simulacros de restauración de datos nadie se dio cuenta. No había datos, no había copias, no había nada. El trabajo de 10 meses de 150 personas había desaparecido en cuestión de minutos.

El milagro de la maternidad y un golpe de suerte para un proyecto de 100 millones de dólares

En pleno estado de shock y después de varios intentos sin éxito de recuperar los datos perdidos, alguien pensó en Galyn Susman, supervisora de dirección técnica de la película, que había pedido trabajar desde casa para poder atender el bebé que acababa de nacer.

Susman trabajaba de forma remota con un potente ordenador que la empresa le había suministrado y configurado y, por suerte, recibía periódicamente los ficheros del proyecto con las últimas actualizaciones. Rápidamente el personal de Pixar se hizo cargo del ordenador y de los diferentes discos duros para averiguar si se podría recuperar algo de la película. Cuando los técnicos pudieron acceder a la información del ordenador de Galyn suspiraron, puesto que el disco contenía los archivos actualizados hasta dos semanas antes, por lo cual «solo» habían perdido el trabajo de quince días.

Pixar tomó buena nota, pero la empresa no despidió nadie. Quizás había demasiados responsables. El principal problema fue que no se diseñó un buen plan de contingencia que definiera todos los posibles escenarios de desastre y el protocolo a seguir en cada caso.

Actualmente, existen diferentes soluciones de copia de seguridad asequibles que se adaptan a la realidad de toda empresa independientemente de su volumen o complejidad. Merece la pena invertir algo de tiempo en desarrollar un sistema completo de copias de seguridad, y si no, que le pregunten a Pixar.

Gracias a la consultoría informática nuestros técnicos pueden detectar cuáles son los puntos más vulnerables y definir cuál es el mejor sistema de copias de seguridad a implementar o revisar los procesos en caso de que ya estén establecidos o hacer simulacros de restauración. Todo esto siempre con el objetivo que la empresa disponga de la información actualizada, segura y disponible.