Palma de la cara: Microsoft merece felicitaciones por el código abierto del Código fuente de MS-DOS 4.00, arrojando luz sobre un hito importante en la historia de la informática. Pero el gigante tecnológico ha cometido un error en la publicación de una manera que puede causar dolores de cabeza innecesarios a los historiadores y archiveros ansiosos por estudiar el código de décadas de antigüedad.
El error está arrojando la fuente a un repositorio git en lugar de proporcionar un archivo prístino, que, como el curador de software Michal Necasek del Museo OS/2 señala, fue el enfoque adecuado. Hace un comentario excelente: «El código fuente histórico debería publicarse simplemente como un archivo de archivos, ZIP o tar o 7z o lo que sea, con todas las marcas de tiempo preservadas y cada byte conservado como estaba. Git simplemente no es una herramienta adecuada para este.»
Al arrojar la fuente a Git, es posible que Microsoft haya dañado los archivos de varias maneras. Git ignoró las marcas de tiempo originales, eliminando metadatos potencialmente valiosos sobre cuándo se modificó cada archivo por última vez. Peor aún, la conversión a codificación UTF-8 convirtió parte del código en un galimatías, interrumpiendo el proceso de compilación.
Como enfatiza Necasek, la fuente con décadas de antigüedad no es sólo texto; Se trata esencialmente de datos binarios que exigen una preservación total sin modificación alguna. Volver a codificarlo provoca roturas, ya que herramientas anticuadas como MASM 5.10 y Microsoft C 5.1 naturalmente no pueden manejar formatos Unicode como UTF-8 que no existían en ese entonces.
Si bien la disponibilidad del código de MS-DOS 4.00 es sin duda una bendición para los historiadores del software que examinan el linaje de MS-DOS a Windows, el enfoque de GitHubbing puede haber socavado innecesariamente los esfuerzos para construir y analizar el código como material de archivo auténtico.
Sin embargo, un comentarista con el nombre de usuario ‘starfrost’, que afirma que trabajaron con Microsoft para publicar esta versión, fijado debajo de la pieza original que potencialmente podrían obtener el archivo ZIP original. Sin embargo, es posible que las marcas de tiempo no estén disponibles porque «la ley de protección de datos exige la anonimización de los archivos fuente».
Además, Necasek hizo comentario que pudo compilar con éxito el código en su totalidad copiándolo en una máquina virtual con PC DOS 2000 y ejecutando el proceso de compilación allí. Entonces, si está buscando construir, este es el camino a seguir.
Microsoft aún habría sido más prudente al proporcionar la fuente como un archivo ZIP o 7z limpio directamente desde sus copias de seguridad internas con la codificación adecuada, preservando cada byte en su forma original. El legado de la informática es simplemente demasiado valioso para las payasadas de los aficionados.
Hay que reconocer que Microsoft hizo un esfuerzo adicional al agrupación de binarios beta de los archivos de Ray Ozzie, documentación original e imágenes de disco para una fácil emulación.