Formato de archivo MHTML

Revisión

Los archivos MHTML, abreviados para MIME HTML, son una manera única de archivar páginas web. Imagina que está navegando en una intricada página web con imágenes, vídeos y elementos interactivos — todos estos componentes se pueden vincular a un formato de fichero MHTML puro. Este formato fue creado por Microsoft como un medio para capturar la esencia entera de una página Web en un único paquete descargable. Si usted es un desarrollador que busca preservar contenido web complejo o alguien que resuelve un problema de aplicación en Windows, comprender cómo funciona el HTML es crucial.

Los archivos MHTML se utilizan ampliamente a través de diversas plataformas y aplicaciones. Por ejemplo, Internet Explorer puede guardar páginas web completas como archivo MHTML, lo que hace fácil para los usuarios almacenar y revisar las experiencias web enteras en línea. Además, Microsoft Word apoya la apertura de estos ficheros directamente, permitiendo que vea la página web archivada dentro de un editor de documentos. Esta versatilidad hace que el HTML sea un formato esencial en escenarios donde el mantenimiento de la integridad del contenido web es fundamental.

Características clave

  • Arquivamiento integral: captura todos los elementos de una página web incluyendo HTML, imágenes, videos y otros recursos.
  • Cross-Platform Compatibility: ampliamente apoyado en diferentes sistemas operativos y aplicaciones como Internet Explorer y Microsoft Word.
  • Troubleshooting Tool: Usado por Windows para registrar los escenarios de problemas que se encuentran durante el uso de la aplicación.
  • RFC Compliance: Se adhiere estrictamente a las especificaciones indicadas en el RFC 2557, garantizando la normalización y la interoperabilidad.
  • MIME Encapsulation: Utiliza los header MIME para organizar y referenciar diferentes partes de una página web dentro de un archivo MHTML.

especificaciones técnicas

Formación estructural

El formato MHTML es esencialmente un archivo basado en el texto que utiliza MIME (Multipurpose Internet Mail Extensions) para encapsular múltiples recursos en un solo fichero. Es estructurado como un contenedor similar a ZIP pero con titulares y tipos de contenido específicos de MIME, lo que lo distingue de otros formatos de archivos como Zip o TAR.

Componentes básicos

  • Root Resource: El documento HTML principal de la página web.
  • Inline Resources: Imágenes, escritos, hojas de estilo y otros elementos referidos dentro del recurso raíz.
  • MIME Heads: El tipo de contenido, el ID del contenido y el contenido de la ubicación son cruciales para identificar y conectar los recursos dentro del archivo MHTML.

Estándares y Compatibilidad

El formato MHTML está normalizado por RFC 2557, garantizando la compatibilidad a través de diferentes plataformas y aplicaciones. soporta varias versiones de Windows y varios navegadores web que se adhieren a los estándares MIME.

Historia y Evolución

MHTML fue introducido a finales de los años 90 como un medio para encapsular las páginas web complejas en archivos únicos para facilitar el compartir y archivamiento. su objetivo inicial era facilitar la visualización offline de contenidos web, pero rápidamente evolucionó para servir roles adicionales como herramientas de resolución de problemas para aplicaciones de Windows.

Trabajar con los archivos MHTML

Apertura de archivos MHTML

Para abrir un archivo MHTML, puede utilizar una variedad de software:

  • Internet Explorer: una de las formas más sencillas de ver los archivos MHTML.
  • Microsoft Word: Se puede utilizar para abrir y editar el contenido de MHTML como si fuera un documento regular.
  • Otros navegadores: Algunas navegadoras modernas también pueden soportar la apertura de archivos MHTML, aunque la compatibilidad puede variar.

Convertir archivos MHTML

Convertir un archivo MHTML normalmente implica extraer su contenido o convertirlo en otro formato como HTML:

  • HTML: Para separar los recursos vinculados y verlos individualmente.
  • PDF: Para crear una versión estática de la página web que mantiene el formato pero no es interactiva.

Creación de archivos MHTML

Los archivos MHTML generalmente se crean utilizando las características del navegador o aplicaciones específicas diseñadas para archivar contenido web. Internet Explorer, por ejemplo, le permite guardar las páginas web enteras como los ficheros MHTML directamente de sus opciones de menú.

Casos de uso comunes

  • Offline Web Browsing: ahorrar páginas web completas para la visualización offline.
  • Arquivamiento web: Capturar y preservar el estado de un sitio web en un momento determinado en el tiempo.
  • Resolución de problemas: Problemas de aplicación de grabación que se encuentran en los sistemas de Windows.
  • Participación de documentos: Enviar contenido web complejo como un anexo de archivo único.

Beneficios y limitaciones

Las ventajas:

  • Archivo completo que incluye todos los elementos de una página web.
  • Compatibilidad entre plataformas con diferentes aplicaciones y sistemas operativos.
  • El formato estándar que se adhiere al RFC 2557, garantiza la interoperabilidad.
  • Util para resolver problemas y grabar problemas de aplicación en Windows.

Las limitaciones:

  • No se apoya ampliamente fuera de Internet Explorer y Microsoft Word.
  • Puede ser grande en tamaño debido a la combinación de múltiples recursos.
  • Interactividad limitada cuando se abre como documento estático en lugar de una página web en vivo.

Recursos de desarrolladores

La programación con los archivos MHTML se apoya a través de diferentes APIs y bibliotecas. ejemplos de código y guías de implementación se añadirán pronto.

Preguntas frecuentes

  • Cómo puedo abrir un archivo MHTML?

  • Usted puede usar Internet Explorer, Microsoft Word, u otros navegadores que soportan los tipos MIME para abrir los archivos MHTML.

  • Cuál es la diferencia entre MHTML y HTML?

  • Mientras que ambos formatos están relacionados con el contenido web, MHTML encapsula una página web completa incluyendo todos los recursos (imágenes, scripts, etc.), mientras que HTML sólo representa la marcación estructural de una pagina.

  • Puedo convertir un archivo MHTML de nuevo en archivos HTML individuales?

  • Sí, puede utilizar herramientas o scripts que extraen y separan los recursos envueltos dentro de un archivo MHTML para recrear documentos HTML independientes.

Referencias

 Español