首页 游戏资讯 正文

mht是什么文件怎么转换?快速转成PDF或HTML!

说起来,这MHT文件,我刚开始接触它的时候,真是头大。那是几年前,我们老板突然甩过来一个MHT格式的文件,让我赶紧从里面找一个什么关键数据。我当时拿到手,电脑上双击没反应,直接把我搞懵了。心里嘀咕,这是个啥玩意儿?图标看着跟个网页似的,但普通的浏览器打开都报错,或者就是一片空白。

本站为89游戏官网游戏攻略分站,89游戏每日更新热门游戏,下载请前往主站地址:www.gm89.icu

我当时就觉得,这肯定不是什么普通货色。我们组里几个老同事,也都没见过这种文件,大家互相看了看,都是一脸茫然。我当时以为是不是我电脑出了问题,还特意重启了一遍,结果还是老样子。那感觉,就像是拿到了一把钥匙,却找不到任何能打开的锁,心里那个着急。

后来我才上网查了查,才知道MHT文件,全称叫“MIME HTML”,说白了,它就是把一个网页,连带着网页里的所有图片、CSS样式、JavaScript代码啥的,都给打包到一块儿,变成一个单独的文件。它的初衷是就是为了方便用户离线查看网页内容,一个文件搞定所有,不用担心图片丢了或者排版乱了。但这玩意儿好是就是兼容性实在是太差了,很多浏览器压根儿就不认它,或者认了也打不开。

我们当时遇到的问题就是,这个MHT文件里面的数据,我们需要提取出来做报表,有时候还需要打印出来分发给客户。你想,你把一个MHT文件发给客户,客户电脑上大概率也打不开,或者打开了排版也是乱的。那肯定不行!必须得想办法把它转换成通用的格式,最常用的就是PDF或者HTML,这俩格式无论谁用,基本都没啥障碍。

刚开始那会儿,我真是各种碰壁。

我第一个想法就是,既然它是个网页文件,那是不是可以直接在浏览器里“另存为”PDF?于是我找到一个勉强能打开MHT的旧版浏览器(那时候还在用一些老版本的IE浏览器),尝试打开那个MHT文件。结果打开是打开了,但排版那个惨呐,图片错位,文字重叠,整个页面都乱七八糟的。然后我试着“打印”成PDF,出来的PDF文件也是一塌糊涂,根本没法用,简直是没眼看。

我又跑去网上搜那些所谓的“MHT在线转换工具”,结果更是让我心累。好多都是钓鱼网站,点进去各种弹窗广告,或者就是要你注册、要你付费。有些免费的,要么限制文件大小,一个大点的MHT文件根本没法传上去;要么就是转换效率低得吓人,等半天转换好了,结果打开一看,排版还是乱的,甚至图片都丢了。那会儿真是感觉有点绝望,心想一个简单的文件转换,咋就这么难?

后来我琢磨着,既然MHT本身就是网页的打包,那能不能先把它“解包”成一个正常的HTML文件?

我记得以前用IE浏览器,它对MHT文件的支持是最好的。我尝试用那个老旧的IE浏览器再次打开MHT文件。这回我没有选择直接打印,而是去了“文件”菜单,找“另存为”这个选项。在保存类型那里,我看到了几个选项,其中有一个是“网页,全部(.htm;.html)”。我选了这个,然后保存到了一个文件夹里。惊喜来了!保存完一看,这个文件夹里除了一个HTML文件,还有一个同名的文件夹,里面整整齐齐地放着所有图片和样式表。我打开那个HTML文件,奇迹发生了!在现代浏览器里,这个HTML文件的排版完全正常,图片也都在正确的位置,内容显示得清清楚楚。这下子,我们组内同事之间查看MHT文件里的内容,就再也没问题了。至少解决了“能看”的问题。

但是问题又来了,我们需要把这个东西发给客户,或者打印出来。HTML文件毕竟还是不方便,最好的还是PDF。

既然已经把MHT成功转换成了正常的HTML文件,那接下来的事情就好办多了。我想,既然HTML文件能在浏览器里正常显示,那我是不是可以用浏览器的“打印”功能,把它“打印”成PDF?我打开Chrome浏览器,加载那个转换好的HTML文件,然后按下快捷键Ctrl+P(或者点击菜单里的“打印”)。在打印设置里,我把“目标”选择成了“另存为PDF”。点击保存后,一个新的PDF文件就生成了。我打开一看,这回的效果简直是太棒了!排版几乎没有错乱,图片完整,文字清晰,跟网页显示的一模一样。虽然偶尔会在页眉页脚看到一些浏览器自带的网址或者日期信息,但跟之前那些乱七八糟的转换结果比起来,简直是天壤之别,完全可以接受了。

如果你对PDF文件的质量要求更高,或者不想有那些自带的页眉页脚,我后来还发现了一个更顺手的方法,那就是使用虚拟打印机软件。市面上有一些免费或者付费的虚拟打印机软件,比如叫什么“PDF打印机”之类的。你安装好这种软件之后,它会在你的打印机列表里多出一个“虚拟打印机”选项。这时候,你只需要在浏览器里打开你转换好的HTML文件,或者直接在IE里打开那个MHT文件,然后点击“打印”,选择那个虚拟打印机。它不会真的把内容打到纸上,而是会弹出一个窗口让你选择保存路径,直接把内容输出成一个高质量的PDF文件。这种方法出来的PDF文件,排版更稳定,通常也不会有额外的页眉页脚信息,非常适合需要专业输出的场景。

经过我这么一番折腾和摸索,总结出来的经验就是,遇到MHT文件这种“非主流”格式,千万别直接硬刚,那只会把自己搞得焦头烂额。我的实践流程是这样的:

  • 第一步,找对工具打开它。 优先尝试用老版本的IE浏览器(如果你电脑上还有的话),因为MHT就是它家的产物,兼容性最用IE打开MHT文件,确保内容显示正常。
  • 第二步,先变身HTML。 在IE浏览器里,选择“文件”->“另存为”,然后保存类型选择“网页,全部(.htm;.html)”。这样就能得到一个标准的HTML文件和它配套的资源文件夹了。这个HTML文件,拿到任何现代浏览器里都能正常显示,这是最关键的一步,解决了“能看”的问题。
  • 第三步,按需转PDF。 如果你需要PDF格式,就用现代浏览器(比如Chrome、Edge)打开第二步得到的HTML文件。然后用浏览器的“打印”功能(快捷键Ctrl+P),在打印目标里选择“另存为PDF”就行。这样生成的PDF文件,质量和排版都非常可靠。如果你对PDF质量要求更高,或者不想有浏览器自带的页眉页脚,那就可以考虑安装一个虚拟打印机软件,然后把HTML文件或者直接用IE打开的MHT文件,“打印”到这个虚拟打印机,就能得到一个非常完美的PDF文件。

一套流程下来,不管是要在线浏览,还是要打印存档,甚至是要发给客户,这个MHT文件基本上就不是什么大问题了。这个过程虽然有点儿折腾,但亲手摸索出来之后,以后再遇到这种文件,我就心里有底儿了。再也不用对着一个陌生的文件格式发愁了。