怎样提取word文档中的图片
的有关信息介绍如下:对于图文混排的Word长文档,怎样把其中的图片全部快速提取出来呢?而且的是的是原图,不能因为排版后而失真的图片
首先给大家说一下基本原理
什么是docx?大家有没有发现,自从office2007之后,word的后缀就变成了由原来的doc变成了docx。这个x就是指open xml格式。新版的office软件都是采用open xml格式来保word,ppt,excel的,一个word文档是由特定的xml,图片,视频,音频等元素组成。它们以一个压缩包的形式组合在一起,打开该word文档后,各种元素便会被提取出来,按照相应的排版呈现在我们面前。
这跟网页调用元素的方法非常相似,懂html+css的话,一点都不难理解我上面的这段话
换句话说docx就是一个压缩文件,它也可以被解压。
虽然说docx就是一个压缩文件,但是你不能直接把他解压。
先把文件的后缀名由“.docx”改为“.zip”
例如“复习.docx”改为“复习.zip”
这时会弹出对话框“如果改变文件扩展名,可能毁导致文件不可用”,点确认就可以了。
这时该文档就变成了.zip后缀的压缩文件格式
双击右键打开该压缩包
这时我们可以看到有一个名字为word的文件夹,双击右键打开
这时我们可以看到有一个名字为media的文件夹,咱们要找的就是它。
你还不信吗,打开media文件夹来看看吧。全是图片格式的
现在我们就把这个media文件夹解压出来
文件夹已经解压出来了
双击打开看一看,里面的就是所有word文档中的图片
但是我们发现有些图片不是不是我们所要的。需要筛选一下
右键 排列方式——类型
把后面不要的都删一删
其实也很简单,在word2007以上的版本或wps打开,然后另存为docx格式的文档,再按上述方法操作就可以了。
点击右上角菜单————>另存为
挑选保存格式为“docx”