- A+
目前手上有一些pdf格式的文档,想将其每一页批量转换为jpg或png等图片格式的文件,但是一路上转换过来碰到不少问题,现在在此记录。
一、使用的工具及环境
本人使用的是windows10 64位的操作系统,python是python3.6 64位的版本,这里一定要注意一个坑,多少位的操作系统就对应安装多少位的python版本,之前安装的是python3.6 32位的版本,结果下载使用一些库的时候各种错误,如果还不确定就到cmd命令行中看看,以及右键点击我的电脑选择属性看看两者是否一致。另外,使用的编辑器是贼拉拉好用的Pycharm,爱在灵灵久博客 在这里强烈推荐使用。
C:\Users\Administrator>python
Python 3.6.4 (v3.6.4:d48eceb, Dec 19 2017, 06:54:40) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
二、运行中碰到的问题
运行中需要使用到两个库,分别是PyPDF2以及PythonMagick,在cmd命令行里分别pip install ……即可。安装好后运行如下代码:
#-*-coding:utf-8-*-
import PyPDF2
import PythonMagick
pdf_file_name = 'test.pdf'
pdf_im = PyPDF2.PdfFileReader(open(pdf_file_name, "rb"))
n_page = pdf_im.getNumPages()
print('Converting %d pages.' % n_page)
for p in range(n_page):
im = PythonMagick.Image(pdf_file_name + '[' + str(p) + ']')
im.density('300')
im.write('file_out-' + str(p) + '.jpg')
但是,运行后却报错了,im.read(pdffilename + '[' + str(p) +']') Error 搞了好久,各种查资料终于找打了解决问题的方法。
三、解决问题的措施
上述错误的问题出在没有安装GhostScript这个安装包,于是下载了Ghostscript 9.23 for Windows (64 bit),安装后再运行,这次ok了。
四、资源下载及展示
在这里将GhostScript这个安装包的下载地址附于下,如果有需要的可以下载。另外,以上代码只是解决了将一个pdf文件的每一页转换位单独一张图片,但是若要将文件夹内的所有pdf文件都转换为图片还需要继续编写代码,将会在后面继续更新,敬请收藏本站 爱在灵灵久博客以及关注python学习大全微信公众号。
2018年6月11日 下午5:04 沙发
为什么不可以
2018年6月13日 下午12:37 1层
@ceshi 可以哦 ,这里里面有很多坑,需要按照博客里面的都进行安装了才可以,我也是搞了很久。
2018年6月11日 下午5:08 板凳
好象看一下,多谢
2018年7月21日 上午11:23 地板
哇很详细了呀