如何在windows64位操作系统环境下使用python3将pdf文件批量转化为jpg图片格式

  • A+
所属分类:python实战案例

目前手上有一些pdf格式的文档,想将其每一页批量转换为jpg或png等图片格式的文件,但是一路上转换过来碰到不少问题,现在在此记录。

一、使用的工具及环境

本人使用的是windows10 64位的操作系统,python是python3.6 64位的版本,这里一定要注意一个坑,多少位的操作系统就对应安装多少位的python版本,之前安装的是python3.6 32位的版本,结果下载使用一些库的时候各种错误,如果还不确定就到cmd命令行中看看,以及右键点击我的电脑选择属性看看两者是否一致。另外,使用的编辑器是贼拉拉好用的Pycharm,爱在灵灵久博客 在这里强烈推荐使用。

C:\Users\Administrator>python
Python 3.6.4 (v3.6.4:d48eceb, Dec 19 2017, 06:54:40) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.

 

 

二、运行中碰到的问题

运行中需要使用到两个库,分别是PyPDF2以及PythonMagick,在cmd命令行里分别pip install ……即可。安装好后运行如下代码:

#-*-coding:utf-8-*-
import PyPDF2
import PythonMagick

pdf_file_name = 'test.pdf'
pdf_im = PyPDF2.PdfFileReader(open(pdf_file_name, "rb"))
n_page = pdf_im.getNumPages()
print('Converting %d pages.' % n_page)
for p in range(n_page):
    im = PythonMagick.Image(pdf_file_name + '[' + str(p) + ']')
    im.density('300')
    im.write('file_out-' + str(p) + '.jpg')

但是,运行后却报错了,im.read(pdffilename + '[' + str(p) +']')  Error 搞了好久,各种查资料终于找打了解决问题的方法。

三、解决问题的措施

上述错误的问题出在没有安装GhostScript这个安装包,于是下载了Ghostscript 9.23 for Windows (64 bit),安装后再运行,这次ok了。

四、资源下载及展示

在这里将GhostScript这个安装包的下载地址附于下,如果有需要的可以下载。另外,以上代码只是解决了将一个pdf文件的每一页转换位单独一张图片,但是若要将文件夹内的所有pdf文件都转换为图片还需要继续编写代码,将会在后面继续更新,敬请收藏本站 爱在灵灵久博客以及关注python学习大全微信公众号。

 

此处为隐藏的内容!
发表评论并刷新,才能查看
weinxin
我的微信公众号
爱真理,得永生!          爱在灵灵久博客,网罗天下,福利大家!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:4   其中:访客  3   博主  1

    • avatar ceshi

      为什么不可以

        • avatar 爱在灵灵久 Admin

          @ceshi 可以哦 ,这里里面有很多坑,需要按照博客里面的都进行安装了才可以,我也是搞了很久。

        • avatar ceshi

          好象看一下,多谢

          • avatar miaomiao

            哇很详细了呀