jpg png bmp图片批量转换为pdf格式文件python脚本工具

发表评论

A+

所属分类：编程语言

转存源码：图片批量转换图片转pdf格式文件，python版支持jpg转pdf，png转pdf以及bmp转pdf

# -*- coding: utf-8 -*-
# -------------------------------------------------------------------------------
# @File : Convert2PDF.py
# @Created : 2017/12/25 下午3:03
# @Software : PyCharm
#
# @Author : Liu.Qi
# @Contact : liuqi_0725@aliyun.com
#
# @Desc : 目的?
# -------------------------------------------------------------------------------
import os
from reportlab.platypus import SimpleDocTemplate,Image, PageBreak
from reportlab.lib.pagesizes import A4, landscape
import time
from PIL import Image as pilImage
# 支持的图片类型
__allow_type = [".jpg", ".jpeg", ".bmp", ".png"]
__rootDir = ""
def convert_images2PDF_one_dir(file_dir,save_name=None ,filename_sort_fn=None):
'''
转换一个目录文件夹下的图片至 PDF
:param file_dir:
:param file_name: 如果为空,则以当前文件夹的名称命名, 必须是.pdf结尾
:param filename_sort_fn:
文件名排序的回调函数,当此回调函数有值时,在文件名排序时,会回调,并将 file 的完整路径返回。
回调函数需要返回一个可转换整形的内容,函数根据此回调函数的返回值,对文件名排序
比如:
现实中,文件名会是
test_01_doc_0.png、
test_01_doc_1.png、
test_01_doc_2.png、
test_01_doc_3.png、
test_01_doc_11.png、
test_01_doc_21.png
等等,我们也希望读取出来的顺序如此,但是 mac、win 下,包括sort 排序出来的结果都不理想。
结果为
test_01_doc_0.png、
test_01_doc_1.png、
test_01_doc_11.png、
test_01_doc_2.png、
test_01_doc_21.png、
test_01_doc_3.png
不是我们想要得到的。
通过 filename_sort_fn(filename) 返回的整形数字,对齐正确的排序
'''
book_pages = []
for parent, dirnames ,filenames in os.walk(file_dir):
# 只遍历最顶层
if parent != file_dir :
continue
# 过滤文件中所有的图片
for file_name in filenames:
file_path = os.path.join(parent, file_name)
# 是否图片
if __isAllow_file(file_path) :
book_pages.append(file_path)
# 取当前目录的文件名为书名
if save_name == None :
save_name = os.path.join(file_dir,(os.path.basename(file_dir) + ".pdf"))
else :
save_name = os.path.join(file_dir,save_name)
if len(book_pages) > 0 :
# 开始转换
print("[*][转换PDF] : 开始. [保存路径] > [%s]" % (save_name))
beginTime = time.clock()
__converted(save_name , book_pages ,filename_sort_fn)
endTime = time.clock()
print("[*][转换PDF] : 结束. [保存路径] > [%s] , 耗时 %f s " % (save_name, (endTime - beginTime)))
else :
print("该目录下没有找到任何图片文件.如果是多重目录,尝试使用 convert_images2PDF_more_dirs 函数")
def convert_images2PDF_more_dirs(dirPath):
"""
转换一个目录文件夹下的图片至 PDF
:param file_dir:
:param filename_sort_fn:
"""
# 已经找到目录
__dirs = {}
for parent, dirnames, filenames in os.walk(dirPath):
for dirname in dirnames:
# 假设每个文件夹下都有图片，都是一本书
dirData = {"name": "", "pages": [], "isBook": False}
dirName = dirname.split('/')[0]
dirData['name'] = dirName
__dirs[dirName] = dirData
# 查找有无图片
for filename in filenames:
real_filename = os.path.join(parent, filename)
# 取父文件夹名称为书名
parentDirName = real_filename.split('/')[-2]
if parentDirName in __dirs.keys():
dirJsonData = __dirs[parentDirName]
else:
continue
# 检查是否图片
if __isAllow_file(real_filename) :
# 将图片添加至书本
dirJsonData['pages'].append(real_filename)
# 如果该书的isbook 是false 改为true
if not dirJsonData['isBook']:
dirJsonData['isBook'] = True
index = 1
for dirName in __dirs.keys():
dirData = __dirs[dirName]
if dirData['isBook']:
print("[*][转换PDF] : 开始. [名称] > [%s]" % (dirName))
beginTime = time.clock()
__converted(os.path.join(dirPath,(dirData['name'] + ".pdf")) , dirData['pages'])
endTime = time.clock()
print("[*][转换PDF] : 结束. [名称] > [%s] , 耗时 %f s " % (dirName, (endTime - beginTime)))
index += 1
print("[*][所有转换完成] : 本次转换检索目录数 %d 个，共转换的PDF %d 本 " % (len(__dirs), index - 1))
def __isAllow_file(filepath):
"""
是否允许的文件
:param file:
:return:
"""
if filepath and (os.path.splitext(filepath)[1] in __allow_type):
return True
return False
def __converted(save_book_name,book_pages=[],filename_sort_fn=None):
"""
开始转换
:param book_name: 保存的文件名(包含路径)
:param book_pages: 图片数组
:param filename_sort_fn: 文件名排序规则
:return:
"""
# A4 纸的宽高
__a4_w, __a4_h = landscape(A4)
# 对数据进行排序
if (filename_sort_fn == None):
# 将按图片按名称的ASCII排序以避免错乱问题
book_pages.sort()
else:
# lambda 匿名函数, 第一个参数定义函数入参,第二个为参数的处理表达式
# 这样理解
# def getName(name):
# return name.split("-")[1]
#
# 用匿名函数就这么表示
# name = lambda name:name.split("-")[1]
# xname = name("haha-dd-23")
#
# 支持多个参数
#
book_pages = sorted(book_pages, key=lambda name: int(filename_sort_fn(name)))
bookPagesData = []
bookDoc = SimpleDocTemplate(save_book_name, pagesize=A4, rightMargin=72, leftMargin=72, topMargin=72, bottomMargin=18)
for page in book_pages:
img_w, img_h = ImageTools().getImageSize(page)
# img_w = img.imageWidth
# img_h = img.imageHeight
if __a4_w / img_w < __a4_h / img_h:
ratio = __a4_w / img_w
else:
ratio = __a4_h / img_h
data = Image(page, img_w * ratio, img_h * ratio)
bookPagesData.append(data)
bookPagesData.append(PageBreak())
try:
bookDoc.build(bookPagesData)
# print("已转换 >>>> " + bookName)
except Exception as err:
print("[*][转换PDF] : 错误. [名称] > [%s]" % (save_book_name))
print("[*] Exception >>>> ", err)
class ImageTools:
def getImageSize(self, imagePath):
img = pilImage.open(imagePath)
return img.size

我的微信公众号

爱真理，得永生！　　　　　　　　　　爱在灵灵久博客，网罗天下，福利大家！

发表评论取消回复

登录

微信