python怎么将多个PDF进行合并

  介绍

这篇文章将为大家详细讲解有关python怎么将多个PDF进行合并,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

<强>背景

由于工作性质,经常面对不同的问题,某些场景下SQL + Excel,常用办公软件不能处理,这时到网上找一些案例,自己动手用python处理。后续,借此博客记录比较典型的处理过程。

后续,陆续实际处理的问题,如

1。合并PDF
2。拆分PDF
3。敏感字段MD5脱敏
4。从非架构化的大文本文件中提取指定条件的记录

<强>需求

工作和生活中有时会遇到将多个pdf文件,合并成一个大文件的情况,例如,扫描时,普通扫描仪或打印机一页生成一个pdf,而一份资料实际多页.Adobe的收费版有合并功能,我们可以自己动手解决。根据网上搜索了几个合并pdf的例子,都是2. x环境下的程序,因此将部分函数替换为3。x环境下。

<强>合并多个PDF的python

& # 39; & # 39; & # 39; #, - *安康;编码:utf - 8 * & # 39; & # 39; & # 39;   import 系统   import  importlib   importlib.reload(系统)      import 操作系统   import  os.path   得到PyPDF2  import  PdfFileReader, PdfFileWriter    import 时间   time1=time.time ()      #,使用os模块走函数,搜索出某目录下的全部pdf文件   # # # # # # # # # # # # # # # # # # # # # #获取同一个文件夹下的所有PDF文件名# # # # # # # # # # # # # # # # # # # # # # #   def  getFileName (filepath):=,file_list  []   ,for 根,dirs files 拷贝os.walk (filepath):   for 才能;filespath 拷贝文件:   ,,#,打印(os.path.join(根,filespath))   ,,file_list.append (os.path.join(根,filespath))      return  file_list            # # # # # # # # # # # # # # # # # # # # # # # # # #合并同一个文件夹下所有PDF文件# # # # # # # # # # # # # # # # # # # # # # # #   def  MergePDF (filepath,输出文件):   ,输出=PdfFileWriter ()   outputPages=0   ,in_file_path =filepath  + " # 39;输入/& # 39;   ,打印(in_file_path)   ,pdf_fileName=getFileName (in_file_path)   i=0   ,for  each  pdf_fileName拷贝:   我=我才能+ 1   每打印才能(我)   #,才能读取源pdf文件   时间=input 才能;PdfFileReader(打开(,,“rb"))      #才能,如果pdf文件已经加密,必须首先解密才能使用pyPdf   if 才能;input.isEncrypted ==,真的:   ,,input.decrypt (“map")      #,才能获得源pdf文件中页面总数   时间=pageCount 才能;input.getNumPages ()   outputPages 才能+=pageCount   打印才能(“PageCount:,“, PageCount)      #,才能分别将页面添加到输出输出中   for 才能;iPage 拷贝范围(0,,pageCount):   ,,output.addPage (input.getPage (iPage))         ,打印(“All  Pages 数字:“+ str (outputPages))   ,#最后写pdf文件   ,out_file_path=filepath + " # 39;输出/& # 39;   ,outputStream=开放(out_file_path +输出文件,“wb")   ,output.write (outputStream)   ,outputStream.close ()   ,打印(,“finished")         if  __name__ ==, & # 39; __main__ # 39;:=,file_dir  " # 39; D:/扫描文件/& # 39;,,#,待合并PDF 所在文件夹   ,=u"某某资料合并文件.pdf",, #,合并后文件名称   ,MergePDF (file_dir,)=,,time2  time.time ()   ,print (, u # 39;总共耗时:& # 39;,+,str (time2 作用;time1), +, & # 39; & # 39;)

<强>使用注意事项

1,程序第63行,默认指定了一个目录,“D: \扫描文件”,然后在其下建“\输入”和“输出\”两个子文件夹。
2,将待合并的pdf文件放在输入“\”中,合并后的文件默认为“某某资料合并文件。pdf”,可在程序第64行修改你期望的文件名,合并后文件输出到“\输出”。
3,合并多个文件时,合并顺序为文件名升序。

<强>补充说明强,如何使用python,建议学一本免费的电子书《编程小白的第一本python入门书》,网上可搜。

最后,如果哪位朋友有兴趣,可以将程序第63和64行,加一个图形界面,用户在窗下选择输入和输出选择输出文件名,然后做一个可执行文件。

关于“python怎么将多个pdf进行合并”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看的到。

python怎么将多个PDF进行合并