当前位置:首页 > 软件开放 > 正文内容

代码怎么转成网页(代码怎么转成网页格式)

软件开放4个月前 (05-17)197

作者: qikqiak

来源:https://blog.qikqiak.com/post/python-convert-pdf-images/

作者: qikqiak

来源:https://blog.qikqiak.com/post/python-convert-pdf-images/

之前收集了很多优秀的 PDF文档,但是需要看的时候不是很方便,需要去找到这个文件,如果是在手机上的话往往还需要下载 PDF相关的插件才行,而且最大的问题是不便于资料的整理和分享。如果能够将 PDF转换成网页,岂不是就能解决这些问题了?还能直接分享出去。

这里利用 PyPDF包来处理 PDF文件,为了方便快捷,我这里直接将一个页面转换成图片,就不需要去识别页面中的每一个 PDF元素了,这是没必要的。

转换

核心代码很简单,就是将 PDF文件读取出来,转换成 PdfFileReader,然后就可以根据 PyPDF2的API去获得每一个页面的二进制数据,拿到二进制数据过后,就能很方便的进行图片处理了,这里用 wand包来进行图片处理。

# -*- coding: utf-8 -*-

importio

fromwand.image importImage

fromwand.color importColor

fromPyPDF2importPdfFileReader,PdfFileWriter

展开全文

memo ={}

defgetPdfReader(filename):

reader =memo.get(filename,None)

ifreader isNone:

reader =PdfFileReader(filename,strict=False)

memo[filename]=reader

returnreader

def_run_convert(filename,page,res=120):

idx =page +1

pdfile =getPdfReader(filename)

代码怎么转成网页(代码怎么转成网页格式)

pageObj =pdfile.getPage(page)

dst_pdf =PdfFileWriter()

dst_pdf.addPage(pageObj)

pdf_bytes =io.BytesIO()

dst_pdf.write(pdf_bytes)

pdf_bytes.seek(0)

img =Image(file=pdf_bytes,resolution=res)

img.format ='png'

img.compression_quality =90

img.background_color =Color("white")

img_path ='%s%d.png'%(filename[:filename.rindex('.')],idx)

img.save(filename=img_path)

img.destroy()

需要注意的是一般PDF文件较大,如果一次性转换整个PDF文件需要小心内存溢出的问题,我们这里将第一次载入的整个PDF文件保存到内存,避免每次读取的时候都重新载入。

需要注意的是一般PDF文件较大,如果一次性转换整个PDF文件需要小心内存溢出的问题,我们这里将第一次载入的整个PDF文件保存到内存,避免每次读取的时候都重新载入。

上面已经完成了一个 PDF页面的转换,要完成整个文件的转换就很简单了,只需要拿到文件的总页码,然后循环执行就行。考虑到转换比较耗时,可以使用异步处理的方式加快速度。比如可以使用 celery来搭配处理,一定注意小心内存泄露。

核心代码已经整理放到github上去了,好了,等有时间的时候准备做一个公共的 PDF转成 H5的服务,开放给大众使用。

花了点时间,做成了一个独立的服务:https://pdfh5.com,欢迎大家试用

花了点时间,做成了一个独立的服务:https://pdfh5.com,欢迎大家试用

扫描二维码推送至手机访问。

版权声明:本文由飞速云SEO网络优化推广发布,如需转载请注明出处。

本文链接:http://hon-tex.cn/post/114991.html

分享给朋友:

“代码怎么转成网页(代码怎么转成网页格式)” 的相关文章

LOL手游怎么卖号(lol手游卖号吧)

LOL手游怎么卖号(lol手游卖号吧)

本篇文章给大家谈谈LOL手游怎么卖号,以及lol手游卖号吧对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、英雄联盟手游账号好卖么 2、请问lol手游怎么租号? 3、5173怎么卖LOL号?就是在提交账号信息前要做什么?要解除什么?密码要吗?怎么弄啊 4、lol...

网站登录页面html源码模板(html登录注册页面源码)

网站登录页面html源码模板(html登录注册页面源码)

本篇文章给大家谈谈网站登录页面html源码模板,以及html登录注册页面源码对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、如何查看网站HTML源代码 2、HTML代码基础知识:如何查看一个网页的HTML源代码? 3、如何获取一个网页完整的HTML代码 4、如...

区块链开源网站(区块链开发平台)

区块链开源网站(区块链开发平台)

本篇文章给大家谈谈区块链开源网站,以及区块链开发平台对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、区块链应用开发找哪家好? 2、区块链网站怎么搭建 3、国际首条车联网区块链IOV Blockchain于中国黄埔正式面向全球开源 区块链应用开发找哪家好? 区块链...

鱼泡网小程序源码(鱼泡网开发者)

鱼泡网小程序源码(鱼泡网开发者)

今天给各位分享鱼泡网小程序源码的知识,其中也会对鱼泡网开发者进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、小程序开发一般都会提供源码的吗? 2、鱼泡网怎么下载? 3、小程序源码,小程序源码有谁提供的? 小程序开发一般都会提供源码的吗? 这个看你自...

html访问人数统计代码(网站访问人数统计代码)

html访问人数统计代码(网站访问人数统计代码)

今天给各位分享html访问人数统计代码的知识,其中也会对网站访问人数统计代码进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、不用后台数据库可不可以统计网站日访问量?asp代码怎么写? 2、如何在静态网页中统计并显示访问数和在线人数 3、编写一个网页,...

制作电影影评网页面(制作电影影评网页面图片)

制作电影影评网页面(制作电影影评网页面图片)

今天给各位分享制作电影影评网页面的知识,其中也会对制作电影影评网页面图片进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、影评网是什么? 2、除了豆瓣,还有哪些好用的影评网站? 3、用jquery怎么制作的电影网站 4、怎么制作在线观看电影网站...