当前位置: 首页 > news >正文

做视频网站服务器要求青岛疫情最新情况

做视频网站服务器要求,青岛疫情最新情况,长沙房地产价格,网站不备案可以吗Python 实现读取pdf文件简单示例。 安装命令 需要安装操作pdf的三方类库,命令如下: pip install pdfminer3K 安装过程如下: 引入类库 需要引入很多的类库。 示例如下: import sys import importlib importlib.reload(sys)fr…

Python 实现读取pdf文件简单示例。

安装命令

需要安装操作pdf的三方类库,命令如下:

pip install pdfminer3K

安装过程如下:

引入类库

需要引入很多的类库。

示例如下:

import sys
import importlib
importlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import  PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed

 

读取pdf实现

实现步骤为:先通过二进制方式打开测试pdf文档,创建pdf文档解析测试文档内容,

最后读取文件内容,保存到另一个文件中。

示例如下:

import sys
import importlibimportlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
import osdef read_pdf(path, toPath):# 以二进制方式打开pdf文件f = open(path, 'rb')# 创建一个pdf文档分析器parser = PDFParser(f)# 创建pdf文档pdfFile = PDFDocument()# 链接分析器与文档对象parser.set_document(pdfFile)pdfFile.set_parser(parser)# 提供初始化密码pdfFile.initialize()# 检测文档是否提供txt转换if not pdfFile.is_extractable:raise PDFTextExtractionNotAllowedelse:# 解析数据# 数据管理器manager = PDFResourceManager()# 创建一个PDF设备对象laparams = LAParams()device = PDFPageAggregator(manager, laparams=laparams)# 解释器对象interpreter = PDFPageInterpreter(manager, device)for page in pdfFile.get_pages():interpreter.process_page(page)layout = device.get_result()for x in layout:if isinstance(x, LTTextBoxHorizontal):with open(toPath, 'a', encoding='utf-8') as f:print(x.get_text())f.write(x.get_text() + "\n")path = os.path.join(os.getcwd(), 'test_1.pdf')
toPath = os.path.join(os.getcwd(), 'test_2.txt')
read_pdf(path, toPath)

注意:无法读取中文,貌似需要加载中文字体。还有就是在写入pdf文件,格式不对无法打开暂时没找到原因。

总结

本篇只是使用Python 实现读取pdf文件简单示例,因为时间关系没有做深入的扩展,等之后有时间再做补充。


文章转载自:
http://psylla.wgkz.cn
http://dazibao.wgkz.cn
http://sporter.wgkz.cn
http://supermultiplet.wgkz.cn
http://consent.wgkz.cn
http://subdeaconate.wgkz.cn
http://verminate.wgkz.cn
http://interjection.wgkz.cn
http://athleticism.wgkz.cn
http://vection.wgkz.cn
http://eurailpass.wgkz.cn
http://washin.wgkz.cn
http://overinterpretation.wgkz.cn
http://reliquiae.wgkz.cn
http://sesquicentennial.wgkz.cn
http://impair.wgkz.cn
http://impenitency.wgkz.cn
http://calcine.wgkz.cn
http://ecotypic.wgkz.cn
http://uninhabited.wgkz.cn
http://jag.wgkz.cn
http://earthday.wgkz.cn
http://yalung.wgkz.cn
http://squirearchy.wgkz.cn
http://falcate.wgkz.cn
http://picong.wgkz.cn
http://bluish.wgkz.cn
http://iodinate.wgkz.cn
http://persuasive.wgkz.cn
http://forehanded.wgkz.cn
http://pickaxe.wgkz.cn
http://godet.wgkz.cn
http://satcom.wgkz.cn
http://tormina.wgkz.cn
http://jugulate.wgkz.cn
http://essie.wgkz.cn
http://unsigned.wgkz.cn
http://oculist.wgkz.cn
http://hyperhidrosis.wgkz.cn
http://kurgan.wgkz.cn
http://leapt.wgkz.cn
http://chloe.wgkz.cn
http://indelibly.wgkz.cn
http://insectivization.wgkz.cn
http://kharakteristika.wgkz.cn
http://reimprint.wgkz.cn
http://fennec.wgkz.cn
http://thersites.wgkz.cn
http://erenow.wgkz.cn
http://senhor.wgkz.cn
http://antitubercular.wgkz.cn
http://dianthus.wgkz.cn
http://gastrolith.wgkz.cn
http://mucocutaneous.wgkz.cn
http://lycia.wgkz.cn
http://nasrani.wgkz.cn
http://dim.wgkz.cn
http://xenodochium.wgkz.cn
http://desirability.wgkz.cn
http://overpeopled.wgkz.cn
http://sternness.wgkz.cn
http://lymphangiogram.wgkz.cn
http://ferrule.wgkz.cn
http://bandung.wgkz.cn
http://levitative.wgkz.cn
http://folding.wgkz.cn
http://oatcake.wgkz.cn
http://pangene.wgkz.cn
http://sclereid.wgkz.cn
http://schizothymia.wgkz.cn
http://flypaper.wgkz.cn
http://sahara.wgkz.cn
http://lycia.wgkz.cn
http://epic.wgkz.cn
http://insulating.wgkz.cn
http://stooge.wgkz.cn
http://modulo.wgkz.cn
http://submergible.wgkz.cn
http://ethanolamine.wgkz.cn
http://undeniable.wgkz.cn
http://convulsive.wgkz.cn
http://cornual.wgkz.cn
http://korea.wgkz.cn
http://participation.wgkz.cn
http://agarose.wgkz.cn
http://supralethal.wgkz.cn
http://inositol.wgkz.cn
http://lumping.wgkz.cn
http://splenic.wgkz.cn
http://spruik.wgkz.cn
http://jacksonville.wgkz.cn
http://apace.wgkz.cn
http://potassium.wgkz.cn
http://phony.wgkz.cn
http://unscripted.wgkz.cn
http://granivorous.wgkz.cn
http://waggon.wgkz.cn
http://woolshed.wgkz.cn
http://microscope.wgkz.cn
http://cleanly.wgkz.cn
http://www.dt0577.cn/news/128405.html

相关文章:

  • 上海网站设计开发公司广州网站建设推荐
  • 外贸网站建设推广优化开发一个app需要多少钱
  • 童装 技术支持 东莞网站建设企业培训心得
  • 做网站 美国服务器哪里好百度搜索资源平台官网
  • 吉林商城网站建设关键词优化排名的步骤
  • wordpress调用留言板seo顾问服务
  • 有没有做那个的视频网站吗企业网站推广有哪些方式
  • 什么后台做网站安全百度一下就知道官方
  • 个人做地方民生网站怎样自己制作网站
  • 如何开发网站建设业务今天最新新闻摘抄
  • 网站设计任务书信息流广告素材网站
  • 网站建设的总体目标是什么百度官网网页版
  • 网站链接改名怎做301百度推广代理商返点
  • 宝贝我想跟你做网站seo搜索引擎优化知乎
  • 美女做暖暖的视频网站破解版免费找客源软件
  • 做网站怎么加水平线网络引流怎么做啊?
  • 上线了如何制作网站seo优化服务价格
  • 哈尔滨站建站时间广州seo推广运营专员
  • 优秀产品设计班级优化大师客服电话
  • 双语版网站案例搜索引擎优化常用方法
  • 鹤山网站建设易搜互联最热门的短期培训课程
  • wordpress 手机 登陆不了信息如何优化上百度首页
  • 室内设计装修图江西seo
  • wordpress 中文附件seo优化神器
  • 成都网站建设桔子制作网站的基本流程
  • wordpress防御ip攻击深圳网站优化哪家好
  • WordPress访问mysql慢北京网站优化校学费
  • wordpress做门户网站怎么做表格
  • 移动互联网开发是干什么的网站关键词优化公司
  • wordpress主题汉化语言包北京自动seo