当前位置: 首页 > news >正文

做视频网站服务器要求电商怎么做营销推广

做视频网站服务器要求,电商怎么做营销推广,青岛网站建设服务,网站建设工具有哪些品牌Python 实现读取pdf文件简单示例。 安装命令 需要安装操作pdf的三方类库,命令如下: pip install pdfminer3K 安装过程如下: 引入类库 需要引入很多的类库。 示例如下: import sys import importlib importlib.reload(sys)fr…

Python 实现读取pdf文件简单示例。

安装命令

需要安装操作pdf的三方类库,命令如下:

pip install pdfminer3K

安装过程如下:

引入类库

需要引入很多的类库。

示例如下:

import sys
import importlib
importlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import  PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed

 

读取pdf实现

实现步骤为:先通过二进制方式打开测试pdf文档,创建pdf文档解析测试文档内容,

最后读取文件内容,保存到另一个文件中。

示例如下:

import sys
import importlibimportlib.reload(sys)from pdfminer.pdfparser import PDFParser, PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal, LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
import osdef read_pdf(path, toPath):# 以二进制方式打开pdf文件f = open(path, 'rb')# 创建一个pdf文档分析器parser = PDFParser(f)# 创建pdf文档pdfFile = PDFDocument()# 链接分析器与文档对象parser.set_document(pdfFile)pdfFile.set_parser(parser)# 提供初始化密码pdfFile.initialize()# 检测文档是否提供txt转换if not pdfFile.is_extractable:raise PDFTextExtractionNotAllowedelse:# 解析数据# 数据管理器manager = PDFResourceManager()# 创建一个PDF设备对象laparams = LAParams()device = PDFPageAggregator(manager, laparams=laparams)# 解释器对象interpreter = PDFPageInterpreter(manager, device)for page in pdfFile.get_pages():interpreter.process_page(page)layout = device.get_result()for x in layout:if isinstance(x, LTTextBoxHorizontal):with open(toPath, 'a', encoding='utf-8') as f:print(x.get_text())f.write(x.get_text() + "\n")path = os.path.join(os.getcwd(), 'test_1.pdf')
toPath = os.path.join(os.getcwd(), 'test_2.txt')
read_pdf(path, toPath)

注意:无法读取中文,貌似需要加载中文字体。还有就是在写入pdf文件,格式不对无法打开暂时没找到原因。

总结

本篇只是使用Python 实现读取pdf文件简单示例,因为时间关系没有做深入的扩展,等之后有时间再做补充。

http://www.15wanjia.com/news/48620.html

相关文章:

  • 滨州正规网站建设公司培训网站有哪些
  • 手机怎么制作网址链接seo推广方案怎么做
  • 网站建设 美橙关键词排名查询官网
  • 刷网站排名软件windows优化大师是官方的吗
  • 艺美网站建设最新新闻摘抄
  • 商业网站建设案例笔记360手机助手
  • 网站一般用什么免费字体seo推广多少钱
  • 潍坊网站建设500百度智能云建站
  • 做网站首选科远网络口碑营销的前提及好处有哪些?
  • 做渔家乐哪个网站最好怎么注册网站免费的
  • 网站共用数据库国内seo工具
  • 学做卤菜网站网站建站哪家公司好
  • 找人做个网站大概多少钱一个域名大概能卖多少钱
  • 中山手机网站建设哪家好网站优化外包多少钱
  • 淘宝单页面网站阐述网络推广的主要方法
  • 如何做网站后台管理站长工具名称查网站
  • 南宁网站建设哪家seo值是什么意思
  • 郑州网站建设哪里好全网推广的方式有哪些
  • 廊坊seo管理seo实战论坛
  • 着力加强网站内容建设自己在家做电商
  • 建设旅游信息网站的好处阿里巴巴怎么优化关键词排名
  • wordpress oss图片潍坊seo培训
  • 免费做流程图的网站如何做网站优化
  • 软件开发外包网seo优化靠谱吗
  • 用github做网站推广一个产品有哪些方式
  • html编辑器的功能介绍怎么优化标题和关键词排名
  • 建设银行网站官网北京seo排名方法
  • 建设部科研申报网站用着不好seo推广系统
  • 南海网站建设央视新闻今天的内容
  • 传统建筑网站南昌seo招聘信息