当前位置：首页 > news >正文

网站网络营销推广制作建筑工程完工后移交情况说明

news 2025/9/7 7:31:38

网站网络营销推广制作,建筑工程完工后移交情况说明,htm网页设计,常德公司网站建设以下分别介绍基于 C 批量提取 PDF 里文字内容并导出到表格，以及批量给 PDF 文件改名的实现方案、步骤和应用场景。批量提取 PDF 文字内容并导出到表格应用场景文档数据整理：在处理大量学术论文、报告等 PDF 文档时，需要提取其中的关键信…

以下分别介绍基于 C++ 批量提取 PDF 里文字内容并导出到表格，以及批量给 PDF 文件改名的实现方案、步骤和应用场景。

批量提取 PDF 文字内容并导出到表格

应用场景

文档数据整理：在处理大量学术论文、报告等 PDF 文档时，需要提取其中的关键信息，如标题、作者、摘要等，并整理到表格中，方便后续的数据分析和比较。
信息归档：企业或机构可能有大量的合同、协议等 PDF 文档，需要将其中的重要条款、日期、金额等信息提取出来，存储到表格中进行统一管理和查询。

实现方案和步骤

1. 选择合适的库

Poppler：用于解析 PDF 文件并提取文字内容。Poppler 是一个开源的 PDF 渲染库，提供了 C++ 接口，可以方便地进行 PDF 文本提取。
LibXL：用于创建和操作 Excel 表格。它是一个跨平台的 C++ 库，支持创建、读取和修改 Excel 文件。

2. 安装依赖库

在 Linux 系统上，可以使用包管理器安装 Poppler 和 LibXL。例如，在 Ubuntu 上可以使用以下命令安装 Poppler：

bash

sudo apt-get install libpoppler-cpp-dev

对于 LibXL，需要从其官方网站下载库文件，并将其包含到项目中。

3. 编写代码

cpp

#include <iostream>
#include <fstream>
#include <vector>
#include <string>
#include <poppler/cpp/poppler-document.h>
#include <poppler/cpp/poppler-page.h>
#include "libxl.h"using namespace libxl;// 提取 PDF 文件中的文字内容
std::string extractTextFromPDF(const std::string& filePath) {poppler::document* doc = poppler::document::load_from_file(filePath);if (!doc || doc->is_locked()) {delete doc;return "";}std::string text;for (int i = 0; i < doc->pages(); ++i) {poppler::page* page = doc->create_page(i);if (page) {text += page->text().to_latin1();delete page;}}delete doc;return text;
}// 批量提取 PDF 文件内容并导出到 Excel 表格
void batchExtractPDFsToExcel(const std::vector<std::string>& pdfFiles, const std::string& outputFilePath) {Book* book = xlCreateBook();if (book) {Sheet* sheet = book->addSheet("PDF Text");if (sheet) {for (size_t i = 0; i < pdfFiles.size(); ++i) {std::string text = extractTextFromPDF(pdfFiles[i]);sheet->writeStr(i, 0, pdfFiles[i].c_str());sheet->writeStr(i, 1, text.c_str());}}book->save(outputFilePath.c_str());book->release();}
}int main() {std::vector<std::string> pdfFiles = {"file1.pdf","file2.pdf",// 添加更多 PDF 文件路径};std::string outputFilePath = "output.xlsx";batchExtractPDFsToExcel(pdfFiles, outputFilePath);return 0;
}

4. 编译和运行

使用以下命令编译代码：

bash

g++ -o extract_pdf extract_pdf.cpp -lpoppler-cpp -lxl

运行生成的可执行文件：

bash

./extract_pdf

批量给 PDF 文件改名

应用场景

文件整理：当从不同来源收集了大量 PDF 文件，文件名杂乱无章时，需要根据文件内容或特定规则对文件进行重命名，以便更好地管理和查找。
数据导入：在将 PDF 文件导入到某个系统或数据库时，要求文件名遵循一定的命名规范，此时需要对文件进行批量重命名。

实现方案和步骤

1. 选择合适的库

使用标准 C++ 库中的 <filesystem> （C++17 及以上）来处理文件和目录操作。

2. 编写代码

cpp

#include <iostream>
#include <filesystem>
#include <string>namespace fs = std::filesystem;// 批量给 PDF 文件改名
void batchRenamePDFs(const std::string& directoryPath) {int counter = 1;for (const auto& entry : fs::directory_iterator(directoryPath)) {if (entry.is_regular_file() && entry.path().extension() == ".pdf") {fs::path newPath = entry.path().parent_path() / (std::to_string(counter) + ".pdf");fs::rename(entry.path(), newPath);std::cout << "Renamed " << entry.path() << " to " << newPath << std::endl;++counter;}}
}int main() {std::string directoryPath = "./pdfs"; // 替换为实际的 PDF 文件目录batchRenamePDFs(directoryPath);return 0;
}

3. 编译和运行

使用以下命令编译代码：

bash

g++ -std=c++17 -o rename_pdf rename_pdf.cpp

运行生成的可执行文件：

bash

./rename_pdf

以上代码示例提供了基本的实现思路，你可以根据实际需求进行扩展和修改。

查看全文

http://www.15wanjia.com/news/168855.html

北京物流网站建设设计投稿网站

南通模板建站多少钱怎么创建一个空壳公司

安徽省所有建设类网站电商网站如何提高转化率

净化工程技术支持东莞网站建设聊天室网站模板

深圳外贸建站网络推广联客易贵阳企业网站模板

网站建设制作价格wordpress问答社区模板

网站取消备案公司建立网站流程图

湖南网站建设价格费用政务网站的建设方案

网站建站授权模板下载办公室装修设计连锁

徐州网站开发哪个好薇网站建设必会的软件有哪些

北京神州网站建设wordpress商城注册

网站目的什么网站可以销售自己的产品

深圳十大甲级装饰公司泰安网络推广seo

万润营销型网站建设代理服务器ip地址和端口号

免费申请qq号官网温州百度推广排名优化

网站建设画册设计杭州装修公司排名前十强

怎样创建基本的网站许昌河南网站建设

织梦网站建设教程微信公众号的网站超链接怎么做

网站建设技术服务合同如何用frontpage做网站

批量提取 PDF 文字内容并导出到表格

应用场景

实现方案和步骤

1. 选择合适的库

2. 安装依赖库

3. 编写代码

4. 编译和运行

批量给 PDF 文件改名

应用场景

实现方案和步骤

1. 选择合适的库

2. 编写代码

3. 编译和运行

相关文章：