当需要将 PDF 文件中的文本内容提取出来,以便进行后续的数据分析、文本挖掘、信息检索等应用。使用 ComPDFKit Conversion SDK 可以轻松将 PDF 中的文本内容提取到 .txt 文件中。
以下是完整的示例代码,演示了如何将 PDF 文档转换为 .txt 文件。
ConvertOptions opt; // PDF 转 TXT。 PDFToOffice::StartPdfToTxt("txt.pdf", "password", "path/output", opt, progress);