本页内容
PDF 转 Excel
概述
ComPDFKit Conversion SDK 支持将 PDF文档转换为 Microsoft Excel 格式(.xlsx)。通过从 PDF 中提取、解析数据并将其导入 Excel 以方便用户进一步编辑、分析或共享 Excel 文件。此功能有助于提高工作效率,减少手动输入错误并简化复杂的文档处理任务。
设置 Excel 文件内容选项
将 PDF 文件转换为 Excel 文件时需要注意以下两个选项的设置,它将直接影响写入 Excel 文件的内容。
- 容选项:
如果设置worksheetOptions
选项,则只会将文本内容写入 Excel 文件而不包含表格内容。
- 工作表选项:
选项 | 描述 |
---|---|
CPDFConvertExcelWorksheetForEachTable | 一个表格对应一个 sheet 文件。 |
CPDFConvertExcelWorksheetForEachPage | 一个 PDF 页面对应一个 sheet 文件。 |
CPDFConvertExcelWorksheetForTheDocument | 整个 PDF 文档对应一个 sheet 文件。 |
注意事项
- 为了得到更好的转换效果,建议开启 OCR 或者版面分析选项。
- 当开启 OCR 选项时,
isContainOCRBgImage
将为无效选项。
示例
以下是完整的示例代码,演示了如何将 PDF 文档转换为 Excel 文档。
objective-c
// 获取 PDF 文件的路径。
NSString *pdfPath = @"...";
// 获取 Excel 文件的路径。
NSString *outputPath = @"...";
CPDFConvertExcelOptions *options = [[CPDFConvertExcelOptions alloc] init];
[options setContentOptions:CPDFConvertExcelContentAllContent];
[options setWorksheetOptions:CPDFConvertExcelWorksheetForEachPage];
// 设置 OCR 语言,只有当 IsAllowOCR 为 true 时才会生效。
[options setIsAllowOCR:YES];
// 转换时是否包含图像,只有当 IsAllowOCR 为 false 时才会生效。
[options setIsContainImages:NO];
// 设置是否包含背景图片,只有当 IsAllowOCR 为 true 时才会生效。
[options setIsContainOCRBgImage:NO];
// 转档时是否包含注释。
[options setIsContainAnnotations:NO];
// OCR 语言为英语。
[options setLanguage:COCRLanguageEnglish];
CPDFConverterExcel *converter = [[CPDFConverterExcel alloc] initWithURL:[NSURL fileURLWithPath:pdfPath] password:nil];
[converter convertToFilePath:outputPath pageIndexs:nil options:options];