Skip to content

PDF 转 Word

概述

PDF 转 Word 是一种将 PDF 格式文件转换为可编辑的 Word 格式文件的操作。通过将 PDF 转换为 Word 文件,您可以轻松地编辑、修改文本、添加、删除文字或图片,轻松调整布局和格式等。

版面布局差异:

  • Word 文档的流式布局特性使得内容编辑变得灵活便捷,可以根据需要自由地在文档中流动和重新排列。然而,这种布局方式可能导致在不同设备或不同版本的 Word 程序中显示不一致,造成排版偏差。因此,流式布局特别适合于需要频繁更新内容的文件。
  • PDF 文件则以其固定的页面布局而著称,确保在任何设备上或打印时都能呈现一致且精确的外观。文件创建后,文字、图片和版面布局便被锁定,难以进行大规模编辑,从而保证了文件内容的稳定性。这使得 PDF 格式非常适合用于更正式的场合,如商务报告、电子官文、电子票据和电子证件等领域。

示例

以下是完整的示例代码,演示了将 PDF 文档转换为 docx 文档。

c#
string inputFilePath = "***";
string outputFolderPath = "***";
string outputFileName = "***";

CPDFConverterWord converter = CPDFConvertFactroy.CreateConverter(CPDFConvertType.CPDFConvertTypeWord,inputFilePath) as CPDFConverterWord;

CPDFConvertWordOptions wordOptions = new CPDFConvertWordOptions();
wordOptions.IsAllowOCR = false;
wordOptions.IsContainAnnotations = true;
wordOptions.IsContainImages = true;
wordOptions.LayoutOpts = LayoutOptions.RetainPageLayout;

int pageCount = converter.GetPagesCount();
int[] pageArray = new int[pageCount];
for (int i = 0; i < pageArray.Length; i++)
{
    pageArray[i] = i + 1;
}

ConvertError error = ConvertError.ERR_UNKNOWN;
converter.Convert(outputFolderPath, ref outputFileName, wordOptions, pageArray, ref error, getPorgress);