文档比较器

Aspose.Words Document Comparer for .NET 为开发者提供了一个强大的工具来 比较两个 Word 文档并生成修订 突出显示每个检测到的差异。无论是法律、技术还是编辑审阅,此插件都能在您的 .NET 应用程序中直接准确跟踪文本编辑、格式更改和结构修改。.

安装与设置

  1. 安装 NuGet 包 Aspose.Words for .NET 到您的项目中。.
  2. 在应用启动时应用计量授权( 计量授权指南 ).
  3. 查看 安装指南 以获取先决条件和详细步骤。.

支持的环境::

  • OS: Windows、Linux、macOS
  • 框架:: .NET 框架, .NET 标准, .NET 核心, .NET 5/6+, Mono
  • 集成开发环境:: Visual Studio 2017–2026, JetBrains Rider, MonoDevelop.

支持的格式: DOC、DOCX、RTF、DOT、DOTX、DOTM、DOCM、Word 2003 XML 和 Word 2007 XML。.

快速入门:在 .NET 中比较文档

using Aspose.Words;
using Aspose.Words.Comparing;
string MyDir = @"./";


var docA = new Document(MyDir + "Blank.docx");
var docB = new Document(MyDir + "Document.docx");

// Compare documents. Differences are added as revisions to docA
docA.Compare(docB, "User", DateTime.Now, new CompareOptions { IgnoreFormatting = true });

// Inspect revisions
foreach (Revision revision in docA.Revisions)
{
    Console.WriteLine("Type: " + revision.RevisionType);
    Console.WriteLine("Author: " + revision.Author);
    Console.WriteLine("Date: " + revision.DateTime);
    Console.WriteLine("Revision text: " + revision.ParentNode.ToString(SaveFormat.Text));
}

此代码片段演示了比较两个文档并遍历生成的修订版。.

功能与特性

核心文档比较

  • 比较 DOC、DOCX、RTF 等格式。.
  • 将第二个文档中的插入、删除和格式更改插入到第一个文档中。.
  • 保留原始内容并应用 Word 熟悉的 跟踪更改 样式。.

修订跟踪与管理

  • 将修订分类为插入、删除或格式更改。.
  • 支持以编程方式接受/拒绝操作。.
  • 允许迭代以生成自定义报告或摘要。.

自定义比较设置

  • 切换大小写敏感性。.
  • 选择是否跟踪空白字符的更改(空格、制表符、换行)。.
  • 控制比较粒度:字符、单词或段落级别。.
  • 跳过诸如注释、书签或标题等节点。.

元素级比较

  • 文本:: 检测添加、删除和移动的文本。.
  • 格式化:: 识别字体、段落和样式的更改。.
  • 表格:: 跟踪行/列的插入、删除以及单元格的合并/拆分。.
  • 对象:: 标记已插入、已删除或已重新定位的图像、形状和 OLE 对象。.

性能与可扩展性

  • 基于流的 API 允许高效比较非常大的文档。.
  • 支持多线程比较以进行批处理。.
  • 可配置的内存占用,并提供加载和保存选项。.

最佳实践

  • 及早应用许可以避免评估消息。.
  • 在比较之前规范化文档(样式,删除修订痕迹)。.
  • 调整空白字符/大小写敏感性以减少误报。.
  • 使用 Revisions 用于结构化更改日志的集合。.
  • 对于批量工作负载,请异步运行比较并管理并发。.

常见问题排查

  • 出现意外结果或缺少更改?? ✔ 检查文档完整性和格式一致性。.
  • 评估水印或功能受限?? ✔ 确保许可证已正确应用。.
  • 处理大型文档时性能缓慢?? ✔ 在可能的情况下使用基于流的 API 并启用并行处理。.

常见问题

  1. Q: Aspose.Words Document Comparer for .NET 是什么?? 用于检测文档之间差异并将其作为修订供审阅的插件。.
  2. Q: 支持哪些文件格式?? DOC、DOCX、RTF、DOT、DOTX、DOTM、DOCM、Word 2003 XML 和 Word 2007 XML。.
  3. Q: 我可以以编程方式接受或拒绝修订吗?? 是的。API 支持批量或单独接受/拒绝修订。.
  4. Q: 这如何与 Aspose.Words 集成?? 它直接与 Aspose.Words 文档对象协同工作,确保与现有工作流的无缝集成。.
  5. Q: 哪些行业受益于此工具?? 法律、金融、出版和企业部门使用它进行审计、合规和编辑审查。.
 中文