Aspose.OCR Factura a Texto para .NET
Aspose.OCR Invoice to Text for .NET es un plug-in especializado diseñado para simplificar la extracción de texto estructurado de las facturas escaneadas o fotografiadas. Al automatizar los pasos clave —preprocesamiento de imágenes, análisis de layout, y OCR— se pueden alimentar los datos resultantes directamente a los sistemas de contabilidad, bases de datos, o plataformas de pago sin re-typing manual. El plugin aprovecha el mismo núcleo de alta calidad de OCR como Asposa.ocR, optimizado para las colocaciones de factura, tablas y pares de valores clave. Se reducirá el tiempo de procesamiento, se minimizará el error humano y se obtendrán resultados consistentes y precisos a escala.
Instalación y configuración
Siga estos pasos para agregar Aspose.OCR Invoice a Texto para .NET a su proyecto:
- Instalar a través de NuGet o descargar el paquete de los servidores de Aspose Instalación .
- Configure la licencia medida en la startup de la aplicación para evitar limitaciones de evaluación. ver Licenciamiento Medido .
Exemplos: Recogida de facturas
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Características y funciones
Motor de factura específico OCR
- Modelos de reconocimiento personalizados para las facturas impresas y fotografiadas.
- Alta tolerancia a las diferentes resoluciones, niveles de ruido y ángulos escudos.
- Reconocimiento de varios idiomas y estilos digitales dentro del mismo documento.
Preprocesamiento de imágenes y mejora
- Los filtros de desciframiento automático, despecle y binarización para mejorar la legibilidad.
- Un límite adaptativo que conserva las líneas de factura y los límites de la mesa.
- Ajustes de brillo y contraste para manejar escaneos sub- o sobre-expuestos.
Análisis de Layout y Detección de Mesa
- Identificación automática de los header, footer, tabla de artículos de línea y bloques de resumen.
- Reconocimiento de líneas, columnas y fronteras de células, incluso cuando las direcciones son débiles o faltan.
- Extracción de tablas nestas (por ejemplo, sub-elementos debajo de un elemento de línea materna).
Extracción de pares de valor clave
- Templates configurables para los nombres de campos de mapa (por ejemplo, “Número de factura”, “Total Due”) a los resultados de OCR.
- Apoyo a las etiquetas dinámicas – detecta la proximidad del texto en lugar de un ajuste estricto del modelo.
- La puntuación de confianza por campo, lo que le permite filtrar o reproducir artículos de baja confianza.
Exportación e integración
- Formatos de salida: texto plano, JSON, XML, PDF, Word o HTML.
- Los eventos pueden interceptar los resultados crudos de la OCR antes de serializar.
- Soporte de procesamiento de batch con controles de paralelismo para cargas de trabajo de alto volumen.
Errores de gestión y logging
- Mensajes de excepción detallados para los modos de fracaso comunes (por ejemplo, formato de imagen no soportado, problemas de licencia).
- Interfaz de registro integrada compatible con los populares cuadros de log .NET (Serilog, NLog y log4net).
- Políticas de retiro para errores transitorios durante el archivo I/O o la asignación de memoria.
Consejos y mejores prácticas
- Resolución de imagen pre-validada: para la mejor precisión OCR, proporciona imágenes a o más de 300 DPI.
- Utilice imágenes de escalera gris o de color - las entradas binarias únicamente pueden perder líneas de mesa finas.
- Tiene los límites de confianza según la calidad de sus datos; los barreros más bajos captan más datos pero pueden requerir validación de baja corriente.
- Para batches muy grandes, monitorizar el uso de la memoria y ajustar el paralelismo a través de las opciones de procesamiento del plug-in.
- Levante la característica de modelo de valor clave para congelar los deseos de factura esperados; para los diseños desconocidos, cae de vuelta en la detección de la tabla genérica.
- Siempre iniciar la Licencia Metrada antes de invocar cualquier método de OCR para evitar las marcas de agua de modo de evaluación.
Al seguir estas directrices y aprovechar sus capacidades centralizadas en la factura, Aspose.OCR Invoice to Text for .NET le permite construir pipelines de procesamiento de documentos fiables y de fin a fin, minimizando el esfuerzo manual y maximizándose el rendimiento.