아스포즈.OCR 인보이스를 .NET용 텍스트로 변환

Aspose.OCR Invoice to Text for .NET은 스캔 또는 촬영 된 청구서에서 구조화 된 텍스트의 추출을 단순화하도록 설계된 전문 플러그인입니다. 키 단계를 자동화함으로써 - 이미지 사전 처리, 배치 분석 및 OCR - 수수료 시스템, 데이터베이스 또는 지불 플랫폼에 직접 결과 데이터를 공급 할 수 있습니다 수동 재설정없이. 플러스는 아스포스와 동일한 고품질 오크리 코어를 제공합니다.

설치 및 설정

다음 단계를 따르고 프로젝트에 Aspose.OCR Invoice를 .NET 텍스트에 추가하십시오:

  • NuGet을 통해 설치하거나 Aspose 서버에서 패키지를 다운로드하십시오.더 자세한 지침은 설치 .
  • 평가 제한을 피하기 위해 응용 프로그램 스타트업에서 측정 된 라이센스를 설정합니다 계량된 라이선스 .

예: 청구서를 인식하는 방법

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

특징 및 기능

OCR 엔진 특정 청구서

  • 인쇄 및 사진 청구서에 대한 맞춤 인식 모델.
  • 다양한 해상도, 소음 수준 및 스케이 각도에 대한 높은 관용.
  • 동일한 문서 내에서 여러 언어와 디지털 스타일의 인식.

Image Preprocessing & 개선

  • 독서성을 향상시키기 위해 자동 분해, 분리 및 바이너리화 필터.
  • 청구서 라인과 테이블 경계를 유지하는 적응형 한도.
  • 밝기 및 대조 조정은 아래 또는 과도하게 노출 된 스캔을 처리합니다.

레이아웃 분석 및 테이블 검사

  • 헤더, 피터, 라인 항목 테이블 및 요약 블록의 자동 식별.
  • 라인, 열 및 세포 경계의 인식, 심지어 지배 라인이 약하거나 부족한 경우에도.
  • 둥근 테이블의 추출 (예를 들어, 부모 라인 항목 아래의 하위 요소).

키 가치 커플 추출

  • 설정할 수 있는 템플릿은 지도 필드 이름(예: “수수료 번호”, “Total Due”)에 OCR 결과를 제공합니다.
  • 역동적 인 라벨을 지원 - 템플릿의 엄격한 일치하는 대신 텍스트 근접성을 감지합니다.
  • 각 필드에 대한 신뢰 점수, 당신이 필터링 또는 재생 낮은 자신감 항목을 허용합니다.

수출 및 통합

  • 출력 형식: 평평한 텍스트, JSON, XML, PDF, Word 또는 HTML.
  • 이벤트 호크는 시리화 전에 원료 OCR 결과를 억제합니다.
  • 배치 처리 지원은 높은 볼륨 작업 부하를 위한 파라렐리즘 컨트롤을 제공합니다.

실수 처리 및 로그인

  • 일반적인 실패 모드에 대한 자세한 예외 메시지 (예: 지원되지 않은 이미지 형식, 라이센스 문제).
  • 인기있는 .NET 로그 프레임 워크와 호환되는 내장된 로그 인터페이스 (Serilog, NLog 및 log4net).
  • 파일 I/O 또는 메모리 할당 중의 전환 오류에 대한 철회 정책.

팁과 최고의 관행

  • 사전 인증된 이미지 해상도: 최상의 OCR 정확도를 위해, 300 DPI 이상의 이미지를 공급합니다.
  • 그레이 스케일 또는 색상 이미지를 사용하십시오 - 바이너리 단지 입력은 얇은 테이블 라인을 잃을 수 있습니다.
  • 데이터의 품질에 따라 신뢰 한계를 설정하십시오; 낮은 범위는 더 많은 데이터를 캡처하지만 다운로드 유효성을 필요로 할 수 있습니다.
  • 매우 큰 배치에서는 메모리 사용을 모니터링하고 플러그인의 처리 옵션을 통해 병렬성을 조정합니다.
  • 키 가치 템플릿 기능을 제거하여 예상된 청구서 배열을 냉동하십시오; 알려지지 않은 배치의 경우 일반 테이블 탐지에 다시 떨어집니다.
  • 항상 평가 모드 물표를 피하기 위해 OCR 방법을 호출하기 전에 측정 된 라이센스를 시작하십시오.

이러한 지침을 따르고 수수료 중심 능력을 활용함으로써 Aspose.OCR Invoice to Text for .NET 은 최소한의 수동 노력을 최적화하고 최대한 통과량을 향상시키는 신뢰할 수 있는 끝에서 끝까지 문서 처리 파이프라인을 구축할 수도 있습니다.

 한국어