아스포즈.OCR 인보이스를 .NET용 텍스트로 변환
Aspose.OCR Invoice to Text for .NET은 스캔 또는 촬영 된 청구서에서 구조화 된 텍스트의 추출을 단순화하도록 설계된 전문 플러그인입니다. 키 단계를 자동화함으로써 - 이미지 사전 처리, 배치 분석 및 OCR - 수수료 시스템, 데이터베이스 또는 지불 플랫폼에 직접 결과 데이터를 공급 할 수 있습니다 수동 재설정없이. 플러스는 아스포스와 동일한 고품질 오크리 코어를 제공합니다.
설치 및 설정
다음 단계를 따르고 프로젝트에 Aspose.OCR Invoice를 .NET 텍스트에 추가하십시오:
- NuGet을 통해 설치하거나 Aspose 서버에서 패키지를 다운로드하십시오.더 자세한 지침은 설치 .
- 평가 제한을 피하기 위해 응용 프로그램 스타트업에서 측정 된 라이센스를 설정합니다 계량된 라이선스 .
예: 청구서를 인식하는 방법
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);특징 및 기능
OCR 엔진 특정 청구서
- 인쇄 및 사진 청구서에 대한 맞춤 인식 모델.
- 다양한 해상도, 소음 수준 및 스케이 각도에 대한 높은 관용.
- 동일한 문서 내에서 여러 언어와 디지털 스타일의 인식.
Image Preprocessing & 개선
- 독서성을 향상시키기 위해 자동 분해, 분리 및 바이너리화 필터.
- 청구서 라인과 테이블 경계를 유지하는 적응형 한도.
- 밝기 및 대조 조정은 아래 또는 과도하게 노출 된 스캔을 처리합니다.
레이아웃 분석 및 테이블 검사
- 헤더, 피터, 라인 항목 테이블 및 요약 블록의 자동 식별.
- 라인, 열 및 세포 경계의 인식, 심지어 지배 라인이 약하거나 부족한 경우에도.
- 둥근 테이블의 추출 (예를 들어, 부모 라인 항목 아래의 하위 요소).
키 가치 커플 추출
- 설정할 수 있는 템플릿은 지도 필드 이름(예: “수수료 번호”, “Total Due”)에 OCR 결과를 제공합니다.
- 역동적 인 라벨을 지원 - 템플릿의 엄격한 일치하는 대신 텍스트 근접성을 감지합니다.
- 각 필드에 대한 신뢰 점수, 당신이 필터링 또는 재생 낮은 자신감 항목을 허용합니다.
수출 및 통합
- 출력 형식: 평평한 텍스트, JSON, XML, PDF, Word 또는 HTML.
- 이벤트 호크는 시리화 전에 원료 OCR 결과를 억제합니다.
- 배치 처리 지원은 높은 볼륨 작업 부하를 위한 파라렐리즘 컨트롤을 제공합니다.
실수 처리 및 로그인
- 일반적인 실패 모드에 대한 자세한 예외 메시지 (예: 지원되지 않은 이미지 형식, 라이센스 문제).
- 인기있는 .NET 로그 프레임 워크와 호환되는 내장된 로그 인터페이스 (Serilog, NLog 및 log4net).
- 파일 I/O 또는 메모리 할당 중의 전환 오류에 대한 철회 정책.
팁과 최고의 관행
- 사전 인증된 이미지 해상도: 최상의 OCR 정확도를 위해, 300 DPI 이상의 이미지를 공급합니다.
- 그레이 스케일 또는 색상 이미지를 사용하십시오 - 바이너리 단지 입력은 얇은 테이블 라인을 잃을 수 있습니다.
- 데이터의 품질에 따라 신뢰 한계를 설정하십시오; 낮은 범위는 더 많은 데이터를 캡처하지만 다운로드 유효성을 필요로 할 수 있습니다.
- 매우 큰 배치에서는 메모리 사용을 모니터링하고 플러그인의 처리 옵션을 통해 병렬성을 조정합니다.
- 키 가치 템플릿 기능을 제거하여 예상된 청구서 배열을 냉동하십시오; 알려지지 않은 배치의 경우 일반 테이블 탐지에 다시 떨어집니다.
- 항상 평가 모드 물표를 피하기 위해 OCR 방법을 호출하기 전에 측정 된 라이센스를 시작하십시오.
이러한 지침을 따르고 수수료 중심 능력을 활용함으로써 Aspose.OCR Invoice to Text for .NET 은 최소한의 수동 노력을 최적화하고 최대한 통과량을 향상시키는 신뢰할 수 있는 끝에서 끝까지 문서 처리 파이프라인을 구축할 수도 있습니다.