Aspose.OCR는 .NET용 스캔된 이미지를 텍스트로 변환합니다

Aspose.OCR Scanned Image to Text for .NET은 개발자가 스캔 된 계약, 협정, 책 페이지, 기사, 신문 등 많은 양의 구조화 된 콘텐츠를 포함하는 이미지에서 텍스트를 추출 할 수 있으며, 레이아웃 충성도를 유지합니다 (많은 열 흐름을 포함). 신뢰할 수있는 Asposa.ocR 엔진에 기반을두고,이 플러그인은 이미지 기반 문서를 단순히 문서로 변환하고, 다양한 입력 형식과 복잡한 배열을 높은 정확도로 처리합니다.

설치 및 설정

프로젝트에 Aspose.OCR 스캔 된 이미지를 .NET 텍스트에 추가하려면 NuGet 패키지를 설치하고 측정 된 라이센스를 설정합니다:

NuGet를 통해 설치 (세부 단계를 참조하십시오): 설치
첫 번째 사용 전에 측정 된 라이센스를 사용할 수 있습니다: 계량된 라이선스 설치 후 코드 파일에 Aspose.OCR 이름 공간을 참조하십시오.

특징 및 기능

정확한 텍스트 추출

핵심 OCR 엔진은 스캔 된 문서에 맞는 고급 인식 알고리즘을 적용합니다.그것은 픽셀을 분석하고, 내장된 훈련 된 모델에 대한 캐릭터 모양을 식별하며, Unicode 텍스트 출력을 생산한다.정확성은 고해상도 입력 및 깨끗한 스캐닝을 위해 최적화됩니다.

구조화된 문서 레이아웃 분석

라인에 따라 텍스트 캡처를 넘어서, 플러그인은 구조 요소 - 단락, 제목, 발자국 및 테이블 - 이미지 영역을 분류함으로써. 인식 된 블록은 공간 관계를 유지하여 개발자가 문서 흐름을 재구성하거나 사용자 지정 후 처리를 적용 할 수 있습니다.

Multi-Column Layout 인식

스캔된 페이지는 종종 두 개 또는 세 개의 열 형식을 사용합니다.OCR 엔진은 자동으로 열 경계를 감지하고, 자연 순서로 읽고, 텍스트 세그먼트를 단일, 올바르게 주문 된 출력 스트림으로 돌려줍니다.

이미지 사전 처리 및 개선

통합된 사전 처리 습관은 도전적인 스캔에서 인식 성공을 향상시킵니다:

Skew 탐지 및 자동 드라이브
바이너리화 (adaptive thresholding)
소음 감소 필터 (소금과 파이프, 가스 녹기)
대조 및 밝기 조정 이 단계는 특정 이미지 품질 시나리오에 맞게 조정되거나 사용자 지정될 수 있습니다.

언어 및 캐릭터 세트 지원

구조화 된 영어 텍스트에 초점을 맞추고 있지만, 엔진은 스캔 된 법적, 학문적 또는 기술적 콘텐츠와 관련된 여러 언어와 캐릭터 세트를 지원합니다.

사용자 정의 설정

Fine-tuning 옵션은 개발자가 정확성에 대한 균형 속도를 허용합니다:

성격과 단어 수용에 대한 신뢰의 한계
페이지 분할 모드 (싱글 블록, 자동, 스파르 텍스트)
Resolution Parameters to Scale 입력 이미지
사용자 정의 된 사전은 도메인 특정 용어의 인식을 향상시킵니다

출력 형식 및 데이터 처리

추출 된 텍스트는 평평한 Unicode 스트립으로 복구되거나 문자 파일로 스트리밍 될 수 있습니다. 고급 시나리오의 경우 배치 메타 데이터 (제한 상자, 신뢰 점수)가 노출되어 응용 프로그램이 인식 된 지역을 강조하거나 확인할 수 있도록합니다.

성과 및 자원 관리

큰 이미지 세트의 배치 처리를 위해 설계된 플러그인은 다음과 같습니다:

스트리밍 페이지를 통해 메모리 과잉을 최소화
비동기적 인 인식 API를 제공하여 작업 부하를 병렬화합니다
Thread count 및 buffer 크기에 대한 튜닝 매개 변수를 표시합니다

Thread 보안 및 통화

모든 인식 클래스는 테이프 안전으로 동시에 OCR 작업을 수행할 수 있으며, 여러 스트레드 또는 잠금 분쟁 없이 비동기화된 통화가 가능합니다.이것은 서버 측의 배치 또는 고전압 서비스에 이상적입니다.

미터 라이센스 지원

Aspose.OCR Scanned Image to Text for .NET은 ASPOSE 제품과 동일한 측정된 라이센스 모델을 사용합니다.

팁과 최고의 관행

정확도를 최대화하기 위해 고품질 스캔 (300 DPI 또는 그 이상)으로 시작합니다.
OCR에 영양을 공급하기 전에 소음과 올바른 스키를 제거하기 위해 사전 처리 이미지.
배열의 복잡성과 일치하는 페이지 분할 설정을 사용하십시오.
충전 필요한 언어 패키지 만; 외국 모델은 느린 인식 할 수 있습니다.
대형 배치를 처리 할 때 asynchronous 인식을 허용하여 UI를 응답하게 유지합니다.
신뢰 점수를 모니터링하고 중요한 문서에 대한 제한 기반 인증 또는 수동 검토를 적용합니다.
OCR 엔진 개체를 즉시 사용하여 관리되지 않은 자원을 자유롭게합니다.
예기치 않은 금액 위반을 피하기 위해 추적 및 로그 미터 사용.