아스포즈.OCR .NET용 사진에서 텍스트로

Aspose.OCR Photo to Text for .NET은 개발자가 카메라 또는 스마트 폰에 의해 캡처 된 사진에서 텍스트를 추출 할 수 있습니다.이 플러그인은 입증 된 ASPOSE.OKR 엔진에 기반을두고, 이 플러스는 고급 사전 처리 필터를 적용합니다 - 회전 수정, 방해 보상 및 소음 억제와 같은 - 심지어 스케이드, 낮은 대조, 또는 시끄러운 이미지에서도 높은 정확도 인식을 제공합니다.

설치 및 설정

시작하는 것은 간단합니다:

  • Aspose.OCR 패키지를 NuGet를 통해 또는 다운로드 된 분배기에서 설치합니다.See 설치 자세한 지침을 제공합니다.
  • Startup에서 측정된 라이센스를 설정하여 완전한 기능을 해제합니다.참조 계량된 라이선스 설정 단계에 대 한.

예: 사진에서 텍스트 추출

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;

// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

특징 및 기능

고급 사전 처리 필터

  • Rotation and Skew Correction : 자동으로 탭 된 사진을 정리합니다.
  • Distortion Compensation : 렌즈 유도된 예술물과 전망을 정리합니다.
  • 소음 감소 : 거울, 먼지 및 압축 물질을 억제합니다.
  • Contrast and Brightness Adjustment : 어두운 또는 과장된 이미지에 대한 조명을 최적화합니다.

강력한 텍스트 인식 엔진

  • 다중 언어 OCR (라틴어, 시릴리, 아랍어 및 CJK 스크립트).
  • 인쇄 된 텍스트, 서명 및 스캔을 지원하는 글꼴 진단 탐지.
  • 혼합 언어 페이지에 자동 스크립트 분할.
  • 숫자, 상징 및 조정 가능한 경계를 가진 점수를 인식합니다.

레이아웃 분석 및 분류

  • 그래픽 또는 테이블에 대 한 텍스트 블록의 자동 탐지.
  • 열 및 라인 분할은 자연적인 읽기 순서를 유지합니다.
  • 특정 지역을 대상으로 하는 지역 기반 OCR.

출력 형식 및 데이터 추출

  • 수출 평평한 텍스트, 구조화 된 개체, 또는 JSON 배경 상자 좌표를 사용합니다.
  • 인증을 위해 라인에 따라 신뢰 점수를 복구합니다.
  • Generate PDF에 대하여 또는 downstream 사용을 위해 직접 텍스트 출력.

배치 및 병렬 처리

  • NET async/await를 사용하여 동시 인식.
  • 광범위한 작업 부하를 위한 컨트롤 관리.
  • 오래 지속되는 작업에 대한 취소 지원.

사용자 정의 및 확장성

  • 사용자 지정 필터 파이프를 설정합니다.
  • 정확성을 향상시키기 위해 단어 또는 사전을 추가합니다.
  • 로그링 또는 중간 검사를 위한 인식 이벤트로 이동합니다.

성능 튜닝

  • 해상도 및 색상 깊이를 조정하여 속도와 정확도 사이의 균형을 유지합니다.
  • 반복되는 템플릿을 사용하는 동안 사전 처리 된 버퍼를 숨기십시오.
  • 프로필 파이프 라인 단계는 병을 고립시킵니다.

팁과 최고의 관행

  • 처리 시간을 최소화하기 위해 사전 선택 또는 묘목 관심 지역.
  • 실험하기 전에 대표적인 샘플에 필터 매개 변수를 테스트합니다.
  • 신뢰 점수를 사용하여 Fallback 또는 Human-validation 흐름을 구축합니다.
  • 모바일 사진을 위해, 적절한 조명과 대조 배경을 보장합니다.
  • 배치 실행과 함께 메모리 사용을 모니터링; 필요한 경우 취소 토큰을 적용합니다.
  • JSON 수출과 인증 서비스를 결합하여 강력한 데이터 파이프라인을 구축합니다.

자주 묻는 질문들

**언어를 정의하는 것이 필요합니까?**기본적으로 플러그인은 많은 언어를 자동으로 탐지합니다.그러나, 명시적으로 정의하는 것은 사이릴리어, 중국어 또는 힌두교와 같은 스크립트의 정확성을 향상시킵니다.

**어떤 형식이 지원되는가요?**JPEG, PNG, TIFF, PDF 및 스캐너 또는 카메라에서 다른 인기있는 형식. 결과는 평평한 텍스트, HTML, Word, pdf, JSON 또는 XML로 수출 될 수 있습니다.

**어떻게 최상의 결과를 얻을 수 있습니까?**스캐너 또는 현대 카메라에서 고품질의 이미지를 사용하십시오.내장된 필터는 인식 전에 이미지 품질을 향상시킵니다.

 한국어