Aspose.OCR Foto a text per a .NET

Aspose.OCR Photo to Text per a .NET permet als desenvolupadors extreure text de les fotografies capturades per càmeres o smartphones. Construït en el motor de l’Aspose, aquest plugin aplica filtres avançats de pre-processament -com ara la correcció de la rotació, la compensació per la distorció i la supressió de soroll- per proporcionar reconeixement d’alta exactitud fins i tot en imatges escapades, de baix contrast o de ruïna.

Instal·lació i configuració

Començar és senzill:

  • Instal·la el paquet Aspose.OCR a través de NuGet o des d’un distributiu descarregat.See Instal·lació per a instruccions detallades.
  • Configure la llicència mesurada a la startup per desbloquejar tota la funcionalitat.Referència a Llicència Metrada per a les etapes de configuració.

Exemple: Extreure text de les fotos

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;

// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Característiques i funcionalitats

Filtres avançats de processament

  • Rotació i correcció d’esquena : Directament automàticament les fotografies incloses.
  • Compensació de distorció : Correcta els artefactes induïts per lents i la vaga de perspectiva.
  • Reducció de soroll : suprimirà els especles, la pols i els artefactes de compressió.
  • Contrast i ajustament de brillantor : Optimitza la il·luminació per a imatges fosques o sobreexposades.

El motor de reconeixement de text robust

  • Múltiples llengües OCR (escrits llatí, ciríl·lic, àrab i CJK).
  • Detecció de font-agnostic que dóna suport al text imprès, la signatura i els escans.
  • Segmentació automàtica d’escrits en pàgines de llenguatge mixt.
  • Reconeixement de nombres, símbols i puntuació amb límits configurables.

L’anàlisi i la segmentació

  • Detecció automàtica de blocs de text versus gràfics o taules.
  • La segmentació de columnes i línies conserva l’ordre de lectura natural.
  • OCR basada en zones per a l’objectiu de regions específiques.

Formats de sortida i extracció de dades

  • Exportació de text pla, objectes estructurats, o JSON amb les coordenades de botiga.
  • Recuperar puntuacions de confiança line per línia per a la validació.
  • Generate PDF o sortides de text directament per a l’ús de baix flux.

Batx i processament paral·lel

  • Reconeixement paral·lel utilitzant .NET async/await.
  • Gestió de quotes per a càrregues de treball a gran escala.
  • Suport de cancel·lació per a tasques de llarg termini.

Adaptació i extensibilitat

  • Definició de tubs de filtre personalitzat.
  • Afegir diccionaris o vocabularis per millorar l’exactitud.
  • Hook en esdeveniments de reconeixement per al logging o inspecció intermedi.

Tuning de les actuacions

  • Ajustar la resolució i la profunditat de color per a l’equilibri entre velocitat i precisió.
  • Cache buffers preprocessats quan treballen amb temples repetits.
  • Les etapes de pipeline de perfil per a a l’aïllament de les ampolles.

Consells i millors pràctiques

  • Pre-select o zones d’interès de cultiu per minimitzar el temps de processament.
  • Paràmetres de filtre de prova en mostres representatives abans de la implantació.
  • Utilitzar puntuacions de confiança per construir fluxos de fallback o de validació humana.
  • Per a les fotografies mòbils, assegureu-vos la il·luminació adequada i els fons contrastants.
  • Monitorar l’ús de la memòria amb les runes de batxillerat; aplicar els tokens d’anul·lació quan sigui necessari.
  • Combina l’exportació JSON amb els serveis de validació per construir tubs de dades robustos.

Preguntes freqüents

**És necessari especificar un llenguatge?**Per default, el plugin detecta automàticament moltes llengües. No obstant això, la configuració explícita del llenguatge millora l’exactitud per a escripts com Cyrillic, xinès, o hindi.

**Quins formats es donen suport?**JPEG, PNG, TIFF, PDF, i altres formats populars de scanners o càmeres. Els resultats es poden exportar com a text pla, HTML, Word, pdf, JSON, o XML.

**Com puc aconseguir els millors resultats?**Utilitza imatges d’alta qualitat dels escàners o les càmeres modernes. Els filtres incorporats milloren la qualitat de la imatge abans del reconeixement.

 Català