Converti la foto di Aspose.OCR in testo per .NET
Aspose.OCR Photo to Text per .NET consente agli sviluppatori di estrarre testo da foto catturate da telecamere o smartphone. Costruito sul provato motore ASPOSE.OKR, questo plugin applica filtri pre-processing avanzati – come la correzione della rotazione, la compensazione della distorsione e la soppressione del rumore – per fornire riconoscimento ad alta precisione anche su immagini scavate, a basso contrasto o rumorosa.
Installazione e Setup
Per iniziare è semplice:
- Installare il pacchetto Aspose.OCR tramite NuGet o da una distributiva scaricata.See Installazione per istruzioni dettagliate.
- Configurare la licenza misurata in startup per disattivare piena funzionalità.Si riferisce Licenza a consumo per i passaggi di configurazione.
Esempio: estrazione di testo dalle foto
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Caratteristiche e funzionalità
I filtri pre-processivi avanzati
- Rotazione e Skew Correction : Rimuove automaticamente le foto tagliate.
- Distortion Compensation : corregge gli oggetti indotti dalla lente e la prospettiva.
- Riduzione del rumore : sopprime gli specchi, la polvere e gli oggetti di compressione.
- Contrast and Brightness Adjustment : ottimizza l’illuminazione per immagini sottili o sovrapposate.
Il motore di riconoscimento del testo
- Multi-lingue OCR (scritti latino, cirillico, arabo e CJK).
- Detezione di font-agnostic che supporta testo stampato, segnalazione e scansioni.
- Segmentazione automatica di script su pagine di lingua mista.
- Riconoscimento di numeri, simboli e punteggiamento con soglie configurabili.
Layout Analisi e Segmentazione
- La rilevazione automatica dei blocchi di testo versus grafica o tabelle.
- La segmentazione della colonna e della linea conserva l’ordine di lettura naturale.
- OCR a base di zone per l’obiettivo delle regioni specifiche.
Formati di uscita e estrazione dei dati
- esportazione di testo piatto, oggetti strutturati, o di JSON con coordinate di bounding-box.
- Retrate line-by-line punteggio di fiducia per la validazione.
- Generate Il PDF o le uscite di testo direttamente per l’uso downstream.
Batch e trattamento parallelo
- Riconoscimento parallelo utilizzando .NET async/await.
- Gestione di quo per carico di lavoro su larga scala.
- Supporto di cancellazione per attività a lungo termine.
Customizzazione e estensibilità
- Definisci i filtri personalizzati.
- Aggiungi dizionari o vocabolari per migliorare l’accuratezza.
- Hook in eventi di riconoscimento per registrazione o ispezione intermedia.
Tuning di prestazioni
- Adattare la risoluzione e la profondità del colore per l’equilibrio tra velocità e precisione.
- Cache buffere pre-processate quando si lavora con modelli ripetuti.
- Stazioni di pipeline di profilo per isolare le bottiglie.
Suggerimenti e migliori pratiche
- Regioni pre-selezionate o coltivate di interesse per ridurre al minimo il tempo di elaborazione.
- Prova dei parametri del filtro sui campioni rappresentativi prima del lancio.
- Utilizzare i punteggi di fiducia per costruire flussi di fallback o di validazione umana.
- Per le foto mobili, assicuratevi adeguata illuminazione e sfondo contrastante.
- Monitorare l’uso della memoria con batch run; applicare i token di cancellazione se necessario.
- Combina l’esportazione JSON con i servizi di validazione per costruire tubi dati robusti.
Domande frequenti
**È necessario specificare un linguaggio?**Per impostazione predefinita, il plugin rileva automaticamente molte lingue. tuttavia, la configurazione esplicita del linguaggio migliora l’accuratezza per script come Cyrillic, cinese, o hindi.
**Quali formati sono supportati?**JPEG, PNG, TIFF, PDF, e altri formati popolari da scanner o telecamere. i risultati possono essere esportati come testo piatto, HTML, Word, pdf, JSON, o XML.
**Come posso ottenere i migliori risultati?**Utilizzare immagini di alta qualità da scanner o moderne telecamere. i filtri incorporati migliorano la qualità dell’immagine prima della rilevazione.