Aspose.OCR Снимка за текст за .NET
Aspose.OCR Photo to Text за .NET позволява на разработчиците да извличат текст от снимки, заснети от камери или смартфони.Сграден върху доказания двигател на аспосе.ОКР, този плъгин прилага напреднали филтри за предварителна обработка - като например корекция на ротацията, компенсация за деформация и суспензия на шума - за да осигури високоточност на разпознаване дори на скеирани, нискоконтрастни или шумни изображения.
Инсталация и инсталиране
Да започнеш е просто:
- Инсталирайте пакета Aspose.OCR чрез NuGet или от изтеглена дистрибутивна.See инсталация За подробни инструкции.
- Конфигурирайте измерваната лиценза в стартапа, за да отключите пълната функционалност.Позовавам се на Размер на лицензията За стъпките на установяване.
Пример: Извличане на текст от снимки
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Характеристики и функционалности
Прогресивни филтри за предварителна обработка
- Ротация и корекция на скеуто : Автоматично премахва запечатаните снимки.
- Компенсация за разтоварване : коригира обективно индуцираните артефакти и перспективното заваряване.
- Снижение на шума : Потиска спекули, прах и компресионни артефакти.
- Контраст и настройка на яркостта : Оптимизира осветлението за мръсни или прекомерно изложени изображения.
Мотор за препознаване на текст
- Многоезични OCR (латински, кирилически, арабски и CJK скрипти).
- Фронто-агностична детекция, която поддържа печатния текст, сигнализацията и сканирането.
- Автоматично сегментиране на скриптове на смесени езикови страници.
- Разпознаване на числа, символи и точки с конфигурирани граници.
Анализ на слоевете и сегментация
- Автоматично откриване на текстови блокове срещу графики или таблици.
- Сегментацията на колоната и линията запазва естествения ред на четенето.
- ОКР на базата на зони за насочване на конкретни региони.
Изходни формати и извличане на данни
- Износ на плосък текст, структурирани обекти, или JSON Координати за гранична кутия.
- Повторно възстановяване на линията-по-линията на доверието за валидиране.
- Generate ПДФ или текстови изходи директно за използване в долния поток.
Батч и паралелна обработка
- Паралелно разпознаване с помощта на .NET async/await.
- Управление на тежести за мащабни работни натоварвания.
- Отмяна на поддръжката за дългосрочни задачи.
Приспособяване и разширяване
- Определете персонализирани филтрирани тръби.
- Добавете речници или речник, за да подобрите точността.
- Включете се в събития за разпознаване за регистрация или междинна инспекция.
Изпълнение Tuning
- Резолюция и цветна дълбочина за баланс между скоростта и точността.
- Закрийте предварително обработени буфери, когато работите с повтарящи се шаблони.
- Профилни тръбопроводи за изолиране на бутилките.
Съвети и най-добри практики
- Предизбрани или култивирани региони на интерес, за да се намали времето за обработка.
- Изпитване на параметрите на филтъра върху представителни проби преди пускането.
- Използвайте резултатите за доверие, за да изградите паднали или човешки валидационни потоци.
- За мобилни снимки, осигурете подходящо осветление и контрастни фонтани.
- Мониторирайте използването на паметта с батерията; приложите токени за отмяна, когато е необходимо.
- Комбинирайте експорта на JSON с услугите за валидация, за да изградите солидни тръби за данни.
Често задавани въпроси
**Необходимо ли е да се посочи език?**По подразбиране, плагинът автоматично открива много езици. обаче, изрично задаване на езика подобрява точността на скрипти като кирилски, китайски или хинди.
**Какви формати се поддържат?**JPEG, PNG, TIFF, PDF и други популярни формати от скенери или камери. резултатите могат да бъдат експортирани като плосък текст, HTML, Word, pdf, JSON или XML.
**Как мога да постигна най-добрите резултати?**Използвайте висококачествени изображения от скенери или съвременни камери. Вградените филтри подобряват качеството на изображението преди разпознаване.