Aspose.OCR Преобразование отсканированного изображения в текст для .NET
Aspose.OCR Scanned Image to Text для .NET позволяет разработчикам извлечь текст из изображений, содержащих большое количество структурированного контента — сканированные контракты, соглашения, страницы книг, статьи, газеты и многое другое, сохраняя верность расположения (в том числе многосторонние потоки.
Инсталляция и установка
Чтобы добавить Aspose.OCR Scanned Image в текст для .NET в свой проект, установить пакет NuGet и настроить измеренную лицензию:
- Инсталляция через NuGet (см. подробные шаги): Инсталляция
- Умеренное лицензирование перед первым использованием: Лицензирование с учетом объема потребления После установки, просто обратитесь к названию Aspose.OCR в файлах кода.
Особенности и функции
Точный текст экстракции
Основная OCR-мотор применяет передовые алгоритмы распознавания тонны для сканированных документов. Он анализирует пиксели, идентифицирует формы персонажа против встроенных обученных моделей, и производит текстовый выход Unicode. Точность оптимизируется для ввода высокого разрешения и чистых сканов.
Структурный анализ оформления документов
Помимо линий-по-линии записи текста, плагин распределяет структурные элементы — параграфы, заголовки, ноги и таблицы — сегментируя области изображения. признанные блоки сохраняют пространственные отношения, позволяя разработчикам воссоздать поток документов или применять персонализированную пост-процессию.
Мулти-колонный расположение распознавания
Скенируемые страницы часто используют форматы двух или трех колонн. ОКР-двигатель автоматически обнаруживает границы колоны, читает их в естественном порядке, а текстовые сегменты перемещаются в единый, правильно заказанный источник выхода.
Образование и улучшение изображения
Интегрированные рутины предварительной обработки улучшают успех распознавания на сложных сканах:
- Скеу-детекция и автоматическое отверстие
- Бинаризация (адаптивный лимит)
- Фильтры по снижению шума (соль и печень, гаусианское смазывание)
- Контраст и корректировки яркости Эти шаги могут быть взглянуты или персонализированы, чтобы соответствовать конкретным сценариям качества изображения.
Поддержка языка и характера
Несмотря на то, что он фокусируется на структурированных английских текстах, двигатель поддерживает многочисленные языки и наборы персонажей, соответствующие сканируемому юридическому, научному или техничественному контенту.
Настройки персонализированного распознавания
Опции фино-тунирования позволяют разработчикам балансировать скорость против точности:
- Пределы доверия к признанию характера и слова
- Способы сегментации страниц (одиночный блок, автоматический, рассеянный текст)
- Параметры разрешения для масштабирования входящих изображений
- Пользователь-дефинированные словары для повышения признания конкретных терминов домена
Формат выхода и обработка данных
Извлеченный текст может быть воспроизведен как прямые ленты Unicode или потоком в текстовые файлы. Для передовых сценариев, метаданные распределения (ограничные коробки, доверие баллов) подвергаются воздействию так, что приложения могут подчеркнуть или проверить признанные регионы.
Управление производительностью и ресурсами
Разработанный для обработки комплектов больших наборов изображений, плагин:
- минимизирует память с помощью стриминговых страниц
- Предлагает асинхронное распознавание АПИ для параллелизации рабочих нагрузок
- Показание тонирующих параметров для подсчета thread и размеров буфера
Безопасность и валюта
Все классы распознавания защищены thread-safe, позволяя одновременно выполнять задания OCR через несколько thread или синхронные звонки без блокирования конфликтов.
Помощь по лицензированию
ASPOSE.OCR Scanned Image to Text for .NET использует тот же измеренный модель лицензирования, что и продукты Aspose. Call the Metered.InitiateLicensing method at application startup to bind consumption to your subscription meter.
Советы и лучшие практики
- Начните с сканирования высокого качества (300 дПИ или выше) для максимальной точности.
- Препроцесс изображений для удаления шума и правильного скважины перед питанием в ОКР.
- Используйте настройки сегментации страницы, которые соответствуют сложности вашего расположения.
- Загрузить нужно только языковые пакеты; иностранные модели могут замедлить распознавание.
- Возможность асинхронного распознавания при обработке больших батарей для того, чтобы УИ был откликнутым.
- Следите за доверительными результатами и применяйте граничную валидацию или руководящий осмотр для критических документов.
- Имейте объекты двигателя OCR быстро, чтобы освободить неконтролируемые ресурсы.
- Отслеживайте и используйте дневный метр, чтобы избежать неожиданных нарушений квоты.