Aspose.OCR Фото в Текст для .NET
Aspose.OCR Photo to Text для .NET позволяет разработчикам экстрактировать текст из фотографий, снятых камерами или смартфонами.Построенный на доказавшемся двигателе асфосе.ОКР, этот плагин применяет передовые фильтры до обработки — такие как коррекция поворота, компенсация искажений и подача шума — для предоставления высокоточного распознавания даже на скрытых, низкоконтрастных или шумных изображениях.
Инсталляция и установка
Начинать это очень просто:
- Инсталляция пакета Aspose.OCR через NuGet или с загруженного дистрибьютора.See Инсталляция Для подробных инструкций.
- Настройка мерного лицензирования на стартапе, чтобы отключить полную функциональность.Реферат на Лицензирование с учетом объема потребления для установки шагов.
Пример: Извлечение текста из фотографий
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Особенности и функции
Передовые фильтры предварительной обработки
- Роттирование и коррекция скеута : автоматически направляет напечатанные фотографии.
- Компенсация расстройства : корректирует объективы-индуцированные артефакты и перспективный варпинг.
- Уменьшение шума : подавляет зеркалы, пыль и компрессионные артефакты.
- Контраст и настройка яркости : Оптимизирует освещение для глупых или переизложенных изображений.
Устойчивый текстовый Recognition Engine
- Многоязычные OCR (латинские, кириллические, арабские и CJK скрипты).
- Фронто-агностическая детекция, поддерживающая печатный текст, подпись и сканирование.
- Автоматическая сегментация сценариев на смешанных языковых страницах.
- Признание цифр, символов и пунктуации с конфигурируемыми лимитами.
Анализ расположения и сегментация
- Автоматическое обнаружение текстовых блоков по сравнению с графиками или таблицами.
- Сегментация колонны и линии сохраняет естественный порядок чтения.
- Зонный ОКР для целей конкретных регионов.
Формат выхода и извлечение данных
- экспорт плоского текста, структурированных объектов, или JSON Координаты граничного ящика.
- Остановите линейные оценки доверия для валидации.
- Generate PDF или текстовые выходы непосредственно для низкого потока использования.
Бач и параллельная обработка
- Параллельное распознавание с использованием .NET async/await.
- Управление качеством для масштабных рабочих нагрузок.
- Помощь в отмене долгосрочных задач.
Приспособление и расширение
- Определите персонализированные фильтровые трубы.
- Добавьте словари или словары для повышения точности.
- Вход в события распознавания для регистрации или промежуточного осмотра.
Эффективность Tuning
- Настройка резолюции и цветовой глубины для баланса между скоростью и точностью.
- Скачать предварительно обработанные буферы при работе с повторяемыми шаблонами.
- Профильные трубопроводные стадии для изоляции бутылок.
Советы и лучшие практики
- Заранее выбранные или посевные регионы интересов для минимизации времени обработки.
- Проверка параметров фильтра на представительных образцах перед внедрением.
- Используйте оценки доверия, чтобы построить потоки падения или человеческой валидации.
- Для мобильных фотографий обеспечить правильное освещение и контрастные фоны.
- Мониторинг использования памяти с батареями; применить токены отмены, когда это необходимо.
- Комбинировать экспорт JSON с услугами валидации для создания прочных трубопроводов данных.
Часто задаваемые вопросы
**Необходимо ли уточнить язык?**По умолчанию, плагин автоматически выявляет многие языки. Тем не менее, четко настроенный язык улучшает точность для скриптов, таких как кириллический, китайский или хиндийский.
**Какие форматы поддерживаются?**JPEG, PNG, TIFF, PDF и другие популярные форматы из сканеров или камер. Результаты могут быть экспортированы как плоский текст, HTML, Word, pdf, JSON или XML.
**Как я могу добиться лучших результатов?**Используйте высококачественные изображения из сканеров или современных камер. Встроенные фильтры улучшают качество изображений до распознавания.