Aspose.OCR Фото в Текст для .NET

Aspose.OCR Photo to Text для .NET позволяет разработчикам экстрактировать текст из фотографий, снятых камерами или смартфонами.Построенный на доказавшемся двигателе асфосе.ОКР, этот плагин применяет передовые фильтры до обработки — такие как коррекция поворота, компенсация искажений и подача шума — для предоставления высокоточного распознавания даже на скрытых, низкоконтрастных или шумных изображениях.

Инсталляция и установка

Начинать это очень просто:

Пример: Извлечение текста из фотографий

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;

// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Особенности и функции

Передовые фильтры предварительной обработки

  • Роттирование и коррекция скеута : автоматически направляет напечатанные фотографии.
  • Компенсация расстройства : корректирует объективы-индуцированные артефакты и перспективный варпинг.
  • Уменьшение шума : подавляет зеркалы, пыль и компрессионные артефакты.
  • Контраст и настройка яркости : Оптимизирует освещение для глупых или переизложенных изображений.

Устойчивый текстовый Recognition Engine

  • Многоязычные OCR (латинские, кириллические, арабские и CJK скрипты).
  • Фронто-агностическая детекция, поддерживающая печатный текст, подпись и сканирование.
  • Автоматическая сегментация сценариев на смешанных языковых страницах.
  • Признание цифр, символов и пунктуации с конфигурируемыми лимитами.

Анализ расположения и сегментация

  • Автоматическое обнаружение текстовых блоков по сравнению с графиками или таблицами.
  • Сегментация колонны и линии сохраняет естественный порядок чтения.
  • Зонный ОКР для целей конкретных регионов.

Формат выхода и извлечение данных

  • экспорт плоского текста, структурированных объектов, или JSON Координаты граничного ящика.
  • Остановите линейные оценки доверия для валидации.
  • Generate PDF или текстовые выходы непосредственно для низкого потока использования.

Бач и параллельная обработка

  • Параллельное распознавание с использованием .NET async/await.
  • Управление качеством для масштабных рабочих нагрузок.
  • Помощь в отмене долгосрочных задач.

Приспособление и расширение

  • Определите персонализированные фильтровые трубы.
  • Добавьте словари или словары для повышения точности.
  • Вход в события распознавания для регистрации или промежуточного осмотра.

Эффективность Tuning

  • Настройка резолюции и цветовой глубины для баланса между скоростью и точностью.
  • Скачать предварительно обработанные буферы при работе с повторяемыми шаблонами.
  • Профильные трубопроводные стадии для изоляции бутылок.

Советы и лучшие практики

  • Заранее выбранные или посевные регионы интересов для минимизации времени обработки.
  • Проверка параметров фильтра на представительных образцах перед внедрением.
  • Используйте оценки доверия, чтобы построить потоки падения или человеческой валидации.
  • Для мобильных фотографий обеспечить правильное освещение и контрастные фоны.
  • Мониторинг использования памяти с батареями; применить токены отмены, когда это необходимо.
  • Комбинировать экспорт JSON с услугами валидации для создания прочных трубопроводов данных.

Часто задаваемые вопросы

**Необходимо ли уточнить язык?**По умолчанию, плагин автоматически выявляет многие языки. Тем не менее, четко настроенный язык улучшает точность для скриптов, таких как кириллический, китайский или хиндийский.

**Какие форматы поддерживаются?**JPEG, PNG, TIFF, PDF и другие популярные форматы из сканеров или камер. Результаты могут быть экспортированы как плоский текст, HTML, Word, pdf, JSON или XML.

**Как я могу добиться лучших результатов?**Используйте высококачественные изображения из сканеров или современных камер. Встроенные фильтры улучшают качество изображений до распознавания.

 Русский