Aspose.OCR Фото в текст для .NET
Aspose.OCR Photo to Text для .NET дозволяє розробникам витягувати текст з фотографій, знятих камерами або смартфонами. побудований на перевіреному двигуні аспозе.ОКР, цей плагін застосовує передові фільтри до обробки — такі як корекція ротації, компенсація деформації та усунення шуму — для надання високої точності розпізнавання навіть на скейованих, низькоконтрастних або шумних зображеннях.
Інсталяція та установка
Почати це дуже просто:
- Завантажити пакет Aspose.OCR через NuGet або з завантаженого дистриб’ютора.See Встановлення За детальні інструкції.
- Налаштуйте розмірну ліцензію на стартапі, щоб розблокувати повну функціональність.Зверніть увагу Ліцензування за використанням для встановлення етапів.
Приклад: Витяг тексту з фотографій
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Особливості та функції
Прогресивні фільтри попереднього обробки
- Ротація і корекція скеу : Автоматично випрямлюють зображення.
- Дістораційна компенсація : виправдовує лінзово-індуковані артефакти та перспективний варпінг.
- Зниження шуму : пригнічує дзеркала, пил і компресійні артефакти.
- Контраст і яскравість Адаптація : Оптимізує освітлення для темних або надмірних зображень.
Розумний двигун розпізнавання тексту
- багатомовний ОКР (латинський, цирильний, арабський і CJK скрипти).
- Фронт-агностична детекція, що підтримує друкований текст, підпис і сканування.
- Автоматична сегментація скриптів на змішаних мовних сторінках.
- Визначення чисел, символів і пунктуації з конфігуративними межами.
Аналіз та сегментація
- Автоматичне виявлення текстових блоків порівняно з графіками або таблицями.
- Сегментація стовбурів і ліній зберігає природний порядок читання.
- Зонно-базований ОКР для об’єкції конкретних регіонів.
Вихідні формати та екстракція даних
- експортувати прямий текст, структуровані об’єкти, або JSON Координати обмежувальної коробки.
- Відновлюйте лінійно-лінійні результати довіри для валідації.
- Generate ПДФ або текстові виходи безпосередньо для низького потоку використання.
Батч і паралельна обробка
- Паралельна розпізнавання за допомогою .NET async/await.
- Квіте управління для великих робочих навантажень.
- Звільнення підтримки для довгострокових завдань.
Налаштування та розширення
- Використовуйте спеціальні фільтрові труби.
- Додайте словники або речення, щоб поліпшити точність.
- Введіть в події розпізнавання для реєстрації або посередницької інспекції.
Використання Tuning
- Налаштуйте розчин і кольорову глибину для балансу швидкості і точності.
- Сховати заздалегідь оброблені буфери при роботі з повторними шаблонами.
- Профільні трубопровідні стадії для ізоляції пляшок.
Традиції та найкращі практики
- Заздалегідь вибрані або урожаю зони інтересу для мінімізації часу обробки.
- Перевірка параметрів фільтра на представницьких зразках перед запуском.
- Використовуйте результати довіри, щоб побудувати падіння або потоки людської валідації.
- Для мобільних фотографій забезпечити правильне освітлення та контрастний фон.
- Слідкуйте за використанням пам’яті з батальйонами; застосовуйте токені скасування, коли це необхідно.
- Комбінуйте експорт JSON з послугами валідації для побудови міцних трубопроводів даних.
Часто задавані запитання
**Чи потрібен визначення мови?**За замовчуванням, плагін автоматично виявляє багато мов. однак, чітко встановлюючи мову, поліпшується точність для скриптів, таких як кирилійська, китайська або індійська.
**Які формати підтримуються?**JPEG, PNG, TIFF, PDF, та інші популярні формати з сканерів або камер. Результати можна експортувати як прямий текст, HTML, Word, pdf, JSON, або XML.
**Як я можу досягти найкращих результатів?**Використовуйте високоякісні зображення з скенерів або сучасних камер. Вбудовані фільтри підвищують якість образу перед розпізнаванням.