Aspose.OCR Table بهمتن برای .NET
Aspose.OCR Table to Text برای .NET یک پلاگین قدرتمند است که به توسعه دهندگان اجازه می دهد تا متن را از جدول های اسکن شده یا عکاسی با دقت بالا استخراج کنند.با استفاده از الگوریتم های پیشرفته یادگیری ماشین و شبکه های عصبی، ساختارهای جدول را شناسایی می کند، متن سطح سلولی را کشیده و همه چیز را به ساختار داده های جستجوگر، ویرایشگر یا جدول سازماندهی می شود.
نصب و نصب
برای شروع، بسته Aspose.OCR به متن را از طریق NuGet نصب کنید یا این مجموعه از سرورهای Aspose دانلود کنید نصب دستورالعمل برای مراحل دقیق.امکان عملکرد کامل با تنظیم مجوزهای اندازه گیری شده همانطور که در مجوز متریکی مستندات.
ویژگی ها و عملکردها
تشخیص میز و تشخیص ساختار
- به طور خودکار مرزهای میز را در تصاویر اسکن شده یا عکس گرفته تشخیص می دهد، حتی اگر سلول ها پوشیده، چرخیده یا نادرست درخشان باشند.
- پشتیبانی از طرح های چند قوس و چند ستون، جدول های نست و اندازه های مختلف سلول.
- ارائه یک نمایندگی سلسله ای از ردیف ها و سلول ها برای پس از پردازش ساده.
استخراج متن سلولی
- شناسایی متن در هر سلول با استفاده از الگوریتم های پیشرفته OCR، حفظ شکاف خط، سرمایه گذاری و فرمت اعداد.
- مدیریت چندین زبان در یک جدول با اولویت های زبان قابل تنظیم.
- اصلاح اختلالات مانند خرابی، کنتراست کم یا صدا تصویر برای افزایش دقت.
بازسازی و صادرات میز
- بازسازی جدول های شناسایی شده به ساختارهای داده .NET (به عنوان مثال DataTable) و یا صادرات آنها به فرمت های CSV / TSV.
- ایجاد فایل های صفحه نمایش قابل ویرایش (XLSX) که می تواند در اکسل یا سایر ابزارها باز شود.
- حفظ فرمت سلول های پایه (مطابق، مرزها) و هماهنگی های صادرات برای جریان های کار پیشرفته.
نتایج قابل جستجو و ویرایش
- ایجاد لایه های متن قابل جستجو در PDF صادرات، محتوای جدول را فهرست می کند.
- به طور کامل با Aspose.Cells برای عملیات های پیشرفته مانند فرمول ها و نمودار ادغام می شود.
- اجازه می دهد تا محتوای استخراج شده را در پایگاه داده ها یا لوله های پردازش پایین قرار دهد.
عملکرد و مقیاس پذیری
- بهینه سازی شده برای پردازش مجموعه ای از مجموعه های داده بزرگ با تنظیمات و مدیریت حافظه.
- جریان داده های تصویر به طور مستقیم به موتور OCR، به حداقل رساندن دیسک I / O.
- ارائه تماس های پیشرفته و توکن های لغو برای عملیات طولانی مدت.
Customization پیشرفته
- منطقه منافع (ROI) پشتیبانی برای محدود کردن تشخیص به مناطق خاص برای پردازش سریع تر.
- محدودیت های اعتماد قابل تنظیم برای فیلتر کردن نتایج کم اعتماد.
- هاک برای پیش پردازش و پس از آن (فیلترهای سفارشی، الگوریتم های تخلیه یا اعتباربخشی).
مثال: استخراج متن از جدول های اسکن شده یا عکس گرفته شده
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;
// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
موارد استفاده رایج
- استخراج داده های ساختاری از گزارش های مالی.
- تبدیل فرم ها و برنامه های اسکن شده به صفحه نمایش.
- اتوماسیون وظایف ورودی داده ها با تبدیل تصاویر جدول به فرمت های ویرایش پذیر.
راهنمایی ها و بهترین شیوه ها
- از تصاویر با حداقل 300 DPI و کنتراست خوب برای بهترین نتایج استفاده کنید.
- قبل از کاشت یا تخلیه تصاویر برای جدا کردن مناطق میز.
- فقط بسته های زبان مورد نیاز را برای کاهش استفاده از حافظه بارگذاری کنید.
- محدودیت های اعتماد به نفس را برای تعادل دقت و یادآوری تنظیم کنید.
- جدول های بازسازی شده را در برابر طرح های پیش بینی شده قبل از واردات به پایگاه داده ها تأیید کنید.
با پیروی از این دستورالعمل ها و استفاده از قابلیت های تشخیص جدول آن، Aspose.OCR Table to Text for .NET توسعه دهندگان را با یک راه حل قابل اعتماد برای تبدیل جدول های اسکن شده به متن ساختار یافته، قابل ویرایش و قابل جستجو فراهم می کند.