Aspose.OCR แปลงรูปเป็นข้อความสำหรับ .NET

Aspose.OCR Photo to Text for .NET ช่วยให้ผู้พัฒนาสามารถ استخراجข้อความจากภาพถ่ายที่ถ่ายทอดโดยกล้องหรือสมาร์ทโฟน ที่สร้างขึ้นบนเครื่องยนต์ที่ได้รับการพิสูจน์แล้วของ ASPOSE.OKR ปลั๊กอินนี้ใช้ตัวกรองก่อนการประมวลผลขั้นสูงเช่นการแก้ไขการหมุนการตอบสนองความผิดปกติและการปิดผนึกเสียงเพื่อให้การรับรู้ความแม่นยําสูงแม้ในภาพที่สกปรกต่ําหรือเสียงรบกวน.

การติดตั้งและการตั้งค่า

เริ่มต้นเป็นเรื่องง่าย:

  • ติดตั้งแพคเกจ Aspose.OCR via NuGet หรือจากผู้จัดจําหน่ายที่ดาวน์โหลด.See การติดตั้ง สําหรับคําแนะนํารายละเอียด.
  • การตั้งค่าใบอนุญาตที่กําหนดไว้ใน startup เพื่อล็อคฟังก์ชั่นเต็มรูปแบบ.คําอธิบาย การให้ใบอนุญาตที่มีการวัด สําหรับขั้นตอนการตั้งค่า.

ตัวอย่าง: การสกัดข้อความจากภาพ

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;

// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

คุณสมบัติและฟังก์ชั่น

ตัวกรองการประมวลผลขั้นสูง

  • การหมุนและ Skew Correction : การแก้ไขรูปภาพแบบด้ายโดยอัตโนมัต.
  • การ kompensation distortion : ปรับผลลัพธ์ที่เกิดจากเลนส์และแนวโน้มการสั่นสะเทือน.
  • ลดเสียงรบกวน : ปิดกระจกฝุ่นและวัสดุการบีบอัด.
  • การปรับความต้านทานและความสว่าง : ปรับแสงที่เพิ่มขึ้นสําหรับภาพอ่อนหรืออ้างอิงเกินไป.

เครื่องตรวจจับข้อความที่แข็งแกร่ง

  • OCR หลายภาษา (Latin, Cyrillic, Arabic และ CJK scripts).
  • การตรวจจับตัวอักษรการวินิจฉัยที่สนับสนุนข้อความพิมพ์การลงชื่อและการสแกน.
  • การแบ่งปันสคริปต์อัตโนมัติบนหน้าภาษาผสม.
  • การรับรู้หมายเลขสัญลักษณ์และจุดหมายด้วยข้อ จํากัด ที่สามารถกําหนดได.

การวิเคราะห์ Layout และ Segmentation

  • การตรวจจับบล็อกข้อความอัตโนมัติเมื่อเทียบกับกราฟิกหรือตาราง.
  • การแบ่งคอลัมน์และเส้นรักษาคําสั่งการอ่านตามธรรมชาต.
  • พื้นที่ OCR สําหรับเป้าหมายภูมิภาคเฉพาะ.

รูปแบบการส่งออกและการ استخراجข้อมูล

  • การส่งออกข้อความแบนวัตถุโครงสร้างหรือ JSON ด้วยการกําหนดค่ากล่อง จํากัด.
  • รับคะแนนความไว้วางใจ line-by-line สําหรับการยืนยัน.
  • Generate คู่มือ PDF หรือส่งออกข้อความโดยตรงสําหรับการใช้งาน downstream.

การประมวลผลแบตช์และคู่มือ

  • การรับรู้แบบสม่ําเสมอโดยใช้ .NET async/await.
  • การจัดการการสอบถามสําหรับการโหลดงานขนาดใหญ.
  • การยกเลิกการสนับสนุนสําหรับการทํางานที่ยาวนาน.

การปรับแต่งและการขยายตัว

  • ปรับแต่งท่อกรองแบบกําหนดเอง.
  • เพิ่มคําพูดหรือ vocabulary เพื่อเพิ่มความแม่นยํา.
  • Hook into การยอมรับเหตุการณ์สําหรับการเข้าสู่ระบบหรือการตรวจสอบกลาง.

การแสดงผล Tuning

  • การปรับความละเอียดและความลึกสีเพื่อให้มีความสมดุลระหว่างความเร็วและความแม่นยํา.
  • ซ่อน buffers ที่ได้รับการประมวลผลก่อนเมื่อทํางานกับรูปแบบที่ซ้ํากัน.
  • ขั้นตอนท่อโปรไฟล์เพื่อแยกขวด.

เคล็ดลับและการปฏิบัติที่ดีที่สุด

  • Pre-select หรือ crop พื้นที่ของความสนใจเพื่อลดเวลาการประมวลผล.
  • การทดสอบพารามิเตอร์กรองบนตัวอย่างแสดงผลก่อนการใช้งาน.
  • ใช้คะแนนความไว้วางใจเพื่อสร้างอัตราการลดลงหรือการยืนยันมนุษย.
  • สําหรับภาพเคลื่อนที่ให้แสงที่เหมาะสมและพื้นหลังที่ตรงกันข้าม.
  • ตรวจสอบการใช้งานหน่วยความจําด้วยการทํางานของชุด; ใช้เครื่องหมายการยกเลิกเมื่อจําเป็น.
  • ผสมการส่งออก JSON กับบริการการยืนยันเพื่อสร้างท่อข้อมูลที่แข็งแกร่ง.

คําถามที่ถามบ่อย

**การระบุภาษาที่จําเป็นหรือไม?**โดย default the plugin automatically detects many languages. อย่างไรก็ตามการตั้งค่าภาษาอย่างชัดเจนจะปรับปรุงความแม่นยําสําหรับ scripts เช่น Cyrillic, Chinese, หรือ Hindi.

**รูปแบบใดที่ได้รับการสนับสนุน?**JPEG, PNG, TIFF, PDF, และรูปแบบที่นิยมอื่น ๆ จากสแกนเนอร์หรือกล้อง ผลลัพธ์สามารถส่งออกเป็นข้อความเรียบ HTML, Word, pdf, JSON หรือ XML.

**ฉันจะได้รับผลลัพธ์ที่ดีที่สุดอย่างไร?**ใช้ภาพที่มีคุณภาพสูงจากสแกนเนอร์หรือกล้องสมัยใหม่ ตัวกรองที่สร้างขึ้นปรับปรุงคุณภาพภาพก่อนการรับร.

 แบบไทย