&

C# Sdcb.PaddleOCR 字符識別庫

admin

2025年5月5日 23:20 本文熱度 1125

Sdcb.PaddleOCR 是一個基于 PaddlePaddle 的 OCR（光學字符識別）庫，旨在提供高效的文本檢測和識別功能。它支持多種語言，并提供本地和在線模型供用戶選擇。該庫的設計使得在不同平臺（如 Windows 和 Linux）上都能方便地進行文本識別。這個比Tesseract OCR 好多了，不過要get的庫比較多。

NuGet 包

Sdcb.PaddleOCR 提供了多個 NuGet 包，用戶可以根據需要選擇合適的版本：

Sdcb.PaddleOCR
: 主要的 PaddleOCR 庫，基于 Sdcb.PaddleInference。
Sdcb.PaddleOCR.Models.LocalV3
: 包含完整的本地 V3 模型，支持多種語言（約 105MB）。
Sdcb.PaddleOCR.Models.LocalV4
: 包含完整的本地 V4 模型，支持多種語言（約 111MB）。

有關語言支持的詳細信息，請參考 PaddleOCR 模型列表。

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/doc/doc_en/models_list_en.md

使用方法

using OpenCvSharp;
using Sdcb.PaddleInference;
using Sdcb.PaddleInference.Native;
using Sdcb.PaddleOCR;
using Sdcb.PaddleOCR.Models.Local;
using Sdcb.PaddleOCR.Models;

namespace AppPaddlePaddle
{
    internal class Program
    {
        static void Main(string[] args)
        {
            FullOcrModel model = LocalFullModels.ChineseV3;

            using (PaddleOcrAll all = new PaddleOcrAll(model, PaddleDevice.Mkldnn())
            {
                AllowRotateDetection = true, /* 允許識別有角度的文字 */
                Enable180Classification = false, /* 允許識別旋轉角度大于90度的文字 */
            })
            {
                using (Mat src = Cv2.ImRead(@"temp_plate.png"))
                {
                    PaddleOcrResult result = all.Run(src);
                    Console.WriteLine("Detected all texts: \n" + result.Text);
                    foreach (PaddleOcrResultRegion region in result.Regions)
                    {
                        Console.WriteLine($"Text: {region.Text}, Score: {region.Score}, RectCenter: {region.Rect.Center}, RectSize:    {region.Rect.Size}, Angle: {region.Rect.Angle}");
                    }
                }
            }
            Console.ReadKey();
        }
    }
}

性能優化

PaddleConfig.MkldnnCacheCapacity
默認值為 1，可以根據內存使用情況進行調整。
PaddleOcrAll.Enable180Classification
默認值為 false，可以提高處理速度。
PaddleOcrAll.AllowRotateDetection
默認值為 true，如果只處理水平文本，可以設置為 false 以提高準確性和性能。

結論

Sdcb.PaddleOCR 是一個強大的 OCR 解決方案，適用于多種平臺和語言。通過合理的配置和優化，用戶可以實現高效的文本識別，滿足不同場景的需求。

閱讀原文：原文鏈接

該文章在 2025/5/6 12:04:46 編輯過

關鍵字查詢

字符

OCR

識別

正在查詢...

點晴ERP是一款針對中小制造業的專業生產管理軟件系統,系統成熟度和易用性得到了國內大量中小企業的青睞。

點晴PMS碼頭管理系統主要針對港口碼頭集裝箱與散貨日常運作、調度、堆場、車隊、財務費用、相關報表等業務管理，結合碼頭的業務特點，圍繞調度、堆場作業而開發的。集技術的先進性、管理的有效性于一體，是物流碼頭及其他港口類企業的高效ERP管理信息系統。

點晴WMS倉儲管理系統提供了貨物產品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質期管理,貨位管理,庫位管理,生產管理,WMS管理系統,標簽打印,條形碼,二維碼管理,批號管理軟件。

點晴免費OA是一款軟件和通用服務都免費，不限功能、不限時間、不限用戶的免費OA協同辦公管理系統。