Văn bản là một trong những nguồn thông tin quan trọng nhất đối với con người và cảnh thiên nhiên chứa đầy các ký hiệu văn bản khác nhau. Tôi tin rằng mọi người đều quen thuộc với nhận dạng ký tự quang học (OCR).
Nhận dạng hình ảnh và văn bản trong các cảnh công nghiệp phức tạp hơn. OCR xuất hiện trong nhiều tình huống khác nhau. Nó có thể nhận dạng quang học các ký tự trên một số bề mặt và sản phẩm đặc biệt nói chung, tạo điều kiện thuận lợi cho việc so sánh thông tin và sửa lỗi khi in ký tự và cung cấp dữ liệu cho quá trình sản xuất. : Khi phát hiện thiếu ký tự, thiếu mã in phun, dữ liệu không chính xác,… hệ thống sẽ gửi tín hiệu đến thiết bị loại bỏ để xử lý từ chối hoặc nhắc nhở cảnh báo.
Trong số này, chúng tôi sẽ chia sẻ giải pháp nhận dạng OCR của AKUENSE cho đầu sạc trong ngành 3C.
Kịch bản ứng dụng
🔸 Yêu cầu phát hiện bao gồm định vị đường viền, phát hiện màn hình lụa, nhận dạng ký tự và nhận dạng mã QR.
🔸 In lụa được thực hiện bằng cách khắc laser. Máy ảnh và phần cứng khác không thể được lắp đặt trực tiếp bên dưới thấu kính khúc xạ cần phải được tùy chỉnh theo bước sóng laser.
🔸 Sau khi xác định được ký tự và dữ liệu mã QR cần đối chiếu với dữ liệu ký tự, dữ liệu mã QR trong cơ sở dữ liệu tiêu chuẩn để đảm bảo độ chính xác của việc khắc laser
giải pháp
1. Sử dụng thuật toán định vị có độ chính xác cao để cung cấp tọa độ vị trí chính xác cho việc kiểm tra màn lụa tiếp theo
2. Sử dụng thuật toán vi phân để phát hiện các khiếm khuyết về ký tự để đảm bảo tính toàn vẹn và khiếm khuyết về hình thức của các ký tự và thông tin khác.
3. Sử dụng thuật toán deep learning để thực hiện nhận dạng OCR đối với thông tin ký tự bề mặt, với độ chính xác >99,5%
Quy trình giải quyết
Công nghệ nhận dạng OCR chủ yếu dựa vào thuật toán xử lý hình ảnh và nhận dạng mẫu. Nó nắm bắt các đặc điểm ký tự trong tài liệu, chẳng hạn như nét, hình dạng, kích thước, khoảng cách, v.v. và so sánh với thư viện ký tự đặt trước để xác định thông tin văn bản tương ứng. Bạn cần phải trải qua các quá trình sau:
1. Bộ sưu tập hình ảnh
Sử dụng camera công nghiệp hoặc camera smartphone có độ phân giải cao để chụp ảnh đầu sạc.
Cần đảm bảo môi trường ánh sáng của môi trường chụp ảnh đồng đều và bề mặt đầu sạc sạch sẽ, không bị cản trở.
2. Tiền xử lý ảnh
Thực hiện các hoạt động tiền xử lý như nhị phân hóa, khử nhiễu và tăng cường độ tương phản trên các hình ảnh được thu thập để cải thiện độ chính xác của nhận dạng tiếp theo.
Quá trình tiền xử lý ảnh có thể được thực hiện thông qua các thuật toán phần mềm hoặc thư viện xử lý ảnh như OpenCV.
3. Định vị khu vực
Thông qua việc khớp mẫu, phát hiện cạnh và các thuật toán khác, khu vực chứa các ký tự hoặc logo cần nhận dạng trên đầu sạc sẽ được định vị.
Bước này có thể đảm bảo tính chính xác của nhận dạng OCR tiếp theo và giảm các phép tính không cần thiết.
4. Nhận dạng OCR
Thực hiện nhận dạng ký tự trên khu vực định vị.
Các ký tự có thể được chuyển đổi thành văn bản có thể chỉnh sửa và tìm kiếm dựa trên thông tin pixel trong hình ảnh.
Phát hiện màn hình lụa, trích xuất ký tự
5. Kết quả đầu ra
Xuất kết quả nhận dạng OCR ở dạng văn bản, có thể được lưu vào cơ sở dữ liệu, tệp hoặc hiển thị trên giao diện người dùng.
Đồng thời, kết quả nhận dạng có thể được kiểm tra, xác minh để đảm bảo tính chính xác, tin cậy của dữ liệu.