Microsoft tích hợp OCR vào ứng dụng Photos trên Windows 11 và Windows 10

Microsoft vừa chính thức giới thiệu tính năng nhận dạng ký tự quang học (OCR) vào ứng dụng Photos trên cả Windows 11 và Windows 10, đánh dấu một bước tiến lớn trong việc nâng cao trải nghiệm người dùng và khả năng truy cập thông tin.

Trước đây,chắc hẳn không ít người dùng Windows dã phải phụ thuộc vào các ứng dụng hoặc tiện ích mở rộng của bên thứ ba để thực hiện chức năng này. Giờ đây, OCR đã được tích hợp sẵn, cho phép người dùng dễ dàng trích xuất văn bản từ hình ảnh ngay trong ứng dụng Photos quen thuộc. Hãy cùng Phong Vũ Tech News tìm hiểu ngay cách sử dụng mà những cải tiến có tong OCR.

OCR là gì?

OCR là viết tắt của Optical Character Recognition, hay Nhận dạng Ký tự Quang học. Đây là công nghệ cho phép máy tính “nhìn” và “hiểu” văn bản trong các hình ảnh, chuyển đổi chúng từ dạng pixel thành dạng văn bản kỹ thuật số có thể chỉnh sửa được. Nói cách khác, OCR giúp bạn sao chép văn bản từ ảnh, tài liệu giấy được scan, thậm chí cả chữ viết tay, và dán vào các ứng dụng khác như Word, Excel, email… một cách nhanh chóng.

OCR giúp bạn trích xuất văn bản từ ảnh chụp tài liệu, ảnh chụp màn hình, hay bất kỳ hình ảnh nào chứa văn bản
OCR giúp bạn trích xuất văn bản từ ảnh chụp tài liệu, ảnh chụp màn hình, hay bất kỳ hình ảnh nào chứa văn bản

Tính năng OCR trong ứng dụng Photos trên Windows

Cơ chế hoạt động của OCR

Tính năng OCR trong ứng dụng Photos trên Windows sử dụng các thuật toán trí tuệ nhân tạo (AI) tiên tiến để nhận diện và phân tích các ký tự trong hình ảnh. Ứng dụng sẽ tự động quét toàn bộ hình ảnh, xác định các vùng chứa văn bản, và tiến hành trích xuất nội dung văn bản đó.

Cách sử dụng trong ứng dụng Photos

Việc sử dụng tính năng OCR trong ứng dụng Photos vô cùng đơn giản. Khi mở một hình ảnh có chứa văn bản, ứng dụng sẽ tự động nhận diện và hiển thị biểu tượng OCR ở phía dưới ảnh. Người dùng chỉ cần nhấp vào biểu tượng này để trích xuất toàn bộ văn bản hoặc chọn vùng văn bản cụ thể để sao chép vào clipboard.

Người dùng chỉ cần nhấp vào biểu tượng này để sao chép văn bản
Người dùng chỉ cần nhấp vào biểu tượng này để sao chép văn bản

Lợi ích của OCR trên Windows

Việc tích hợp OCR vào ứng dụng Photos mang lại nhiều lợi ích thiết thực cho người dùng Windows:

  • Nâng cao năng suất: OCR giúp tiết kiệm thời gian và công sức so với việc phải nhập liệu thủ công từ hình ảnh.
  • Cải thiện khả năng tiếp cận: Người dùng khiếm thị hoặc gặp khó khăn về đọc có thể sử dụng OCR kết hợp với trình đọc màn hình để nghe nội dung văn bản từ hình ảnh.
  • Hỗ trợ đa ngôn ngữ: Tính năng OCR trên Windows hỗ trợ hơn 160 ngôn ngữ, giúp người dùng trên toàn thế giới có thể sử dụng một cách hiệu quả.
  • Tối ưu hóa quy trình làm việc: OCR giúp đơn giản hóa việc chỉnh sửa, lưu trữ và chia sẻ thông tin từ hình ảnh. Ví dụ, bạn có thể dễ dàng trích xuất văn bản từ ảnh chụp màn hình, tài liệu scan, bảng biểu… và dán vào email, báo cáo, bài thuyết trình…

Một số cải tiến khác cho ứng dụng Photos

Bên cạnh OCR, Microsoft cũng giới thiệu một số cải tiến đáng chú ý khác cho ứng dụng Photos, nhằm mang đến trải nghiệm người dùng tốt hơn:

“Siêu phân giải” trên Copilot+

Dành cho các máy tính Copilot+ chạy chip Snapdragon, Microsoft bổ sung tính năng “siêu phân giải” (super resolution) cho phép phóng to hình ảnh lên đến 8 lần kích thước gốc mà vẫn giữ được chất lượng chi tiết nhờ công nghệ AI. Tính năng này rất hữu ích khi cần in ảnh khổ lớn, phóng to ảnh để xem chi tiết hoặc cắt cúp ảnh mà không làm giảm độ phân giải.

Sửa lỗi cho tính năng chỉnh sửa ảnh

Microsoft cũng đã khắc phục một số lỗi liên quan đến tính năng tạo ảnh và chỉnh sửa ảnh trên các máy tính Copilot+, giúp cải thiện chất lượng hình ảnh tổng thể.

Cải thiện điều hướng

Ứng dụng Photos được cập nhật hỗ trợ chế độ nhấp chuột đơn để mở ảnh, giúp việc duyệt ảnh trong thư viện trở nên nhanh chóng và hiệu quả hơn.

So sánh OCR với Live Text trên iOS

Cả OCR trên Windows và Live Text trên iOS đều là những công cụ mạnh mẽ giúp người dùng trích xuất văn bản từ hình ảnh. Tuy nhiên, chúng cũng có một số điểm khác biệt.

Live Text trên iOS được đánh giá cao về khả năng nhận dạng chính xác và tốc độ xử lý nhanh chóng. Nó cũng được tích hợp sâu vào hệ điều hành, cho phép người dùng sử dụng ngay trong ứng dụng camera hoặc trên ảnh chụp màn hình. Tuy nhiên, Live Text hiện chỉ hỗ trợ một số ngôn ngữ nhất định.

OCR trên Windows tuy ra mắt sau nhưng lại có lợi thế về khả năng hỗ trợ đa ngôn ngữ (hơn 160 ngôn ngữ). Việc tích hợp vào ứng dụng Photos cũng giúp người dùng dễ dàng tiếp cận và sử dụng. Tuy nhiên, hiệu năng và độ chính xác của OCR trên Windows vẫn cần được kiểm chứng thêm trong quá trình sử dụng thực tế.

Tổng kết

Việc tích hợp OCR vào ứng dụng Photos là một bước tiến đáng kể của Microsoft trong việc cải thiện trải nghiệm người dùng và nâng cao khả năng truy cập trên Windows. Tính năng này hứa hẹn sẽ mang lại nhiều lợi ích cho người dùng, từ việc nâng cao năng suất làm việc đến hỗ trợ người dùng khiếm thị. Cùng với những cải tiến khác, Microsoft đang nỗ lực biến ứng dụng Photos thành một công cụ quản lý và chỉnh sửa ảnh mạnh mẽ và tiện dụng hơn.

ASUS Zenbook s 14 thế hệ Copilot+ PC đầu tiên của Intel