Đột phá với “Giải pháp Vidas”

Dữ liệu lớn (Big Data) hiện không chỉ bao gồm các số liệu mà còn có thể là văn bản, hình ảnh, video và nhiều loại dữ liệu khác. Quan trọng hơn, dữ liệu lớn có thể được phân tích để tìm ra những thông tin quý giá giúp chính quyền, các cơ quan chức năng, doanh nghiệp đưa ra các quyết định chiến lược. Dữ liệu đã trở thành một nguồn lực chiến lược, một loại tài nguyên mới đặc biệt quan trọng.

Kết nối, chuẩn hóa, làm sạch dữ liệu

Phát biểu tại buổi làm việc với Trung tâm Dữ liệu Quốc gia - Bộ Công an vào tháng 12-2025, Tổng Bí thư Tô Lâm (thời điểm này đồng chí chưa được bầu làm Chủ tịch nước) nhấn mạnh, dữ liệu và các ứng dụng cụ thể hiện còn sơ khai; dữ liệu tại nhiều bộ, ngành hiện đang bị phân tán, chưa được tập hợp, chuẩn hóa về cấu trúc và chất lượng theo tiêu chí “đúng, đủ, sạch, sống”, chưa tạo ra được môi trường, cơ chế để các doanh nghiệp, người dân và tổ chức tương tác, khai thác dữ liệu nhằm tạo ra giá trị mới…

U1b.jpg
Nhóm tác giả trình bày giải pháp với Ban giám khảo Cuộc thi Data for Life 2025

Vì thế cần đẩy nhanh công tác tạo lập, kết nối dữ liệu, chuẩn hóa, làm sạch, quản trị dữ liệu và khai thác, phát huy giá trị của dữ liệu. Trong quý 1-2026 phải hình thành cơ sở dữ liệu tổng hợp quốc gia kết nối các kho dữ liệu liên quan; bảo đảm tất cả dữ liệu tích hợp tuân thủ nguyên tắc “đúng, đủ, sạch, sống, thống nhất, kết nối và dùng chung”.

Theo các chuyên gia, số hóa được cấu thành bởi hai hình thức: Số hóa tài liệu - Digitization là phương pháp chuyển đổi dữ liệu từ analog hay dạng vật lý sang dạng kỹ thuật số để sử dụng vào các mục đích khác nhau. Số hóa quy trình - Digitalization là quá trình cải thiện hoặc kích hoạt quy trình quản lý các công nghệ kỹ thuật số và dữ liệu số hóa. Gần đây, các ứng dụng chuyển đổi số vào quản lý nhà nước dễ thấy nhất là họp không gặp mặt, xử lý văn bản không giấy, giải quyết thủ tục hành chính không tiếp xúc, thanh toán không dùng tiền mặt… Và tất cả đều cần dữ liệu lớn!

Để đẩy nhanh công tác tạo lập, kết nối dữ liệu, chuẩn hóa, làm sạch, quản trị dữ liệu, rất cần tập trung vào chuyển đổi số và số hóa bằng các giải pháp tiên tiến và máy móc hiện đại. Trong những ngày cuối cùng của năm 2025, giới công nghệ số TPHCM chào đón tin vui, đó là việc đội hình chuyên gia số hóa của TPHCM đã vinh dự dành được một trong các giải thưởng cao, có tính ứng dụng mạnh mẽ tại cuộc thi Data for Life 2025 do Bộ Công an tổ chức. Đội hình thi Viditec với Giải pháp Vidas (Giải pháp Số hóa - lưu trữ, quản lý, khai thác thông tin toàn diện) đã đáp ứng đầy đủ các tiêu chí phục vụ số hóa, tạo kho dữ liệu quốc gia.

Theo Cục Cảnh sát Quản lý hành chính về trật tự xã hội (Bộ Công an), cuộc thi Data for Life đã được tổ chức liên tục 3 năm và đều thành công ở phần ứng dụng thực tiễn. Các giải pháp luôn lấy người dân và doanh nghiệp làm trung tâm, phù hợp tinh thần đột phá của Nghị quyết số 57-NQ/TW của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia, Nghị quyết số 68-NQ/TW của Bộ Chính trị về phát triển kinh tế tư nhân, đã làm thay đổi cơ bản phương thức quản trị quốc gia và thúc đẩy chuyển đổi số trên toàn quốc, định rõ “hình hài” của một quốc gia số.

Bước đột phá của Vidas

Nhóm tác giả của Giải pháp Vidas gồm: Tiến sĩ Dương Ngọc Hiếu, người từng nhận Giải thưởng Nhân tài đất Việt năm 2023 với sản phẩm Hệ sinh thái Tris; Thạc sĩ Trịnh Văn Quảng, người đã ứng dụng công nghệ điện toán đám mây để phân tích, khai thác dữ liệu thông tin phục vụ quản lý các nhiệm vụ nghiên cứu khoa học và công nghệ trên địa bàn tỉnh Vĩnh Long; Thạc sĩ Vũ Quốc Hưng, tác giả của các dự án: Bãi giữ xe bán tự động dùng công nghệ RFID, Quản lý kho bãi dùng công nghệ RFID, Quản lý hệ thống giám sát an ninh SVMS, Hệ thống phân tích dữ liệu giao thông (TriSDA, TriSClient).

U5A.jpg
Các thành viên trẻ của đội thi Viditec nhận giải thưởng với Giải pháp Vidas (Giải pháp Số hóa - lưu trữ, quảng lý, khai thác thông tin toàn diện)

Ngoài ra nhóm tác giả còn có kỹ sư phần mềm Lê Nguyễn Minh Trí, từng xây dựng các hệ thống Giám sát an ninh/Giao thông bằng AI; kỹ sư Nguyễn Vũ Huy, từng tham gia triển khai Hệ thống thông tin địa lý (GIS) phục vụ quản lý xây dựng, số hóa dữ liệu quy hoạch tỉnh Bình Phước (cũ).

Góp phần vào việc thực hiện Nghị quyết 57-NQ/TW, Nghị quyết 68-NQ/TW, Ban tổ chức cuộc thi Data for Life 2025 đã cho thấy, khi tạo môi trường kinh doanh thông thoáng, minh bạch, ổn định, an toàn, dễ thực thi… thì sẽ khuyến khích kinh tế tư nhân phát triển trong những lĩnh vực ưu tiên, đầu tư nghiên cứu phát triển, ứng dụng khoa học công nghệ, đổi mới sáng tạo, chuyển đổi số, tham gia vào các nhiệm vụ quan trọng, chiến lược của quốc gia và vươn tầm khu vực, thế giới; thúc đẩy tinh thần khởi nghiệp sáng tạo, chuyển đổi số và làm giàu hợp pháp, chính đáng… Điều này một lần nữa được thể hiện qua việc đội thi Viditec đều là những “anh hào chất xám” từ các doanh nghiệp tư nhân, các tiến sĩ và kỹ sư trẻ giàu nhiệt huyết.

Theo hồ sơ năng lực, thời gian qua, Vidas đã áp dụng thực hiện quét nhập liệu thông tin về các hồ sơ người có công với cách mạng tại Hà Tĩnh, Thái Bình (cũ), TPHCM, Bình Dương (cũ); bóc tách thông tin từ văn bản quy phạm pháp luật, văn bản hành chính để hỗ trợ công tác nhập liệu, xử lý văn bản của văn thư Bộ Tư pháp, Bộ Tài chính, Công báo TPHCM; triển khai phần mềm quản lý khai thác hồ sơ điện tử, nhập liệu hồ sơ tài liệu trong kho lưu trữ TAND TPHCM, Tổng cục Hải quan; triển khai phần mềm quản lý hồ sơ hoàn công tại Sở Giao thông Vận tải TPHCM; số hóa và quản lý thông tin hơn 4,2 triệu hồ sơ (20 triệu trang) người hưởng bảo hiểm xã hội Việt Nam…

Nói về Giải pháp Vidas, chuyên gia Nguyễn Hòa Hạnh, Đội trưởng Viditec, chia sẻ: Đây là bước đột phá trong công nghệ lưu trữ, được thiết kế chuyên biệt để đáp ứng các tiêu chuẩn khắt khe về chỉnh lý tài liệu của Bộ Nội vụ. Vidas vận hành với 3 phân hệ cốt lõi: Phân hệ Số hóa tại máy trạm là nơi tiếp nhận, xử lý ảnh và nhận dạng ký tự quang học (OCR) bóc tách dữ liệu, kiểm tra chất lượng dữ liệu ngay từ đầu vào. Phân hệ Quản lý tập trung là hệ thống quản lý hàng trăm thuê bao dữ liệu lớn và bảo đảm ánh xạ 1-1 chính xác giữa kho số và kho vật lý. Phân hệ Dịch vụ OCR và Trợ lý AI chạy trên máy chủ GPU nhận diện chữ viết tay và chuyển đổi giọng nói thành văn bản.

Tiến sĩ Dương Ngọc Hiếu nêu ví dụ: Nếu như chính quyền một phường đang sở hữu hàng ngàn tài liệu giấy, ghi âm, hình, video chưa được khai thác hiệu quả và muốn chuyển đổi chúng thành dữ liệu thì Vidas có thể giúp làm điều đó. Giải pháp còn tìm kiếm theo từ khóa tự nhiên, đọc và tóm tắt văn bản để tạo bản tóm tắt ngắn gọn, dễ hiểu, sáng tạo nội dung từ tài liệu gốc; đồng thời soạn thảo thư mời, thông báo, biên bản họp tự động, viết nội dung truyền thông đa định dạng. Sức mạnh thực sự của giải pháp nằm ở khả năng tìm kiếm theo khuôn mặt và tìm kiếm theo ngữ nghĩa video.…

Về điểm nhấn công nghệ của Vidas, Cục Cảnh sát Quản lý hành chính về trật tự xã hội (Bộ Công an) nhận xét: Người dùng có thể đối thoại trực tiếp với hệ thống và trợ lý AI của Vidas có khả năng đọc hiểu, tóm tắt các văn bản dài, tự động soạn thảo thư mời, thông báo dựa trên dữ liệu gốc. Không chỉ văn bản giấy, Vidas còn xử lý được các file ghi âm và tìm kiếm video theo ngữ nghĩa.

Ví dụ, chuyên viên có thể gõ mô tả hành động để tìm chính xác đoạn video cần thiết hoặc nhận diện khuôn mặt nhân sự trong kho dữ liệu khổng lồ. Vidas còn có khả năng nhận dạng ký tự quang học và bóc tách thông tin được thiết kế chuyên biệt cho tiếng Việt, bao gồm cả nhận diện chữ viết tay (ICR) và phân tích bố cục tài liệu phức tạp. Hệ thống được thiết kế để quản lý hàng trăm triệu văn bản với dung lượng rất lớn, giải quyết bài toán quy mô lớn của các cơ quan cấp bộ, ngành. Giải pháp tuân thủ tuyệt đối các quy định pháp lý Việt Nam, bảo đảm ánh xạ 1-1 chính xác giữa Kho lưu trữ số và Kho lưu trữ vật lý (biết chính xác tài liệu số nằm ở hộp/kệ nào trong kho thực).

Tác giả DƯƠNG MINH ANH

Bình chọn bài viết

Bài viết mới