Bài học về bảo mật dữ liệu

Dữ liệu y tế là những thông tin nhạy cảm và riêng tư. Vì vậy, việc Chính phủ Anh xác nhận dữ liệu của nửa triệu tình nguyện viên thuộc dự án UK Biobank bị rao bán công khai trên nền tảng thương mại điện tử đã gây rúng động giới khoa học và an ninh mạng nước này.

Dù dữ liệu được cho là đã ẩn danh, nhưng quy mô và tính chất của vụ việc vẫn gióng lên cảnh báo về lỗ hổng trong quản trị dữ liệu y sinh hiện nay.

Cảnh báo đầu tiên xuất phát từ chính mô hình vận hành của các kho dữ liệu lớn. UK Biobank (Ngân hàng sinh học Anh) lâu nay được xem là biểu tượng của khoa học mở, cho phép giới nghiên cứu toàn cầu tiếp cận dữ liệu phục vụ tìm kiếm phương pháp điều trị bệnh nan y. Tuy nhiên, việc cho phép tải dữ liệu về hệ thống riêng cho thấy một khi dữ liệu rời máy chủ gốc, cơ quan quản lý gần như mất quyền kiểm soát.

Vụ việc còn đe dọa trực tiếp nền tảng của nghiên cứu y sinh. Khi 500.000 tình nguyện viên chứng kiến thông tin di truyền và hồ sơ bệnh lý của mình bị rao bán, niềm tin dành cho các dự án nghiên cứu sẽ suy giảm, kéo theo khó khăn trong huy động người tham gia trong tương lai.

Nghiêm trọng hơn là nguy cơ tái định danh dữ liệu. Trong bối cảnh trí tuệ nhân tạo phát triển nhanh, việc “ẩn danh” không còn tuyệt đối; dữ liệu di truyền hoàn toàn có thể bị đối chiếu với thông tin công khai để lần ra danh tính cá nhân. Vụ việc cũng làm dấy lên lo ngại về an ninh sinh học, khi lượng lớn dữ liệu gene của công dân bị phát tán ra nền tảng nước ngoài và có nguy cơ bị khai thác ngoài mục đích nghiên cứu.

Sự cố này là bài học về việc cần thiết phải siết chặt quản trị dữ liệu và nâng cấp hệ thống bảo mật trên quy mô toàn cầu. Thay vì cho phép tải dữ liệu, các cơ sở lưu trữ cần chuyển sang mô hình tham chiếu tại chỗ, nơi nhà khoa học chỉ được phép làm việc trên môi trường điện toán đám mây dưới sự giám sát nghiêm ngặt của chủ sở hữu dữ liệu. Đồng thời, các quy định pháp luật quốc tế cần có những chế tài mạnh mẽ hơn đối với các tổ chức nghiên cứu vi phạm cam kết.

Tin cùng chuyên mục