Thư viện Anh “số hóa”

Qua nhiều thế kỷ phải giữ các bản sao của từng cuốn sách, tạp chí, báo ngày xuất bản ở Anh, bắt đầu từ ngày 6-4, Thư viện Anh đưa toàn bộ “gia sản” của mình lên trang web, lên sách điện tử (e-book), lên bản tin trực tuyến và cả blog... Đây là một trong những nỗ lực nhằm bảo tồn nguồn tư liệu khổng lồ thông qua “bộ nhớ kỹ thuật số” của quốc gia
Thư viện Anh “số hóa”

Qua nhiều thế kỷ phải giữ các bản sao của từng cuốn sách, tạp chí, báo ngày xuất bản ở Anh, bắt đầu từ ngày 6-4, Thư viện Anh đưa toàn bộ “gia sản” của mình lên trang web, lên sách điện tử (e-book), lên bản tin trực tuyến và cả blog... Đây là một trong những nỗ lực nhằm bảo tồn nguồn tư liệu khổng lồ thông qua “bộ nhớ kỹ thuật số” của quốc gia.

Ngoài ra, Thư viện Anh còn phải lập một bộ lưu trữ tài liệu lịch sử bằng kỹ thuật số để phục vụ cho các nhà nghiên cứu tương lai. Hiện 100 trang web đã được lựa chọn để cung cấp “bản chụp đời sống trực tuyến của Anh trong năm 2013” và giúp mọi người nắm bắt phạm vi những gì sẽ được lưu giữ. Theo thư viện, các tài liệu trực tiếp từ vụ đánh bom khủng bố năm 2005 đến chiến dịch vận động tranh cử năm 2010 của Anh đều đã biến mất. Ông Lucie Burgess, người đảm nhận chiến lược lưu trữ nội dung của thư viện cho biết: “Những thứ đăng trên trang web là phù du. Đời sống trung bình của một trang web chỉ có 75 ngày, khi trang web thay đổi, nội dung được gỡ xuống. Nếu chúng tôi không nắm giữ những tài liệu này theo cách an toàn hơn, một phần quan trọng của kiến thức thuộc thế kỷ 21 sẽ mất”.

Mặc dù luật pháp Anh đã thông qua năm 2003, nhưng phải mất 1 thập niên để chính phủ nước này có sự chuẩn bị thấu đáo về tính pháp lý và công nghệ để thư viện thu về tất cả các trang web với một “kết thúc có hậu”. Một trang web tự động thu hoạch sẽ quét qua và ghi lại 4,8 triệu trang web trong tổng số 1 tỷ trang web. Hầu hết nội dung sẽ được chụp lại mỗi năm một lần. Tuy nhiên, hàng trăm ngàn trang web báo chí và tạp chí có tính chất thay đổi nhanh chóng sẽ được quét qua và lưu lại mỗi ngày một lần. Dự kiến, toàn bộ nội dung sẽ được công bố vào cuối năm nay. Theo ông Burgess: “Trong vòng 1 năm, kho lưu trữ kỹ thuật số của chúng tôi sẽ thu thập lại những tài liệu trong 300 năm qua”. Thư viện hy vọng sẽ mở rộng bộ sưu tập, bao gồm các trang web xuất bản ở các nước khác nhưng đăng tải những nội dung quan trọng của nước Anh, cũng như Twitter và các trạng mạng xã hội cung cấp thông tin của Anh khác.

Theo New York Times, Anh sẽ là một trong những quốc gia đầu tiên áp dụng luật trách nhiệm lưu giữ toàn bộ nội dung tài liệu bằng kỹ thuật số. Thách thức không chỉ nằm ở công đoạn lưu tài liệu mà còn ở khâu bảo quản. Kho lưu trữ quốc gia này sẽ được bảo tồn tại London và 5 thư viện quốc gia lớn khác của xứ Wales và Scotland, cũng như tại thư viện các trường đại học Oxford, Cambridge và Trinity.

Hạnh Chi

Tin cùng chuyên mục