Những Vấn Đề Lưu Ý Khi Số Hóa

MỘT SỐ LƯU Ý KHI SỐ HÓA

1. Những Tài liệu cần số hóa

+ Trong công tác văn thư:
Trước hết cần xác định rõ, hoạt động của “văn thư – lưu trữ truyền thống” là giấy để ban hành công văn giấy tờ là giấy. Khi hình thái “văn thư – lưu trữ điện tử” chưa chính thức ra đời, từ những năm 90 của thế kỷ trước cho đến nay, máy vi tính với những phần mềm office giúp tạo ra văn bản điện tử thay thế cho những trang sản phẩm giấy của máy đánh. Như vậy, tất cả các loại văn bản này khi ban hành vẫn phải hình thành trên giấy, ký (tay), đóng dấu … – đối tượng chính khi cần và khi có nhu cầu số hóa.
Như vậy, xét về vị trí của văn bản/tài liệu trong công tác văn thư, trong giai đoạn khởi đầu của vòng đời tài liệu, loại hình tài liệu cần số hoá trong công tác văn thư chỉ xuất hiện từ khi có nhu cầu và khi mạng diện rộng có tiện ích chuyển giao văn bản qua mạng (có phần mềm chuyên dụng hoặc qua email). Tài liệu chủ yếu là các loại công văn giấy tờ – văn bản hành chính (trừ văn bản có độ mật) mà cơ quan, tổ chức đã ban hành trong quá trình hoạt động của mình, được số hóa. Chính vì vậy, có 02 cơ sở để xác định danh mục văn bản cần số hóa:
– Thứ nhất, số hóa văn bản đã ban hành để chuyển giao văn bản qua mạng diện rộng đáp ứng các yêu cầu để xử lý công việc về thời gian, hạn chế chi phí, …
– Thứ hai, thực hiện yêu cầu của cải cách hành chính theo lộ trình chính phủ điện tử trong việc lập và nộp hồ sơ điện tử trình lên cấp có thẩm quyền .

Từ những lý do trên, ở thì hiện tại, văn bản số hóa bao gồm toàn bộ văn bản hành chính của cơ quan, tổ chức được phép ban hành để phục vụ hoạt động của mình. Và văn bản số hóa đã trở thành một hình thức, một loại hình ghi tin – phương tiên hoạt động, giao tiếp không thể thiếu trong hoạt động của các cơ quan, tổ chức trên máy tính và trong môi trường mạng.

+ Trong công tác lưu trữ:

Việc xác định nguồn tài liệu số hóa là cơ sở có tính chất tiền đề cho các hoạt động bảo quản, khai thác và sử dụng tài liệu một cách hiệu quả nhất. Do khả năng về kinh phí, năng lực (của người quản lý, của cơ sở vật chất và hạ tầnng công nghê thông tin); từ nhu cầu quản lý và sử dụng tài liệu lưu trữ, thứ tự ưu tiên số hóa tài liệu theo quan điểm (riêng) của chúng tôi là:
– Ưu tiên số hóa tài liệu quý hiếm, có giá trị sử liệu cao nhưng cũ nát, có nguy cơ hư hỏng như một biện pháp bảo hiểm;

– Ưu tiên số hóa tài liệu có giá trị sử liệu, tần suất khai thác cao để tránh khai thác trực tiếp từ bản gốc.
Sau đó mới là những loại tài liệu khác có nhu cầu và được phép khai thác qua mạng diện rộng như hoạt động của The Virtual Vietnam Archive – The Vietnam Center anh Archive thuộc Đại học Texas Tech Hoa Kỳ.

2. 
Chất lượng và yêu cầu của việc số hóa:

Số hóa “màu” hay “đen trắng”:

Đáp số của các câu hỏi nói trên, theo chúng tôi, ta có thể tìm được ngay trong thực tế của sản phẩm số hóa. Một thực tế là: Số hóa xong, tài liệu “chuẩn” thành “không chuẩn”. Một trong những ví dụ rất cụ thể, rõ ràng là các tìa liệu hành chính, nếu scan màu, chữ kí (màu xanh hay màu đen) đều đè lên con dấu mặc dù bản gốc scan làm đúng: ký rồi mới đóng dấu.
Theo tìm hiểu của chúng tôi, các loại máy scan (kỹ thuật cũ) thường quét màu trước, đen trắng sau. Do vậy sẽ có sản phẩm “không chuẩn” sau số hóa.
Do đó, theo chúng tôi, để có kết quả số hóa chuẩn, tác dụng tốt, không bị sap chép chữ ký và con dấu, nên scan đen trắng và dung lượng không nên quá cao (có đủ rõ chữ trên văn bản).
    + Dung lượng và kiểu file số hóa:
    Định dạng của sản phẩm số hóa tài liệu lưu trữ (văn bản hành chính) đầu ra là định dạng PDF (Portable Document Format) hoặc JPEG ( Joint Photographich Expert Group). Riêng với tài liệu hành chính nên dùng định dạng JPEG sau đó chuyển sang định dạng PDF để vừa có chức năng tìm kiếm trong toàn văn nội dung tài liệu (Searchable fulltext) vừa tránh chuyển thành file text (DOC hay RTF – Rich Text Format).
    Một trong những vấn đề cần lưu ý khi số hóa văn bản/tài liệu lưu trữ với số hóa các loại tài liệu khác (sách, báo …) khác nhau. Với tài liệu chính không nên đề nhận dạng quang (Optical Character Recognition – OCR) nhằm tránh có thể biến sản phẩm số hóa thành dạng TEXT dễ sửa đổi.

    Về độ phân giải, khi số hóa, sản phẩm phải có dung lượng nhỏ nhưng vẫn giữ được độ sắc nét của chữ, hình ảnh trong tài liệu mới đạt yêu cầu. Độ phân giải theo quy định đối với tài liệu hành chính thường từ 200 – 500 dpi (viết tắt của thuật ngữ: Dots per Inch, đơn vị đó lường mật độ các chấm hay còn gọi là điểm ảnh tạo nên file số hóa). Việc số hóa tài liệu với dung lượng cao không nên làm đại trà mà chỉ áp dụng với những tài liệu với nhu cầu sử dụng cụ thể.