Data Lifecycle Management (DLM) là gì?
Dữ liệu hiện nay là tài sản quan trọng nhất của hầu hết các tổ chức nên việc vi phạm, không tuân thủ, xử lý sai hoặc mất dữ liệu có thể sẽ gây ra sự gián đoạn trong nhiều lĩnh vực hoạt động. Để giảm thiểu những rủi ro này, bạn sẽ cần hiểu rõ vòng đời sinh ra, hình thành, sử dụng và phá hủy của dữ liệu (Data Lifecycle Management - DLM).

Data Lifecycle Management (DLM) là gì?

Data lifecycle management (DLM) là quản lý vòng đời dữ liệu. Đây là một cách tiếp cận dành cho các đơn vị doanh nghiệp nhằm tối đa hóa lợi ích từ dữ liệu được thu thập hoặc tạo ra.

DLM đề cập đến các chính sách, công cụ và đào tạo, tập huấn nội bộ giúp xây dựng dòng chảyi dữ liệu biến đổi liên tục (giống như tế bào có sinh ra và chết đi). Về cơ bản, đó là khuôn khổ để quản lý cách dữ liệu được thu thập, làm sạch, lưu trữ, sử dụng và cuối cùng là phá hủy.

DLM cũng phục vụ để giảm thiểu rủi ro tiềm ẩn liên quan đến việc thu thập, lưu trữ hoặc truyền dữ liệu. Bằng cách triển khai DLM, các tổ chức được bảo vệ tốt hơn trước virus, mã độc tống tiền, lừa đảo và các cuộc tấn công độc hại khác.

Data Lifecycle Management (DLM) là quản lý vòng đời dữ liệu
Data Lifecycle Management (DLM) là quản lý vòng đời dữ liệu

Khi công nghệ thông tin phát triển, các doanh nghiệp và tổ chức đã chuyển đổi từ các phương pháp lưu trữ dữ liệu thông thường sang sử dụng cơ sở dữ liệu kỹ thuật số để quản lý dữ liệu. Sự phát triển này khiến cho các đơn vị doanh nghiệp ngày nay nhận thức được rõ ràng hơn về tầm quan trọng của việc quản lý đúng về vòng đời dữ liệu, không chỉ để tối ưu hóa các thông tin thu được mà còn để giảm thiểu những sự sai sót, rủi ro liên quan.

DLM hình thành các giải pháp tự động hóa các quy trình quản lý vòng đời liên quan đến dữ liệu, sắp xếp thông tin thành các tầng và danh mục theo các chính sách cụ thể và tự động hóa việc di chuyển dữ liệu giữa các tầng. Dữ liệu mới hơn và được truy cập thường xuyên hơn cũng thường được lưu trữ trên phương tiện lưu trữ nhanh hơn, đắt tiền hơn so với dữ liệu ít quan trọng hơn trong hầu hết các triển khai DLM.


Tháp dữ liệu DIKW với 4 tầng xử lý dữ liệu. Tầng cao nhất (Wisdom) là tri thức quan trọng đối với doanh nghiệp, giúp lãnh đạo ra quyết định dựa trên số liệu.

Tại sao bạn nên quan tâm đến quản lý vòng đời dữ liệu?

PLM không phải là một công nghệ. Bạn có thể nghĩ rằng dữ liệu lớn (big data) rất phức tạp. Thực tế dữ liệu không quá phức tạp. Chỉ có con người hay phức tạp hóa vấn đề và hay quá tính toán. Rủi ro là: doanh nghiệp quá phụ thuộc vào một nguồn dữ liệu hoặc vào các điểm kết nối dữ liệu mà bạn không có khả năng nhìn rõ dòng chảy của dữ liệu. Hoặc các hệ thống của bạn quá cô lập (silo) dẫn đến dòng chảy dữ liệu bị nghẽn. Hoặc các công cụ khai thác dữ liệu thường xuyên trục trặc khiến doanh nghiệp không thể khai thác hiệu quả. 


DLM là một phần của hệ sinh thái quản trị nội dung ECM (Enterprise Content Management) đối với doanh nghiệp.

Thuật ngữ PLM được sử dụng như một công cụ ẩn để giúp các nhà lãnh đạo hiểu được quy trình rằng dữ liệu ở bất kỳ tổ chức nào cũng phải di chuyển qua các trạng thái khác nhau trong suốt vòng đời của nó.

3 mục tiêu và lợi ích chính của data lifecycle management (DLM) 

Sự gia tăng ồ ạt của dữ liệu có nghĩa là các tổ chức đang lưu trữ thông tin ở nhiều nơi và nhiều nền tảng hơn bao giờ hết. Điều này bao gồm các máy chủ tại chỗ, môi trường đám mây và hệ thống máy tính biên.

Nhu cầu về DLM là rất lớn; dưới đây là ba mục tiêu và lợi ích chính mà bất kỳ chương trình quản lý vòng đời dữ liệu tốt nào cũng có.

Cam kết bảo mật

Một trong những mục tiêu chính của DLM là đảm bảo dữ liệu luôn được lưu trữ an toàn. DLM đảm bảo rằng thông tin riêng tư, bí mật hoặc nhạy cảm liên tục được bảo vệ khỏi tình trạng vi phạm, trộm cắp hoặc các rủi ro tiềm ẩn khác. Với DLM, bạn sẽ được hưởng lợi ích trực tiếp từ cách tiếp cận toàn diện để bảo vệ thông tin nhạy cảm khỏi các mối đe dọa từ bên trong và bên ngoài.

Toàn vẹn dữ liệu

Một chiến lược DLM thành công sẽ có thể giữ lại dạng ban đầu của bất kỳ dữ liệu nào, theo dõi tất cả các thay đổi và cấp khả năng hiển thị cho những người ra quyết định chính. Dữ liệu phải chính xác và đáng tin cậy bất kể dữ liệu được lưu trữ ở đâu, ai làm việc với dữ liệu đó và có bao nhiêu bản sao. Việc duy trì tính toàn vẹn của dữ liệu đảm bảo thông tin được sử dụng là chính xác, toàn vẹn và an toàn để có thể phân tích, làm việc.

Tính khả dụng của dữ liệu

Dữ liệu sẽ vô ích nếu dữ liệu đó không có sẵn để các nhóm trong tổ chức của bạn sử dụng, nhưng quá nhiều dữ liệu có sẵn có thể gây lo ngại nếu không đủ chỗ chứa. Người dùng được cấp phép phải có quyền truy cập vào dữ liệu ở đâu và khi nào mà họ cần mà không bị gián đoạn đột ngột quy trình công việc hoặc hoạt động hàng ngày.

Khi bạn hiểu các mục tiêu và lợi ích chính của DLM, bạn sẽ sẵn sàng xem xét kỹ hơn toàn bộ khuôn khổ DLM và cách nó áp dụng cụ thể cho tổ chức của bạn.

 
Mục tiêu chính của Data Lifecycle Management là tăng tính toàn vẹn dữ liệu

Khung quản lý vòng đời dữ liệu

Mỗi doanh nghiệp có cách diễn giải và phân loại dữ liệu riêng, tùy thuộc vào mô hình kinh doanh, công cụ phần mềm và chiến lược quản lý dữ liệu riêng lẻ của bạn. Tuy nhiên, các giai đoạn mà dữ liệu trải qua trong vòng đời của nó có xu hướng nhất quán trong hầu hết các tình huống.


  • Tạo dữ liệu (Creation): Giai đoạn đầu tiên của DLM là tạo và thu thập dữ liệu. Điều này có thể ở nhiều dạng, từ PDF và hình ảnh đến tài liệu Word, thông tin cơ sở dữ liệu SQL và dữ liệu SaaS tồn tại trên các nền tảng như Salesforce CRM. Bạn có thể thu thập dữ liệu hiện có từ một tổ chức bên ngoài hoặc nhập dữ liệu nội bộ theo cách thủ công. Thông tin được tạo bởi các thiết bị hoặc hệ thống cũng nằm trong giai đoạn này của khung dưới dạng thu thập dữ liệu.
  • Lưu trữ dữ liệu (Storage): Sau khi thu thập, nhập dữ liệu, bạn sẽ cần lưu trữ dữ liệu đó. Trong phương pháp DLM, điều đó có nghĩa là bảo vệ dữ liệu theo cách phù hợp với mức độ nhạy cảm hoặc quan trọng của thông tin đó. Bạn cũng sẽ cần triển khai quy trình sao lưu và phục hồi mạnh mẽ để đảm bảo lưu giữ dữ liệu trong thời gian dài. Thiết lập các chính sách xung quanh việc lưu trữ dữ liệu và cách sử dụng cả môi trường lưu trữ và đám mây có chứa dữ liệu không hoạt động.
  • Sử dụng dữ liệu (Usage): Dữ liệu được phân loại, sử dụng và chia sẻ bởi các thành viên trong tổ chức của bạn trong giai đoạn này. Bạn cần đảm bảo tuân thủ các chính sách quản lý dữ liệu trong khi dữ liệu được sử dụng. Việc sử dụng thường được coi là giai đoạn nhạy cảm nhất trong vòng đời dữ liệu, vì vậy bạn cần thiết lập các hệ thống theo dõi và các bản kiểm tra để đảm bảo mọi thay đổi hoặc chỉnh sửa đối với dữ liệu đều được ghi lại. Trong một số trường hợp nhất định, dữ liệu cũng có thể được cung cấp cho những người bên ngoài tổ chức của bạn.
  • Chia sẻ và lan tỏa (Share, Disseminate): Truyền thông tất cả thông tin từ các kết quả phân tích tới các bên liên quan bằng cách sử dụng báo cáo tổng hợp và các loại trực quan hóa dữ liệu khác nhau như biểu đồ, bảng điều khiển, biểu đồ, v.v.
  • Lưu trữ dữ liệu (Archival): Lưu trữ dữ liệu của bạn trong một môi trường an toàn và bảo mật là giai đoạn tiếp theo của khung DLM. Kho lưu trữ chỉ đơn giản là một vị trí nơi dữ liệu được lưu trữ mà không cần bảo trì hoặc sử dụng chung. Dữ liệu không còn cần thiết cho các hoạt động kinh doanh đang diễn ra nên được lưu trữ và tách biệt khỏi dữ liệu đang được sử dụng tích cực để tránh trộn lẫn hoặc xử lý sai. Kho lưu trữ của bạn cũng có thể khôi phục dữ liệu của bạn về môi trường hoạt động ngay lập tức nếu và khi cần thiết.
  • Phá hủy dữ liệu (Destruction): Dữ liệu là động lực đằng sau một tổ chức, nhưng nó cũng có thể là một tài sản độc hại. Giữ dữ liệu không phục vụ bất kỳ mục đích nào chỉ khiến bạn gặp những thông tin rủi ro liên quan đến nó. Do đó, tại một thời điểm nào đó, bạn sẽ cần hủy dữ liệu vì mục đích an toàn và tuân thủ các quy định như GDPR, vốn kết hợp các nguyên tắc Data Lifecycle Management (DLM). Việc hủy dữ liệu thường diễn ra từ vị trí lưu trữ và phải được thực hiện theo chính sách DLM của tổ chức. Cách bạn hủy dữ liệu cũng sẽ tùy thuộc vào phương tiện hoặc thiết bị chứa dữ liệu đó, từ các ổ lưu trữ dữ liệu không hoạt động cho đến các máy chủ đám mây riêng.

    Tuy nhiên, trước khi hủy bất kỳ dữ liệu nào, điều quan trọng là phải xác nhận xem có bất kỳ chính sách nào yêu cầu bạn giữ lại dữ liệu trong một khoảng thời gian nhất định hay không.

Hình thức của các giai đoạn này sẽ phụ thuộc vào quy trình kinh doanh và nền tảng bảo mật dữ liệu của tổ chức bạn, cũng như các quy định hiện hành về quyền riêng tư như GDPR và CCPA. Điều quan trọng cần lưu ý là các pha không nhất thiết phải tuyến tính. Việc tạo, lưu trữ và sử dụng dữ liệu thường diễn ra đồng thời trong suốt quá trình hoạt động của doanh nghiệp.

Tương lai của Data Lifecycle Management?

Thuật ngữ DLM đã xuất hiện từ những năm 1990 và vẫn đang mở rộng và tiến hóa phức tạp hơn. Ngày nay, thuật ngữ này đề cập đến một bộ quy trình — chẳng hạn như quản trị thông tin, quản lý chất lượng dữ liệu hoặc quản lý kiến ​​trúc doanh nghiệp — được thiết kế để đảm bảo rằng dữ liệu đáng tin cậy, có thể truy cập và có thể tương tác trên các hệ thống thông tin doanh nghiệp. Được định nghĩa theo nghĩa rộng, quản lý vòng đời dữ liệu thúc đẩy việc tối ưu hóa các hoạt động khác nhau diễn ra trong suốt vòng đời dữ liệu, từ thu nhận đến lan tỏa. Chẳng hạn, một tổ chức vận dụng DLM sẽ đảm bảo rằng các bộ dữ liệu chính như hồ sơ khách hàng, lịch sử sản phẩm và đơn đặt hàng được ghi lại đầy đủ để đảm bảo tính toàn vẹn của dữ liệu cơ bản.

Tổng hợp, sưu tầm và dịch từ Internet


Lập mô hình dữ liệu là gì?
Hiện nay, các tổ chức thu thập một lượng lớn dữ liệu từ nhiều nguồn khác nhau. Tuy nhiên, dữ liệu thô là chưa đủ. Bạn cần phân tích dữ liệu để thu được thông tin chuyên sâu hữu ích có thể hướng dẫn bạn đưa ra những quyết định kinh doanh mang lại lợi nhuận.