BVR&MT – Chia sẻ dữ liệu là vấn đề phức tạp, thường được đặt ra tại các diễn đàn thảo luận về chuyển đổi số. Từ góc nhìn kỹ thuật, thách thức về chia sẻ dữ liệu nằm ở sự thống nhất về tiêu chuẩn thiết kế cơ sở dữ liệu. Trên thế giới, bài toán này đã được giải quyết tương đối hiệu quả dựa trên tư duy về Quản lý dữ liệu dùng chung (Master data management – MDM). Cách tiếp cận này có nhiều điểm phù hợp khi ứng dụng vào thiết kế cơ sở dữ liệu tổng thể của Chương trình xây dựng nông thôn mới. Trong bài viết này, các tác giả sẽ phân tích các yếu tố phù hợp và đề xuất một thiết kế dựa trên MDM.
MDM và ứng dụng trên thế giới
Ở nước ta, mỗi bộ/ngành đều có cơ sở dữ liệu riêng được đầu tư và xây dựng công phu, sau đó được lưu trữ tại các trung tâm dữ liệu của ngành. Các cơ sở dữ liệu này đều gặp phải một vấn đề là chưa làm tốt việc phân tách phần dữ liệu dùng chung và dữ liệu chuyên ngành. Tình trạng này dẫn đến vấn đề trùng lặp dữ liệu giữa các tổ chức, ảnh hưởng đến tốc độ thực hiện chuyển đổi số quốc gia và gây lãng phí nguồn lực. Do đó, một sáng kiến cấp Chính phủ nhằm giảm trùng lặp và tăng chất lượng dữ liệu, cho phép tích hợp, chia sẻ dữ liệu rộng hơn và loại bỏ các hoạt động tích hợp trùng lặp được đề xuất với tên gọi MDM.
Về khái niệm, MDM là quy trình bao gồm cả công nghệ và công cụ với mục tiêu đảm bảo dữ liệu dùng chung được điều phối trong tổ chức, trong trường hợp này là toàn bộ Chính phủ. MDM cung cấp truy xuất dữ liệu dùng chung thống nhất, chính xác, nhất quán, đầy đủ trong nội bộ tổ chức và cho các bên thứ 3 có nhu cầu sử dụng, phát triển ứng dụng dựa trên dữ liệu dùng chung.
MDM không chỉ là một vấn đề công nghệ. Thực tế triển khai cho thấy, những rào cản lớn nhất khi áp dụng MDM thường mang tính chính trị hơn là kỹ thuật. Nó bao gồm cả việc can thiệp chính sách mạnh mẽ để khởi tạo và duy trì dữ liệu dùng chung. Sau đó, cần đầu tư nhiều thời gian, kinh phí và công sức vào việc định chuẩn một tập hợp dữ liệu dùng chung đồng bộ, đồng thời phát triển các công cụ và quy trình để giữ cho dữ liệu này “sạch” và nhất quán khi nó được cập nhật và mở rộng theo thời gian.
Tùy thuộc vào công nghệ được sử dụng, MDM có thể bao gồm một miền hoặc nhiều miền như: thông tin định danh, thông tin nhân khẩu học… Các lợi ích của áp dụng MDM thể hiện rõ ở việc người dùng có trải nghiệm quản lý dữ liệu nhất quán; rào cản công nghệ đối với việc tích hợp được giảm thiểu; khả năng chia sẻ, liên thông dữ liệu tham chiếu giữa các miền cao, tổng chi phí xây dựng cơ sở dữ liệu thấp hơn và lợi tức đầu tư cao hơn.
Đã có nhiều quốc gia phát triển trên thế giới ứng dụng MDM. Nổi bật có thể kể đến hệ thống quản lý thông tin doanh nghiệp của Úc, hệ thống dịch vụ đào tạo một cửa của New Zealand, hệ thống thông tin sức khỏe và dịch vụ y tế quốc gia của Vương quốc Anh. Khi MDM được áp dụng, dữ liệu dùng chung có giá trị tiềm năng từ nhiều tổ chức trong chính phủ được xác định và hợp nhất trong một kho lưu trữ trung tâm. Kho lưu trữ này đóng vai trò như một “nguồn dữ liệu tiêu chuẩn” cho việc phát triển ứng dụng trong các tổ chức, đồng thời mang lại rất nhiều cơ hội đột phá cho các tổ chức khởi nghiệp đổi mới sáng tạo.
Quản trị dữ liệu trong thực hiện Chương trình xây dựng nông thôn mới
Việt Nam là một trong những quốc gia sớm có chương trình, chiến lược về chuyển đổi số, thuộc nhóm quốc gia có nhận thức về chuyển đổi số tiên tiến trên thế giới. Tính đến tháng 9/2021, đã có 6 bộ/ngành và 20 địa phương ban hành kế hoạch chuyển đổi số cấp bộ, tỉnh/thành phố. Tại khu vực nông thôn, cơ sở hạ tầng kỹ thuật công nghệ thông tin và truyền thông đang phát triển nhanh chóng, góp phần thúc đẩy phát triển kinh tế – xã hội…, đáp ứng nhu cầu trao đổi thông tin và giao lưu văn hóa của nhân dân. Khoảng 70% dân số Việt Nam sử dụng điện thoại di động, trong đó 64% các thuê bao đã kết nối mạng 3G và 4G, khoảng 95% địa bàn các xã trên cả nước đã được phủ sóng mạng 4G. Việc xây dựng chính quyền số, đặc biệt là xây dựng hệ thống dịch vụ công trực tuyến được nhiều địa phương đẩy mạnh, một số địa phương đã xây dựng được hệ thống liên thông từ cấp tỉnh, huyện, xã. Sản xuất nông nghiệp đã từng bước áp dụng công nghệ thông tin trong truy xuất nguồn gốc, thương mại điện tử…
Trong bối cảnh chuyển dịch số là xu hướng tất yếu, Bộ Nông nghiệp và Phát triển nông thôn xác định việc ứng dụng công nghệ số, hệ thống cơ sở dữ liệu lớn, trí tuệ nhân tạo… là những giải pháp mang tính đột phá để có thể giải quyết những khó khăn, nút thắt trong quá trình xây dựng nông thôn mới ở Việt Nam. Việc chuyển đổi số và ứng dụng công nghệ thông tin tại nông thôn cũng đã được manh nha triển khai tại một số địa phương, nhưng chủ yếu vẫn mang tính tự phát. Nhiều địa phương đã thí điểm ứng dụng công nghệ thông tin trong quản lý, giám sát điều hành nông thôn mới, mới đây nhất là ứng dụng trong triển khai chấm điểm đánh giá phân hạng sản phẩm Chương trình mỗi xã một sản phẩm (OCOP) và thẩm định hồ sơ công nhận đạt chuẩn nông thôn mới, cũng như giám sát trực tuyến (GSTT) thực hiện Chương trình.
Đặc thù của việc công nhận xã đạt chuẩn nông thôn mới cần tính toán 19 tiêu chí, từ 12 ngành như: y tế (dữ liệu về bảo hiểm xã hội, trạm xá, bệnh viện…), giáo dục (trường học, giáo viên, học sinh…), môi trường (số lượng các cơ sở sản xuất, phát thải…)… Mỗi ngành có hệ thống cơ sở dữ liệu và chính sách quản trị dữ liệu khác nhau, với các phần mềm chuyên ngành được triển khai theo đặc thù của từng ngành. Dữ liệu tạo ra ngày một nhiều, nhưng thiếu đồng bộ về cấu trúc, gần như bất khả thi về khả năng đối chiếu, hợp nhất. Dữ liệu bị phân mảnh, thiếu tính nhất quán, làm giảm chất lượng dữ liệu dẫn tới mất đi rất nhiều giá trị sử dụng. Các nguyên tắc về thiết kế hệ thống thông tin cũng đã nhấn mạnh về khả năng đồng bộ dữ liệu. Nhưng do hạn chế về năng lực công nghệ, đồng thời khuyết thiếu một phương pháp MDM từ cách đặt đầu bài, đến giám sát, nghiệm thu khả năng đồng bộ dữ liệu của các phần mềm, dẫn tới việc khi các đơn vị xây dựng phần mềm hết thời gian bảo hành, khả năng đấu nối để chia sẻ dữ liệu gần như không có. Mặt khác, nhiều dự án công nghệ thông tin phục vụ quản lý nhà nước do không đặt người dùng làm trọng tâm, dẫn đến thiết kế giao diện phức tạp, không thân thiện, cách triển khai cơ học, làm khó người dùng, bắt người dùng thay đổi thói quen. Trong quá trình thực hiện việc thu thập dữ liệu cộng đồng tại một số địa phương, vai trò chủ thể của nhân dân, sức mạnh chủ động của cộng đồng cơ sở chưa được đề cao.
Trong bối cảnh chuyển đổi số quốc gia, việc triển khai phần mềm chuyên ngành cần được giám sát duy trì thực hiện theo các tiêu chí nông thôn mới một cách liên tục, thống nhất về phương pháp, chủ động thu thập phản hồi, lắng nghe ý kiến đánh giá của nhân dân, tạo ra một vòng tuần hoàn thông tin liên tục để làm căn cứ chỉ đạo, đôn đốc hoàn thiện các tiêu chí cơ bản, nỗ lực đạt các tiêu chí nâng cao, hướng tới các mô hình nông thôn mới kiểu mẫu. Đây được coi là vấn đề cấp thiết cho số hóa dữ liệu và tin học hóa nghiệp vụ quản lý. Tuy nhiên, để tiến tới ứng dụng công nghệ thông tin một cách tổng thể và toàn diện, thực hiện việc quản lý thống nhất trên một hệ thống thông minh, bài toán lớn đặt ra là cách thức chia sẻ dữ liệu giữa các hệ thống một cách hiệu quả.
Cách tiếp cận về MDM khi thực hiện GSTT
Hệ thống GSTT (có ứng dụng trí tuệ nhân tạo) trong thực hiện Chương trình xây dựng nông thôn mới được xây dựng trên hai nền tảng Website và chatbot Zalo. Hệ thống có các nhóm người dùng cụ thể như: các cán bộ quản lý Chương trình xây dựng nông thôn mới các cấp; người dân sinh sống tại các địa phương; thành viên của các ban giám sát đầu tư cộng đồng (thường là người dân tại địa phương, có uy tín trong cộng đồng) hay khách vãng lai muốn truy cập hệ thống để thu thập thông tin đã được công khai về quá trình, kết quả thực hiện, kết quả giám sát xây dựng nông thôn mới.
Hệ thống phần mềm GSTT được thiết kế có thể sẵn sàng đấu nối với phần mềm chuyển đổi số phương thức quản lý, giám sát việc thực hiện xây dựng nông thôn mới và các hệ thống, cơ sở dữ liệu liên ngành khác qua API, nhằm kế thừa các tính năng sẵn có, liên thông dữ liệu, tiết kiệm chi phí triển khai và tạo ra một môi trường tương tác thuận tiện cho người dùng. Quản trị hệ thống quản lý và phân quyền người dùng theo chức năng, nhiệm vụ được phân công; thiết lập các tham số hệ thống; quản lý dữ liệu danh mục…, đảm bảo cho hệ thống hoạt động an toàn, ổn định, đáp ứng yêu cầu tác nghiệp và bảo mật dữ liệu.
Trong quá trình thiết kế hệ thống này, nhóm tác giả nhận thấy những khối dữ liệu sau đây sẽ được dùng chung ở phần lớn các ứng dụng.
Dữ liệu định danh người dùng: với việc tiếp cận 4 nhóm người dùng trong thực hiện Chương trình xây dựng nông thôn mới, phần mềm GSTT bao phủ gần như toàn bộ các đối tượng sử dụng và các trường hợp phân quyền phức tạp. Trong bối cảnh chuyển đổi số quốc gia, khi có rất nhiều đơn vị tham gia làm ứng dụng, nếu yêu cầu người dùng phải nhớ tài khoản, mật khẩu riêng cho mỗi ứng dụng là cách làm quan liêu, không đặt người dùng vào trọng tâm, dẫn tới kém hiệu quả trong triển khai. Đây là vấn đề mà bất cứ ứng dụng nào cũng đều phải giải quyết. Cách tiếp cận ứng dụng MDM là xác định một thông tin mang tính đặc trưng của các đối tượng (ví dụ: số điện thoại đã được đăng ký chính chủ, số căn cước công dân…) sử dụng làm trường dữ liệu liên kết để định danh người dùng, từ đó xác định phân quyền phù hợp khi đấu nối với các hệ thống khác. Ví dụ: Đề án chuyển đổi số của Bộ Nông nghiệp và Phát triển nông thôn sẽ sử dụng email công việc được cấp cho các cán bộ làm tài khoản đăng nhập. Tại các địa phương có trình độ công nghệ thông tin phát triển, Sở Thông tin và Truyền thông cũng sẽ phát triển phân hệ SSO (Single sign one) giúp người dùng sử dụng một tài khoản duy nhất để đăng nhập tất cả các phần mềm đang triển khai trên toàn tỉnh. Khi phần mềm GSTT được triển khai, chúng tôi sử dụng định danh bằng số điện thoại di động, có xác nhận OTP qua SMS. Số điện thoại này khi đăng nhập vào Zalo và kết nối với Zalo OA sẽ được lưu trữ và truy vấn định danh trên cơ sở dữ liệu của tỉnh hay của bộ/ngành. Bài toán tương tự cũng được đặt ra với nhóm cán bộ địa phương và rộng hơn là truy vấn số điện thoại của người dân khi dữ liệu GSTT được liên thông với cơ sở dữ liệu quốc gia về dân cư.
Dữ liệu về các công trình nông thôn mới: trong quá trình triển khai thực hiện, dữ liệu về các công trình nông thôn mới nằm rải rác ở các đơn vị quản lý ngành dọc. Đối với một công trình, sẽ có nhiều ngành dọc quản lý. Xét ví dụ một khu chợ được đầu tư từ nguồn vốn xây dựng nông thôn mới, ngành công thương sẽ quản lý hộ kinh doanh trong chợ, ngành xây dựng quản lý hồ sơ bản vẽ kỹ thuật, ngành y tế quản lý an toàn vệ sinh thực phẩm…, khi có vấn đề phát sinh, từ góc độ người dùng, các phản ánh, góp ý được tạo ra cần được gắn với một mã định danh (id) duy nhất của công trình; mã định danh này là thống nhất, xuyên suốt khi đấu nối với các hệ thống khác; hay nói cách khác là trường dữ liệu được định nghĩa trong cơ sở dữ liệu dùng chung.
Dữ liệu về người dân nông thôn: đây là khối dữ liệu đồ sộ, khổng lồ, có giá trị to lớn nếu được tổng hợp và khai thác phù hợp. Bắt đầu với dữ liệu định danh của cơ sở dữ liệu dân cư quốc gia, các trường thông tin có thể được bổ sung cập nhật thông qua việc tính toán các tiêu chí nông thôn mới như: dữ liệu bảo hiểm y tế, tín dụng, lịch sử lao động việc làm… Các dữ liệu này trong quá trình tính toán tiêu chí nông thôn mới đều đã được rà soát, tổng hợp, nhưng không được số hóa và “làm sạch”, dẫn đến sự lãng phí đáng kể về nguồn lực.
Trên cơ sở lý thuyết của việc ứng dụng MDM, nhóm tác giả đã thiết kế một bản đề xuất về Khung kiến trúc dữ liệu tổng thể dành cho Chương trình xây dựng nông thôn mới. Bản thiết kế này thể hiện mối quan hệ giữa các thành phần của lớp dữ liệu, lớp ứng dụng, lớp dịch vụ. Lớp dữ liệu được áp dụng MDM, để có thể kế thừa, giảm bớt thời gian và nguồn lực phát triển, đồng thời tăng khả năng liên kết, tổng hợp dữ liệu. Đối với lớp ứng dụng, bản thiết kế đề xuất mối quan hệ giữa các ứng dụng đã được triển khai như trục liên thông chính phủ điện tử, phần mềm văn phòng, đề xuất việc phát triển SSO tổng thể cho toàn ngành nông nghiệp, đồng thời kết nối với phần mềm đánh giá đạt chuẩn nông thôn mới và phần mềm triển khai OCOP, cũng như các ứng dụng mở rộng về truy xuất nguồn gốc, mã số vùng trồng… Lớp dịch vụ được cung cấp dựa trên các công cụ được phát triển ở lớp ứng dụng, có nhiệm vụ giống các đầu hút dữ liệu, liên tục cập nhật số liệu thông qua các dịch vụ đào tạo, tập huấn, tư vấn, hỗ trợ phát triển…, giúp cho cơ sở dữ liệu luôn cập nhật, sinh động với động lực nội sinh, không phụ thuộc vào các mệnh lệnh hành chính.
Với quan điểm được đề xuất trong dự thảo thực hiện Đề án chuyển đổi số nông thôn mới, trong đó cơ chế chính sách là nền tảng, công nghệ là đột phá và hướng triển khai theo phương châm “hạ tầng dùng chung, cơ sở dữ liệu tập trung”; thu hút các nguồn lực khác nhau, đặc biệt là doanh nghiệp tư nhân đầu tư và ứng dụng công nghệ số để đảm bảo đạt được mức độ chuyển đổi số toàn diện trong xây dựng nông thôn mới trong tất cả các khâu (từ sản xuất nông nghiệp, nâng cao đời sống nông thôn, xây dựng hạ tầng, giáo dục đào tạo, y tế, bảo vệ môi trường, phát triển văn hóa xã hội…) cho thấy tiềm năng tích cực trong việc áp dụng sáng kiến MDM để thúc đẩy chia sẻ dữ liệu trong xây dựng nông thôn mới ở nước ta.