UBND TP Hà Nội vừa ban hành Kế hoạch số 220/KH-UBND về tổ chức tích hợp, di trú và chuẩn hóa dữ liệu về Kho dữ liệu dùng chung của thành phố. Đây là bước đi cụ thể nhằm xây dựng hạ tầng dữ liệu phục vụ quản trị đô thị, điều hành và phát triển kinh tế - xã hội trên nền tảng số.
Kế hoạch này nằm trong chương trình hành động thực hiện Nghị quyết 57 của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số, đồng thời bám sát định hướng chuyển đổi số của Hà Nội trong năm 2026.
Dữ liệu không còn nằm rời rạc ở từng cơ quan
Theo kế hoạch, Hà Nội xác định dữ liệu không chỉ là tài nguyên lưu trữ phân tán ở từng sở, ngành, địa phương mà phải trở thành nền tảng phục vụ quản trị, điều hành và ra quyết định. Thành phố đặt mục tiêu rà soát, chuẩn hóa và khai thác hiệu quả các nguồn dữ liệu hiện có. Dữ liệu sau chuẩn hóa phải bảo đảm yêu cầu “đúng, đủ, sạch, thống nhất”, có khả năng kết nối, liên thông và sử dụng chung.
Cách làm này nhằm khắc phục tình trạng dữ liệu phân tán, thiếu kết nối, khó khai thác hoặc khai thác chưa hiệu quả trong quản lý nhà nước.
Điểm đáng chú ý là Kho dữ liệu dùng chung của Hà Nội sẽ được xây dựng theo mô hình Data Lakehouse. Đây là mô hình kết hợp khả năng lưu trữ dữ liệu quy mô lớn của Data Lake với năng lực quản trị, phân tích của Data Warehouse. Tuy nhiên, kho dữ liệu này không thay thế các cơ sở dữ liệu chuyên ngành hiện có. Các hệ thống chuyên ngành vẫn giữ vai trò là nguồn dữ liệu gốc. Kho dữ liệu dùng chung sẽ tiếp nhận, đồng bộ, chuẩn hóa, tích hợp và cung cấp dữ liệu phục vụ khai thác liên ngành, chỉ đạo điều hành, phân tích, dự báo và cung cấp dịch vụ dữ liệu theo phân quyền.
Hà Nội cũng nhấn mạnh nguyên tắc không số hóa đại trà, không tích hợp dữ liệu chỉ để lưu trữ. Việc di trú và chuẩn hóa dữ liệu phải dựa trên mức độ sẵn sàng của từng hệ thống, giá trị khai thác thực tế và yêu cầu nghiệp vụ cụ thể. Quá trình triển khai cũng phải bảo đảm không làm gián đoạn các hệ thống đang vận hành.
Trước khi tích hợp, dữ liệu phải được phân loại rõ ràng, xác định chủ quản, phạm vi chia sẻ, cơ chế cập nhật. Đồng thời, các đơn vị phải tuân thủ yêu cầu về bảo vệ dữ liệu cá nhân, bảo vệ bí mật nhà nước, an toàn thông tin và an ninh mạng.
Định hướng phát triển các ứng dụng trí tuệ nhân tạo
Định hướng phát triển các ứng dụng trí tuệ nhân tạo dựa trên Kho dữ liệu dùng chung cũng là điểm nhấn đáng chú ý. Trong giai đoạn đầu, Hà Nội sẽ thí điểm 5 bài toán ưu tiên: phân tích dữ liệu kinh tế - xã hội phục vụ điều hành; phân tích phản ánh, kiến nghị từ ứng dụng iHanoi; hỗ trợ thẩm định hồ sơ đầu tư - xây dựng; hỗ trợ giải quyết thủ tục hành chính; và xây dựng bộ dữ liệu dùng chung để huấn luyện các mô hình AI chuyên ngành của thành phố. Kết quả triển khai dữ liệu sẽ được gắn với công tác đánh giá thi đua, khen thưởng hằng năm.
Ưu tiên dữ liệu tác động trực tiếp đến điều hành
Để hiện thực hóa mục tiêu trên, Hà Nội xây dựng lộ trình triển khai với nhiều nhóm nhiệm vụ cụ thể. Trước hết, các sở, ban, ngành sẽ rà soát, chuẩn hóa và lập danh mục dữ liệu, hệ thống thông tin, cơ sở dữ liệu chuyên ngành thuộc phạm vi quản lý. Việc rà soát không chỉ dừng ở thống kê hiện trạng, mà còn phải đánh giá khả năng kết nối, mức độ cập nhật, nhu cầu khai thác liên ngành và những khó khăn trong chia sẻ dữ liệu.
Song song với đó, thành phố sẽ hoàn thiện kiến trúc tổng thể và yêu cầu kỹ thuật cho việc tích hợp dữ liệu vào Kho dữ liệu dùng chung, bảo đảm đồng bộ với nền tảng tích hợp, chia sẻ dữ liệu của thành phố. Một mốc quan trọng khác là triển khai hạ tầng kỹ thuật và vận hành hệ thống Kho dữ liệu dùng chung trước ngày 30/10. Hệ thống này phải đáp ứng yêu cầu tiếp nhận, lưu trữ, xử lý, quản lý và khai thác dữ liệu từ các sở, ngành theo lộ trình được phê duyệt.
Trong giai đoạn đầu, Hà Nội ưu tiên tích hợp các nhóm dữ liệu có tác động trực tiếp tới quản lý và điều hành. Các lĩnh vực được nhắc tới gồm kinh tế, tài chính, đầu tư công, giao thông, xây dựng, đất đai, môi trường, y tế, giáo dục, du lịch và hành chính công. Danh mục dữ liệu ưu tiên khá rộng, từ dữ liệu thu - chi ngân sách, doanh nghiệp, đầu tư công, thương mại điện tử, điện năng, giao thông công cộng, đất đai, môi trường, hồ sơ sức khỏe điện tử, bảo hiểm xã hội, giáo dục, quy hoạch đô thị đến dịch vụ công trực tuyến và khoa học công nghệ. Việc lựa chọn dữ liệu ưu tiên sẽ được thực hiện theo nguyên tắc có trọng tâm, căn cứ nhu cầu chỉ đạo điều hành của thành phố, mức độ sẵn sàng của hệ thống và khả năng bảo đảm an toàn thông tin.
Giảm hồ sơ người dân phải nộp
Kế hoạch của Hà Nội đặt ra nhiều chỉ tiêu định lượng cụ thể. Thành phố yêu cầu 100% sở, ban, ngành hoàn thành lập danh mục dữ liệu; 100% cơ sở dữ liệu chuyên ngành được đánh giá mức độ sẵn sàng tích hợp; tối thiểu 80% dữ liệu thuộc danh mục ưu tiên được đưa vào Kho dữ liệu dùng chung. Ở chiều khai thác, Hà Nội đặt mục tiêu cung cấp tối thiểu 50 dịch vụ API dữ liệu dùng chung. Đồng thời, ít nhất 70% nhu cầu khai thác dữ liệu liên ngành phải được thực hiện qua kết nối điện tử.
API dữ liệu dùng chung có thể hiểu là cầu nối kỹ thuật cho phép các hệ thống phần mềm khác nhau truy xuất, trao đổi và sử dụng lại dữ liệu từ một kho lưu trữ tập trung một cách tự động. Cách làm này giúp hạn chế việc sao chép, nhập liệu thủ công, đồng thời cung cấp dữ liệu tức thời và an toàn hơn cho nhiều ứng dụng.
Trong cải cách hành chính, Hà Nội kỳ vọng giảm tối thiểu 30% thành phần hồ sơ mà người dân, doanh nghiệp phải cung cấp lại. Thành phố cũng đặt mục tiêu giảm ít nhất 30% thời gian tra cứu, xác minh thông tin trong quá trình giải quyết thủ tục hành chính. Trên nền dữ liệu đã được tích hợp, thành phố sẽ từng bước phát triển các công cụ khai thác dữ liệu phục vụ điều hành. Trong đó, ưu tiên hệ thống bảng điều hành số, báo cáo tổng hợp và các dịch vụ dữ liệu dùng chung.



