Quản trị dữ liệu trong các ngân hàng thương mại Việt Nam: thực trạng và giải pháp (Phần I)
Thực trạng quản trị dữ liệu trong các ngân hàng thương mại Việt Nam Quản trị dữ liệu xuất hiện từ những năm 1990 - 2010, khi mà các tổ chức bắt đầu xây dựng kho dữ liệu (Data Warehouse) để lưu trữ và quản lý dữ liệu dựa trên các mô hình dữ liệu (data model). Tuy nhiên, ở giai đoạn /này, Quản trị dữ liệu chỉ xoay quanh từng hệ thống đơn lẻ, chưa có sự gắn kết trên toàn bộ hệ thống. Từ năm 2010, khi mức độ tăng trưởng dữ liệu tăng cao, để tiến hành phân tích dữ liệu, các doanh nghiệp cần có sự tương tác, phối hợp của nhiều hệ thống, và lúc này họ bắt đầu để ý đến giá trị của dữ liệu. Lúc đó khái niệm Quản trị dữ liệu toàn diện mới thực sự hình thành với 3 trụ cột chính: Con người - mô hình tổ chức, Chính sách - quy định, và Công nghệ dữ liệu.
Tại Việt Nam, khái niệm Quản trị dữ liệu cũng được đưa vào khá sớm, năm 2014, ngân hàng TMCP Việt Nam Thịnh Vượng đã triển khai dự án Khung Quản trị dữ liệu và bắt đầu áp dụng Quản trị dữ liệu ở quy mô nhỏ, Quản trị chất lượng dữ liệu vào năm 2015. Từ năm 2014 đến nay, các ngân hàng đã manh nha việc triển khai Quản trị dữ liệu toàn diện. Tuy nhiên kết quả vẫn còn rất hạn chế, khi hiện tại các ngân hàng triển khai Quản trị dữ liệu vẫn chỉ đếm trên đầu ngón tay, nếu đánh giá một cách thực sự công tâm, thì mức độ triển khai của các ngân hàng này vẫn chỉ ở mức bắt đầu, sơ khởi. Sau đây, bài báo sẽ đi sâu phân tích quản trị dữ liệu dưới hai khía cạnh: Hệ thống hạ tầng và mô hình tổ chức.
Hệ thống hạ tầng dữ liệu
Từ năm 2000 đến năm 2010, phần lớn các ngân hàng đều triển khai xây dựng kho dữ liệu. Tuy nhiên, do việc xây dựng chưa có quy hoạch dẫn đến tồn tại nhiều kho dữ liệu phục vụ nhiều mục đích khác nhau.
Hình 1. Mô hình dữ liệu thực tế tại một ngân hàng với nhiều kho dữ liệu khác nhau.
Việc này dẫn đến một loạt các vấn đề như sau:
- Do tồn tại nhiều kho dữ liệu khác nhau phục vụ mục đích khác nhau, dẫn đến báo cáo từ các kho này sẽ khác nhau. Việc phân định báo cáo nào là chính xác mất rất nhiều thời gian do phải tìm hiểu nguồn dữ liệu và cách thức xử lý dữ liệu.
- Việc tồn tại nhiều kho dữ liệu dẫn đến việc quản lý không hiệu quả, làm tăng nguy cơ rò rỉ dữ liệu ra bên ngoài. Thực tế, năm 2012 đã có ngân hàng tiến hành truy tố nhân viên của mình do lấy dữ liệu khách hàng và bán ra thị trường.
- Việc quản lý dữ liệu trên các kho do nhiều người thực hiện, và quá trình triển khai không thực hiện tài liệu ghi nhận hệ thống, dẫn đến việc khai thác dữ liệu không hiệu quả và phải phụ thuộc vào một số cá nhân đã làm lâu năm am hiểu hệ thống. Sẽ rất khó để tìm được đúng dữ liệu mình cần nếu không có hệ thống Siêu dữ liệu.
Với mô hình dữ liệu như Hình 1, các ngân hàng hiện tại đang chưa thực sự quản trị dữ liệu do:
- Chiến lược dữ liệu nhằm phục vụ các mục tiêu kinh doanh của ngân hàng;
- Mô hình kiến trúc tổng thể được quy hoạch dài hạn và quản lý bởi đơn vị chuyên trách;
- Hệ thống các chính sách, quy định về dữ liệu để hướng dẫn các đơn vị trong ngân hàng tuân thủ;
- Hệ thống siêu dữ liệu là nơi ghi nhận quá trình phát triển, luồng dữ liệu, ý nghĩa của các phân hệ, bảng, trường dữ liệu;
- Chưa phân loại được dữ liệu, chưa có hệ thống Quản lý dữ liệu chủ.
Hình 2. Mô hình dữ liệu thực tế tại một ngân hàng, tồn tại nhiều kho dữ liệu khác nhau.
Hình 3. Mức đầu tư cho một khách hàng tại Việt Nam và các khu vực.
Mô hình tổ chức quản trị dữ liệu
Về nhận thức giá trị của dữ liệu đối với tổ chức, năm 2018 tác giả có thực hiện một khảo sát chuyên gia trong phạm vi nhỏ về Mức độ trưởng thành của Quản trị dữ liệu trong ngân hàng. Kết quả là nhận thức về giá trị của dữ liệu trong ngân hàng vẫn đang còn rất hạn chế, mới đạt mức 1 - Chưa triển khai trong 6 mức trưởng thành của Quản trị dữ liệu. Điều này cho thấy, các ngân hàng tại Việt Nam hiểu rõ giá trị của dữ liệu, tuy nhiên để coi dữ liệu là “tài sản chiến lược” thì thực sự khó. Các ngân hàng còn đang rất lúng túng trong việc hiểu đúng giá trị của dữ liệu và cách thức triển khai Quản trị dữ liệu.
Điều này cũng tương đối phù hợp với một khảo sát được tác giả thực hiện năm 2018 về định mức đầu tư cho một khách hàng, so sánh giữa các ngân hàng Việt Nam và các ngân hàng trong khu vực Châu Á, Châu Phi, Trung Đông và Châu Âu.
Với mỗi khách hàng, các ngân hàng tại Việt Nam đầu tư trung bình khoảng 0.5$, trong khi đó các ngân hàng tại khu vực Châu Á Thái Bình Dương và khu vực Châu Phi đầu tư 3.84$ và 3.53$, khu vực Trung Đông và Châu Âu mức đầu tư cao hơn rất nhiều. Việc đầu tư vào công nghệ thu thập, quản lý và khai thác thông tin khách hàng cũng phần nào cho thấy mức độ quan tâm tới dữ liệu của ngân hàng.
Về mô hình tổ chức, hiện tại phần lớn các ngân hàng đang chưa có một đơn vị độc lập, chuyên trách quản trị và khai thác dữ liệu.
Các ngân hàng hiện đang phân bổ các đơn vị quản trị và khai thác dữ liệu thành các đơn vị trực thuộc Khối và chưa tập trung. Ví dụ: khối Tài chính kế toán có đơn vị khai thác dữ liệu với tên gọi như Hệ thống Thông tin Quản lý, Tài chính doanh nghiệp hoặc Quản lý hiệu suất; các khối Bán lẻ, khối Doanh nghiệp có đơn vị làm báo cáo độc lập thường được gọi là Phòng Phát triển kinh doanh, Phòng hỗ trợ kinh doanh... Ngoài các đơn vị này, một số ngân hàng còn có đơn vị khai thác dữ liệu trực thuộc Văn phòng Tổng Giám Đốc, Trung tâm Xuất sắc (Center of Excellence), với các tên gọi khác nhau như Trung tâm Năng lực Thông tin Kinh doanh (Business Intelligence Competency Center) hoặc Trung tâm Phân tích kinh doanh.
Việc phân bổ mô hình tổ chức phân tán như Hình 4 cũng tương đối phù hợp với những phân tích ở Hình 1, Hình 2. Với mô hình tổ chức phân tán như vậy thì các ngân hàng cũng chưa thể quản trị và khai thác dữ liệu một cách tối ưu. Vậy để triển khai Quản trị dữ liệu, các ngân hàng cần bắt đầu từ đâu, các giải pháp cụ thể sẽ được trình bày ở Phần II của bài viết này.
Hình 4. Mô hình tổ chức đơn vị quản trị và khai thác dữ liệu tại các ngân hàng Việt Nam.
Nguyễn Minh Đức, Giám đốc Dữ liệu Ngân hàng TMCP Quân đội