Download Luận văn thạc sĩ Quản trị kinh doanh (Hệ điều hành cao cấp): Ứng dụng big data phân tích lỗ hổng tín dụng cho vay và giải pháp hạn chế: Trường hợp của ngân hàng TMCP Sài Gòn (ThS08.064)
Thông qua nguồn dữ liệu Big data phục vụ phân tích và xác định những gian lận trong hoạt động tín dụng là một việc dường như mới lạ trong nghiên cứu này. Sự mới lạ được thể hiện trong nghiên cứu là sử dụng thuật toán C5.0 trên 2.572 khách hàng đang tham gia giao dịch tại SCB. Những khách hàng trong nghiên cứu được chọn có thời gian tham giao dịch vụ từ trên 12 tháng trở lên. Điều đó cho kết quả dự báo sẽ chính xác hơn.
Tuy nhiên, chúng ta cũng thừa biết rằng, các tiêu chí để xếp hạng hồ sơ của khách hàng đã được phía ngân hàng xây dựng theo một qui trình có đóng góp từ nhiều phía. Do vậy hồ sơ bị đánh giá lệch, cũng phải nói rằng, có trách nhiệm của nhân viên và cấp thẩm quyền phê duyệt sản phẩm đó. Các lỗ hổng trong phân tích có thể bao gồm những nội dung tóm tắt trong các điểm chính như sau:
– Khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân hàng, nhưng nhân viên tiếp nhận & cấp thẩm quyền cao nhất, không phát hiện hồ sơ rủi ro.
– Khách hàng cố tình gian lận trong việc cung cấp hồ sơ pháp lý ban đầu cho Ngân hàng, kế hợp với nhân viên tiếp nhận thông đồng, cấp thẩm quyền cao nhất không phát hiện hồ sơ rủi ro.
– Khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân hàng, kế hợp với lảnh đạo cấp thẩm quyền cao nhất của sản phẩm dịch vụ đó thông đồng, phát hiện ra hồ sơ mang tính rủi ro thấp hoặc trung bình từ khách hàng & lãnh đạo cấp thẩm quyền phê duyệt sản phẩm đó. …vv
Nghiên cứu này là một sự kế thừa thực tế, trên cơ sở đó áp dụng mô hình Fraud vào số liệu thực tế của một ngân hàng thương mại. Kết quả nghiên cứu có một đóng góp cực kỳ quan trọng cho việc xây dựng các giải pháp giảm thiểu rủi ro trong gian lận cho phía nhân viên của công ty và từ phía khách hàng. Các giải pháp được nêu trong phần tiếp theo.
ThS08.064_Ứng dụng big data phân tích lỗ hổng tín dụng cho vay và giải pháp hạn chế: Trường hợp của ngân hàng TMCP Sài Gòn
TRANG PHỤ BÌA LỜI CAM ĐOAN MỤC LỤC
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG BIỂU
DANH MỤC CÁC BIỂU ĐỒ TÓM TẮT
ABSTRACT
MỞ ĐẦU ............................................................................................................................1
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU....................1
1.1. Lý do chọn đề tài..........................................................................................................1
1.2. Mục tiêu nghiên cứu.....................................................................................................2
1.3. Phương pháp nghiên cứu..............................................................................................3
1.3.1. Đối với số liệu phục vụ nghiên cứu ..........................................................................3
1.3.2. Các khái niệm tiếp cận trong nghiên cứu..................................................................6
1.3.3. Phạm vi nghiên cứu của luận văn .............................................................................7
1.3.4. Kết cấu của luận văn .................................................................................................7
CHƯƠNG 2: CƠ SỞ LÝ LUẬN......................................................................................8
2.1. Big Data .......................................................................................................................8
2.2. Các ứng dụng của big data trong lĩnh vực ngân hàng................................................14
2.3. Khai phá dữ liệu (Data Mining) .................................................................................19
2.4. Hành vi tiêu dùng .......................................................................................................20
2.4.1. Định nghĩa ...............................................................................................................20
2.4.2. Hành vi tiêu dùng dựa trên phương pháp RFM ......................................................23
2.5. Mô hình đề xuất cho nghiên cứu................................................................................24
CHƯƠNG 3: ỨNG DỤNG BIG DATA TẠI SCB VÀ KẾT QUẢ PHÂN TÍCH DỮ
LIỆU .................................................................................................................................28
A. BIG DATA VÀ ỨNG DỤNG BIG DATA TẠI SCB ...............................................28
3.1. Big Data và ứng dụng của Big data trong lĩnh vực ngân hàng ..................................28
3.1.1. Big data ...................................................................................................................28
3.1.2. Ứng dụng của Big data trong lĩnh vực ngân hàng ..................................................29
3.2. Ứng dụng big data tại Ngân hàng TMCP Sài Gòn (SCB) .........................................36
3.2.1. Giới thiệu về SCB ...................................................................................................36
B. PHÂN TÍCH DỮ LIỆU BIG DATA .........................................................................37
4.1. Số liệu phục vụ nghiên cứu ........................................................................................37
4.2. Thông tin giao dịch khách hàng .................................................................................37
4.2.1. Đối với khách hàng tham gia dịch vụ vay...............................................................37
4.2.2. Thông tin khách hàng sử dụng thẻ ..........................................................................41
4.2.3. Phân tích mô hình gian lận Fraud trong kinh doanh ...............................................44
4.2.4. Thông tin giao dịch phân theo gian lận...................................................................52
CHƯƠNG 4: KẾT LUẬN VÀ XÂY DỰNG CHIẾN LƯỢC......................................54
A. KẾT LUẬN ................................................................................................................54
B. CÁC GIẢI PHÁP HẠN CHẾ LỖ HỔNG VÀ GIAN LẬN TRONG KINH
DOANH ............................................................................................................................56
C. PHÁT TRIỂN CÁC DỊCH VỤ CHO VAY...............................................................58
TÀI LIỆU THAM KHẢO
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Từ viết tắt Nguyên nghĩa
SCB Ngân hàng Thương Mại Cổ Phần Sài Gòn
RFM Recency, Frequency, Monatery
DANH MỤC CÁC BẢNG BIỂU
Table 1.1: Information of variables concerned ...................................................................4
Bảng 2.1. Các bước trong quá trình khai phá dữ liệu .......................................................19
Bảng 2.4. Bảng mô tả điểm theo RFM .............................................................................24
Bảng 4.1: Loại thẻ sử dụng của khách hàng theo nghề nghiệp.........................................43
Bảng 4.2: Thông tin các trường trong mô hình.................................................................45
Bảng 4.3: Thông tin các trường trong mô hình theo hành vi giao dịch ............................48
Bảng 4.4: Kết quả gian lận xét từ 2 mô hình gian lận.......................................................51
DANH MỤC CÁC BIỂU ĐỒ
Biểu đồ 2.5: Tiến trình tiếp cận phục vụ mô hình fraud ...................................................25
Biểu đồ 4.1: Thông tin giới tính khách hàng ....................................................................38
Biểu đồ 4.2: Thông tin trình độ học vấn ...........................................................................38
Biểu đồ 4.3: Nghề nghiệp của khách hàng........................................................................39
Biểu đồ 4.4: Loại khách hàng sử dụng dịch vụ tại ngân hàng ..........................................40
Biểu đồ 4.5: Thời gian tham gia dịch vụ của ....................................................................40
Biểu đồ 4.6: Thời gian tham gia dịch vụ theo loại khách hàng ........................................41
Biểu đồ 4.7: Các loại thẻ được sử dụng bởi khách hàng...................................................42
Biểu đồ 4.8: Thu nhập bình quân của khách hàng theo loại thẻ sử dụng .........................43
Biểu đồ 4.9: Kết quả từ thuật toán C5.0............................................................................46
Biểu đồ 4.10: Đánh giá mô hình dựa trên nhóm Training/Đào tạo và Testing/Kiểm
định....................................................................................................................................46
Biểu đồ 4.11: Kết quả gian lận xét trên hồ sơ gốc ban đầu...............................................47
Biểu đồ 4.12: Kết quả từ thuật toán C5.0 của bước 2 .......................................................49
Biểu đồ 4.13: Kết quả gian lận xét trên hồ sơ gốc ban đầu...............................................50
Biểu đồ 4.14: Kết quả Gian lận được xác định từ kết hợp hai mô hình............................52
Biểu đồ 4.14: Hạn mức sử dụng theo nhóm khách hàng ..................................................52
Biểu đồ 4.15: Nhóm khách hàng xếp loại theo ................................................................53
TÓM TẮT
Thông qua nguồn dữ liệu Big data phục vụ phân tích và xác định những gian lận trong hoạt động tín dụng là một việc dường như mới lạ trong nghiên cứu này. Sự mới lạ được thể hiện trong nghiên cứu là sử dụng thuật toán C5.0 trên 2.572 khách hàng đang tham gia giao dịch tại SCB. Những khách hàng trong nghiên cứu được chọn có thời gian tham giao dịch vụ từ trên 12 tháng trở lên. Điều đó cho kết quả dự báo sẽ chính xác hơn.
Tuy nhiên, chúng ta cũng thừa biết rằng, các tiêu chí để xếp hạng hồ sơ của khách hàng đã được phía ngân hàng xây dựng theo một qui trình có đóng góp từ nhiều phía. Do vậy hồ sơ bị đánh giá lệch, cũng phải nói rằng, có trách nhiệm của nhân viên và cấp thẩm quyền phê duyệt sản phẩm đó. Các lỗ hổng trong phân tích có thể bao gồm những nội dung tóm tắt trong các điểm chính như sau:
- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân hàng, nhưng nhân viên tiếp nhận & cấp thẩm quyền cao nhất, không phát hiện hồ sơ rủi ro.
- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ pháp lý ban đầu cho Ngân hàng, kế hợp với nhân viên tiếp nhận thông đồng, cấp thẩm quyền cao nhất không phát hiện hồ sơ rủi ro.
- Khách hàng cố tình gian lận trong việc cung cấp hồ sơ ban đầu cho Ngân hàng, kế hợp với lảnh đạo cấp thẩm quyền cao nhất của sản phẩm dịch vụ đó thông đồng, phát hiện ra hồ sơ mang tính rủi ro thấp hoặc trung bình từ khách hàng & lãnh đạo cấp thẩm quyền phê duyệt sản phẩm đó. …vv
Nghiên cứu này là một sự kế thừa thực tế, trên cơ sở đó áp dụng mô hình Fraud vào số liệu thực tế của một ngân hàng thương mại. Kết quả nghiên cứu có một đóng góp cực kỳ quan trọng cho việc xây dựng các giải pháp giảm thiểu rủi ro trong gian lận cho phía nhân viên của công ty và từ phía khách hàng. Các giải pháp được nêu trong phần tiếp theo.
ABSTRACT
The use of Big data in analyzing and identifying credit frauds is a novelty of this study, through the application of C5.0 algorithm on 2.572 customers who were transacting with the Sai Gon Joint Stock Commercial Bank (“SCB”). The customers selected for the study had transaction histories of more than 12 months, which allows for more accurate forecasts.
However, we also acknowledge that the criteria to evaluate a customer’s credit applications are developed by the bank through a process that incorporates inputs from multiple parties. Therefore, in the event a credit application is misevaluated, it is partially the responsibilities of the staff and approving authority. In summary, the gaps in credit evaluation may include the following:
- The customer commits fraud in the credit application submitted to the bank, but the receiving staff and the highest authority do not detect the credit risk.
- The customer commits fraud in the credit application submitted to the bank, with the collusion of the receiving staff, but the highest authority does not detect the credit risk.
- The customer commits fraud in the credit application submitted to the bank, but the highest authority assesses a low credit risk and connives at the red flags, approving the application.
This study is a practical succession, based on which the Fraud model is applied to the actual data of a commercial bank. The results of which make a tremendously important contribution to the development of solutions to mitigate the fraud risks attributed to the bank’s employees and its customers. Suggested solutions are outlined in the next section.
1
MỞ ĐẦU
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU
1.1. Lý do chọn đề tài
Nhu cầu ngày càng cao của khách hàng là bài toán thách thức cần lời giải đáp của doanh nghiệp nói chung và ngành ngân hàng nói riêng. Điều này đòi hỏi ngân hàng hay doanh nghiệp phải thay đổi chiến lược phát triển theo hướng đa dạng hóa tiện ích của các dòng sản phẩm, dịch vụ và chú trọng công tác chăm sóc khách hàng. Thực tiễn chỉ ra rằng nguồn dữ liệu hiện hữu của một tổ chức kinh doanh là một tài nguyên quan trọng, việc phân tích nguồn tài nguyên này phần nào giúp việc đơn giản hóa quá trình giám sát và tìm hiểu nhu cầu khách hàng một cách hiệu quả. Với nguồn dữ liệu lớn sẵn có, cụ thể là nguồn số liệu từ big data (tạm dịch là dữ liệu lớn), các ngân hàng có thể tự khai thác thông tin để tiếp tục theo dõi hành vi tiêu dùng của khách hàng trong tương lai, từ đó đưa ra chiến lược, chính sách phù hợp. Quá trình theo dõi đánh giá hồ sơ khách hàng dựa vào thông tin hiện có hoặc đặc điểm khách hàng sẽ giúp ngân hàng giảm thiểu được rủi ro đến mức nhỏ nhất. Điều này góp phần trong khai thác hiệu quả đối tượng khách hang, đảm bảo vị thế cạnh tranh trên thị trường.
Gần đây ngân hàng SCB không ngừng nỗ lực trong việc đẩy mạnh phát triển công nghệ số, nâng cao chất lượng dịch vụ, đa dạng hóa sản phẩm với tính bảo mật cao, cung cấp các giải pháp tài chính hiệu quả, chuyên nghiệp hóa công tác chăm sóc khách hàng. Bên cạnh những cơ hội phát triển, ngân hàng cũng phải đối mặt với nhiều bài toán thách thức của thị trường. Mức độ cạnh tranh ngày càng gay gắt giữa các ngân hàng là một trong những thách thức đầu tiên và đầy khó khăn mà không SCB phải tìm cách giải quyết. Đặc biệt, sự liên kết và sát nhập giữa Ngân hàng ngoại với Ngân hàng nội đã và đang gây thêm nhiều khó khăn hơn trong việc cạnh tranh, bởi sự liên kết này sẽ chiếm ưu thế hơn với sản phẩm dịch vụ có chất lượng cao, kinh nghiệm chuyên nghiệp, năng lực quản trị tốt và mạng lưới toàn cầu cùng sự am hiểu đặc thù kinh tế tại địa phương. Hai là, nhu cầu của khách hàng ngày một tăng cao, đòi hỏi Ngân hàng phải đáp ứng thường xuyên việc tối ưu hóa các sản phẩm dịch vụ,
2
nâng cao chất lượng dịch vụ, quy trình, thủ tục đơn giải, nhanh chóng và hướng về
mục tiêu chất lượng trong kinh doanh.
Trong những năm gần đây, SCB đã chi ra một khoảng không nhỏ đầu tư hệ thống lưu trữ dữ liệu. Đến thời điểm hiện tại, nguồn dữ liệu lưu trữ trong các data warehouse đã trở thành một nguồn big data. Tuy nhiên việc khai phá dữ liệu từ nguồn big data đang là bài toán không dễ cho các bộ phận có liên quan. Điều này sẽ dễ dẫn đến tài nguyên về dữ liệu được đầu tư không phục vụ lợi ích lớn. Thực tế, một khi nguồn dữ liệu big data được khai thác tốt, là một lợi thế trong nâng cao chất lượng cạnh tranh, giảm chi phí đáng kể trong phân tích hành vi khách hàng.
Để ngân hàng hiểu hơn về hành vi khách hàng, đặc điểm lựa chọn dịch vụ của khách hàng, việc phân tích hành vi khách hàng từ nguồn dữ liệu big data là cực kỳ quan trọng. Điều này không những góp phần vào việc xác định lại phân khúc thị trường để ngân hàng có hướng tiếp cận phù hợp, trên cơ sở để phát triển thêm vào các dịch vụ hướng đến phục vụ khách hàng một cách hiệu quả nhằm giữ chân khách hàng cũ, hạn chế sự rời dịch vụ của khách hàng và tạo tiếng vang lôi kéo khách hàng mới. Đây là lý do nghiên cứu của đề tài sẽ hướng đến chủ đề “Ứng dụng big data phân tích lỗ hổng tín dụng cho vay và giải pháp hạn chế: trường hợp của ngân hàng TMCP Sài Gòn”. Đề tài này có một tiếp cận mới trên nguồn dữ liệu big data giúp việc phân tích lỗ hổng trong xét duyệt hồ sơ đánh giá cho vay khách hàng, còn giúp công ty định vị lại những giải pháp gắn với hành vi đang kỳ vọng của khách hàng hạn chế những rủi ro trong tín dụng.
1.2. Mục tiêu nghiên cứu
- Đánh giá đặc điểm tiếp cận vốn vay của khách hàng
- Phân tích những lỗ hổng trong việc thực hiện xét duyệt hồ sơ cho vay
- Phân tích hành vi tham gia giao dịch hướng đến xây dựng những giải pháp phù
hợp giúp chăm sóc khách hàng hiệu quả, hạn chế rủi ro trong tín dụng.
3
1.3. Phương pháp nghiên cứu
1.3.1. Đối với số liệu phục vụ nghiên cứu
Nguồn dữ liệu phục vụ nghiên cứu luận văn được trích xuất từ nguồn Big Data của ngân hàng. Nguồn này được chứa trong các hệ thống lưu trữ của SCB. Việc xuất dữ liệu được thực hiện từ bộ phân IT, của CRM (hệ thống thu thập và quản lý thông tin khách hàng), của kho dữ liệu (data warehouse) và portal...Nguồn thông tin này đã ghi lại những lịch sử giao dịch của khách hàng trong thời gian qua. Mặc dù số liệu không thuộc dạng khảo sát, tuy nhiên việc sử dụng nguồn dữ liệu Big Data này được xem như là một xu hướng mới trong việc nghiên cứu các vấn đề kinh tế trong kỷ nguyên công nghệ thông tin phát triển. Nguồn tài nguyên từ Big Data phản ánh một cách trung thực nhất về hành vi và lịch sử tiêu dùng của khách hàng theo thời gian. Qua đó, kết quả của quá trình nghiên cứu sẽ mang độ tin cậy cao hơn. Tuy nhiên, nguồn tài nguyên này được cung cấp từ phía Ngân hàng nên cần có tính bảo mật cao, vì thế nghiên cứu này tác giả đề xuất phần dữ liệu sẽ không được công bố rộng rãi.
Số liệu được trích xuất có nhiều nguồn khác nhau, bộ phận chăm sóc khách hàng, bộ phận cho vay, khách hàng thẻ, khách hàng tiền gửi. Tuy nhiên trong nghiên cứu, số liệu cho vay sẽ được tập trung. Để hạn chế những thông tin nhiễu, các khách hàng được chọn đưa vào nghiên cứu có thời gian tham gia dịch vụ trên 12 tháng. Thời gian nghiên cứu của số liệu đối với khách hàng là 12 tháng, tính từ ngày 01/1/2019 đến ngày 31/12/2019. Thời gian đưa vào nghiên cứu mỗi mã khách hàng có nhiều dòng thông tin, nói cách khác mỗi một dòng là một giao dịch của khách hàng. Việc xác định số lần giao dịch của mỗi khách hàng dựa vào mã khách hàng thống kê từ hệ thống báo cáo. Các đối tượng khách hàng trong nghiên cứu là khách hàng có tham gia giao dịch trong thời gian nghiên cứu trên, công cụ được sử dụng hỗ trợ phục vụ phân tích là SPSS Modeler 18.
Kết quả thống kê nhanh vể số liệu phục vụ cho luận văn này có số dòng 128.290 dòng, tương đương với 3.572 khách hàng. Số lượng 25 biến/field được trích ra từ dữ
4
liệu big data được đưa vào nghiên cứu. Thông tin các biến và giá trị thang đo có thể được thấy ở bảng 1.1.
Tên các biến/
trường
Table 1.1: Information of variables concerned
Định nghĩa Thang đo
1. CIF ID Khách hàng
2. Branch ID của chi nhánh
3. No.document ID của tài liệu KH
4. Type of customer Loại khách hàng vay
+ Khách hàng tín dụng thẻ
+ Khách hàng cá nhân
+ Khách hàng kinh doannh gia đình
Biến định danh
5. Access date Ngày đăng ký dịch vụ của khách hàng Ngày
6. Approved date Ngày hồ sơ vay được duyệt Ngày
7. Document score Điểm hồ sơ vay do nhân viên đánh giá Biến liên tục
8. Gender Giới tính khách hàng Biến định danh
9. Age Tuổi của khách hàng Giá trị liên tục
10. Education Trình độ học vấn của khách hàng Biến định danh
11. Community Hành vi quan hệ cộng đồng
+ Có danh tiếng/Prestige
+ Tốt/good engough
+ Không biết/unknown
12. Marital status Tình trạng gia đình: Độc thân/ Single và
kết hôn/ married
13. Job position Vị trí công việc
+ Công nhân/worker
+ Nhân viên văn phòng/Office staff
+Quản lý/Manager
+Giám đốc/Director
14. Houseownership Tình trạng sở hữu nhà
+ Nhà riêng/Owned house
Biến định danh
Biến định danh
Biến định danh
Biến định danh
5
+ Nhà thuê/Rented house
+ Ở với cha mẹ/Stayed with parents’
house
15. Usage Thông tin sử dụng dịch vụ của NH
+Chỉ sử dụng dịch vụ từ SCB/ only loan services from SCB bank
+Sử dụng dịch vụ vay từ SCB > ngân hàng khác/loan services from SCB bank
> another bank
+Sử dụng dịch vụ vay từ SCB = NH khác/loan services from SCB bank = another bank
+Sử dụng dịch vụ vay từ SCB< NH khác/loan services from SCB < another bank
+ Không sử dụng dịch vụ vay từ
SCB/No loan services from SCB
Biến định danh
16. Type of product Hình thức cho vay Biến định danh
17. Type of card Loại thẻ sử dụng: Thẻ chính và thẻ
phụ/Type of card: Main and non-main
Biến định danh
18. Level of card Giá trị của mức thẻ/Value of card level Liên tục
19. Balance account Balance account measured in
Vietnamese currency (VND)
20. Fee Phí hàng năm (Có/Không)/Annual fee
(Yes/No)
21. Card_date Ngày cấp thẻ/Date to issue the bank card
22. No.Card Số tài khoản thẻ/Account number of card
23. Ncard_Date Ngày công nhận thẻ mới/Date to approve the new card
24. Workingyear Số năm công tác/làm việc của kH/Number of years of customers working
25. NetIncome Thu nhập ròng bình quân theo tháng
(đồng/tháng)
Liên tục
Biến định danh
Date
Series number
Date
Liên tục
Liên tục
6
Nguồn: Tổng hợp từ big data
1.3.2. Các khái niệm tiếp cận trong nghiên cứu
Mô hình Fraud còn được dịch là mô hình gian lận, có chức năng hỗ giúp tìm ra những gian lận hoặc lỗ hổng trong hoạt động kinh doanh, trong đó lĩnh vực cho vay không là ngoại lệ. Điển hình trong lĩnh vực thế chấp, mô hình gian lận đã giúp việc phát hiện những nhân viên sử dụng chuyên môn hoặc thẩm quyền của mình để tạo ra một gian lận cá nhân.
Thuật toán khám phá những lỗ hổng trong kinh doanh có nhiều phương pháp, trong đó có thể kể đến mô nhánh/cây quyết định, điển hình thuật toán C5.0. Đây là mô hình kế thừa thuật toán cây quyết định dựa trên nền tảng kết quả nghiên cứu của (Hunt & Krivanek, 1966). Đặc điểm chính của C5.0 hướng đến khái phá dữ liệu theo phân lớp dữ liệu dựa trên cây quyết định hiệu quả và phổ biến. Phương pháp này giúp xây dựng một kế hoạch nhằm đạt được mục tiêu mong muốn và giúp dự báo hành vi của khách hàng, trong dự báo về hành vi gian lận.
Phân tích lòng trung thành của khách hàng đối với dịch vụ. (Doğan, Ayçin, & Bulut,
2018) sử dụng khái niệm của RFM để xác định mức độ lòng trung thành của khách hàng dựa vào 3 chỉ số: R, F, M. Trong đó, R là Recency, tức là thời gian mua hàng gần nhất tính đến thời điểm nghiên cứu. F là Frequency là tần suất giao dịch của khách hàng trong thời gian mà nghiên cứu đang thực hiện của 12 tháng, tần suất giao dịch hoặc mua hàng sẽ được tính toán. M là Monetary tức đo lường tổng giá trị mà khách hàng thực hiện giao dịch trong khoảng thời gian nghiên cứu. Tượng tự, (Khajvand & Tarokh, 2011) đã sử dụng mô hình RFM như nêu trên để hướng đến phân phúc thị trường trong lĩnh vực ngân hàng bán lẻ và đo lường nhóm khách hàng có đóng góp lớn nhất.
Xuất phát từ các nhận định trên, nghiên cứu của luận văn này, phương pháp tiếp cận trong phân tích sẽ áp dụng vào mô hình của (Khajvand & Tarokh, 2011) để tính RFM, từ cơ sở đó, các bước hướng đến phân khúc thị trường sẽ được thực hiện để xác định các nhóm khách hàng khách biệt về sự đóng góp cho ngân hàng từ thấp đến cao.
7
1.3.3. Phạm vi nghiên cứu của luận văn
Dữ liệu được trích xuất chọn ra khách hàng thuộc khu vực Thành phố Hồ Chí Minh. Mô hình nghiên cứu dựa trên kiến thức chuyên gia của cá nhân, đang là lãnh đạo của phòng giao dịch tại một quận của thành phố. Đề tài không sử dụng phương pháp định tính, tuy nhiên trong quá trình nghiên cứu, có sự ủng hộ của các phòng ban và của lãnh đạo cao hơn. Kết quả nghiên cứu này sẽ là một khởi đầu để xem xét mức độ hiệu quả trong nghiên cứu giúp cho việc nghiên cứu mở rộng trong thời gian tới.
Việc nghiên cứu sự gian lận trong kinh doanh hàm ý sẽ tập trung vào gian lận có thể xuất phát từ nhân viên trong xét duyệt hồ sơ, hoặc do khách hàng chủ động khai báo hồ sơ không chính xác để đạt được mục tiêu trong giao dịch. Cơ sở khám phá gian lận trong kinh doanh sẽ là cơ sở để xây dựng giải pháp khắc phục gian lận từ phía nhân viên và từ phía khách hàng.
1.3.4. Kết cấu của luận văn
Luận văn được chia làm 4 chương, với các nội dung sau: Chương 1: Giới thiệu tổng quan về đề tài nghiên cứu Chương 2: Cơ sở lý luận
Chương 3: Ứng dụng của Big data tại SCB và kết quả phân tích
Chương 4: Kết luận và giải pháp
8
CHƯƠNG 2: CƠ SỞ LÝ LUẬN
2.1. Big Data
Dữ liệu lớn có thể bao gồm cả dữ liệu cấu trúc và không cấu trúc hay bán cấu trúc. Các hoạt động được tạo lập trong hệ thống đều được big data ghi lại. Đối với hoạt động kinh doanh, dữ liệu này sẽ ghi lại tất cả lịch sử tiêu dùng của khách hàng trong suốt thời gian giao dịch. Một khi dữ liệu được lưu trữ, bản ghi ngày càng phong phú, đa dạng hơn theo thời gian. Đây là nguồn dữ liệu hữu ích mà các tổ chức có thể sử dụng trong việc truy vấn thông tin để phát triển chiến lược kinh doanh, hay tạo lập môi trường quản lý chuyên nghiệp.
Hiểu được tầm quan trọng và “cơ hội kinh doanh” từ Big Data, hiện nay các ngân hàng nước ngoài đang khai thác nguồn dữ liệu để xây dựng chiến lược kinh doanh trên nhiều lĩnh vực chuyên môn và ngoài chuyên môn, từ phân tích tâm lý khách hàng đến phân tích cơ hội kinh doanh trong việc bán chéo sản phẩm hay quản lý doanh nghiệp.
Big Data đóng vai trò quan trọng trong việc truy xuất dữ liệu và hỗ trợ con người đưa
ra quyết định tốt hơn với cơ hội thành công cao hơn nhiều.
Sự phát triển của ngành ngân hàng (Banking) đi đôi với sự ra đời của Big Data Ngành ngân hàng đã phát triển theo bước nhảy vọt trong thập kỷ qua từ hoạt động vận hành kinh doanh đến cung cấp dịch vụ. Điều đáng ngạc nhiên chính là, hầu hết các ngân hàng đều gặp khó khăn hay thất bại trong việc sử dụng, khai thác thông tin, dữ liệu từ cơ sở dữ liệu (database) mà họ có được từ khách hàng và từ các chi nhánh, bộ phận của tổ chức. Tuy nhiên, khi các ngân hàng ngày càng mở rộng dịch vụ, các tiện ích, hay áp dụng công nghệ trong việc phát triển phân khúc thị trường, thu hút thêm khách hàng thì song song họ cũng phải xây dựng một hệ thống hạ tầng để thu thập dữ liệu và tiến hành phân tích và xác định giải pháp cải thiện hiệu quả kinh doanh. Theo một số chuyên gia dự đoán số lượng dữ liệu tăng lên gấp bảy lần trước
9
năm 2020 (so với năm 2016). Big data là bước tiến lớn đối với sự phát triển của ngành ngân hàng.
Ngày nay, hầu hết các tổ chức ngân hàng, dịch vụ tài chính và bảo hiểm (Banking, Financial services and Insurance (BFSI)) đang nỗ lực để áp dụng một cách tiếp cận mới theo hướng khai thác dữ liệu để phát triển và đổi mới các dịch vụ mà họ cung cấp cho khách hàng. Giống như hầu hết các ngành công nghiệp khác, phân tích dữ liệu lớn (Big data analytics) sẽ là một sự thay đổi lớn quan trọng trong cuộc chiến giữa các tổ chức cùng ngành.
Mặc dù nhiều tổ chức BFSI đang thay đổi cách thức khai thác dữ liệu bằng cách thu thập một khối lượng dữ liệu khổng lồ và tiến hành phân tích, nhưng đó chỉ là những bước tổng quát, những bước riêng lẻ ở từng giai đoạn trong quy trình khai thác Big data. Trong tất cả trường hợp, các dự án Big data được hình thành đều hướng đến mục tiêu ban đầu là trả lời cho câu hỏi: “Những dữ liệu này có thể giúp chúng ta giải quyết các vấn đề kinh doanh như thế nào?”
Khi khối lượng khách hàng tăng lên, nó ảnh hưởng đáng kể đến mức độ, khả năng cung cấp dịch vụ của từng tổ chức. Thực tiễn cho thấy việc phân tích dữ liệu hiện tại đã đơn giản hóa quá trình theo dõi và đánh giá khách hàng tín dụng của các ngân hàng và các tổ chức tài chính, dựa trên khối lượng lớn dữ liệu như thông tin, hồ sơ cá nhân và các thông tin bảo mật khác. Nhưng với sự giúp đỡ của Big data, các ngân hàng có thể khai thác để liên tục theo dõi hành vi của khách hàng trong thời gian thực, xác định được các nguồn dữ liệu cần thiết để thu thập phục vụ cho việc đưa ra giải pháp. Quá trình đánh giá hồ sơ khách hàng trong thời gian thực sẽ dần thúc đẩy hiệu suất hoạt động và lợi nhuận, từ đó đẩy mạnh phát triển tổ chức hơn nữa.
Theo Forbes, 87% các công ty cho rằng Big data sẽ tạo ra những thay đổi lớn cho các ngành công nghiệp của họ đến cuối thập kỷ thứ 2 của thế kỷ 21. Thậm chí nhiều công ty còn nghĩ rằng nếu không có một chiến lược Big data cụ thể và hiệu quả sẽ khiến họ tụt lại phía sau trong thời đại công nghệ 4.0 ngày nay.
10
Có rất nhiều nguồn dữ liệu Big data trong hầu hết ở các ngành và lĩnh vực khác nhau, không riêng ở lĩnh vực tài chính, thương mại, bán lẻ, bảo hiểm, mà nó còn rất được quan tâm ở lĩnh vực ngân hàng. Mọi tương tác, mọi giao dịch của khách hàng tại ngân hàng đều tạo ra các bản ghi điện tử, các bản sao lưu được lưu lại theo quy định pháp luật, và các giao dịch tại các trụ ATM ở các địa điểm khác nhau cũng được lưu thông tin tại ngân hàng. Nhờ phân tích Big data, các công ty dịch vụ tài chính không còn lưu trữ dữ liệu theo yêu cầu bắt buộc như ngày xưa nhưng giờ đây họ đang tích cực, chủ động hơn trong việc khai thác để có được những kết quả mà dựa vào đó đưa ra được các giải pháp cải thiện hoạt động, gia tăng lợi nhuận của tổ chức.
Ngoài ra, các công ty cũng không chờ đợi một khoảng thời gian dài mới có thể phân tích các dữ liệu lịch sử, dữ liệu quá khứ. Hầu hết các phân tích Big data được thực hiện chủ yếu xảy ra trong thời gian thực nhằm thúc đẩy việc đưa ra các quyết định chiến lược một cách nhanh chóng.
Tóm lại, Big data chính là nguồn lực quan trọng, mang tính chất nòng cốt tạo ra lợi thế cạnh tranh ở bất kỳ một tổ chức tài chính nào đặc biệt khi việc nắm bắt nhu cầu của người tiêu dùng ngày càng phức tạp mặc dù đã thuận tiện hơn, dễ dàng hơn nhờ sự phát triển vượt bậc của công nghệ, kỹ thuật. Big data không chỉ đem lại các cái nhìn mới, sự sáng tạo trong quá trình đổi mới từng loại hình dịch vụ đến khách hàng mà còn đảm bảo hiệu quả kinh doanh với rủi ro, chi phí được tối ưu nhất
Việc xác định các mảng dịch vụ, các bộ phận, các chức năng trong tổ chức tài chính, nơi mà Big data có thể được xem xét nhằm mục đích khai thác một cách hiệu quả nhất dựa vào sự kết hợp giữa các kiến thức, mô hình kinh doanh và khả năng áp dụng phần mềm công nghệ sẽ tạo ra cơ hội cạnh tranh cho chính tổ chức đó.
Tùy vào mục đích, cơ cấu, nguồn lực, khả năng khác nhau ở mỗi tổ chức mà sẽ có nhiều trường hợp ứng dụng Big data khác nhau, mang tính chất đặc thù, riêng biệt. Dưới đây là các trường hợp sử dụng phổ biến nhất – được chúng tôi nghiên cứu và chọn lọc – mà các ngân hàng và công ty dịch vụ tài chính đang thực hiện để tìm kiếm các giá trị ẩn sâu bên trong quá trình phân tích Big data.