1. 프로젝트 내용
1-1. 프로젝트 개요
- 은행 상품 가입 유도를 위한 마케팅을 할 때 **
타겟 마케팅
**이 아닌 AI모델로 타겟팅
- 고객의
정형화된 기본 정보
뿐만이 아니라 과거부터 누적된 고객 행동 패턴을 기반한 AI모델
1-2. 프로젝트 수행 내용
고객 여정 테이블 구축
(각 채널별 로그 데이터 - 스마트 뱅킹, 콜센터, 거래 내역 등)
고객 정형 테이블 구축
(고객 기본정보, 수신, 여신, 카드 등)
- 고객 여정 & 고객 정형 데이터를 활용한
상품군 추천 모델 개발
2. 프로젝트 결과
2-1. 오프라인 성능
- 16개의 상품군(예금, 적금, 전세자금대출 등)에 대해 AUC, LIFT로 평가
- AUC : 최소
0.8이상
& 평균 0.9
이상
- LIFT(상위 10%) : 최소
2이상
& 평균 3이상
- LIFT : (모델 score 기준 상위 10% 가입률) / (Random Sample 10% 가입률)
- ex) 100만명 중 1만명이 금융 상품에 가입 했을 때, 랜덤으로 10%를 뽑을때 가입률은 1%(1,000/100,000), 모델 score 기준 상위 10%를 뽑았을 때의 가입률을 2%라고 했을 때 →
2
(2%/1%)
- Mass Marketing 대비 Target Marketing의 성능으로 볼 수 있음
2-2. 온라인 성능
- 실제 비즈니스 성과는 공유되지 않아 알 수 없지만, 16개 중 반 정도는 활용하고 있다고 함.
3. 역할 및 기여한 내용
- AI 학습 마트(고객 행동 여정, 고객 프로파일) 구축(Python & Oracle)
- 고객 행동 여정 : 모바일 뱅킹, 인터넷 뱅킹, 콜센터 등의 행동 데이터
- Issue : 사용 가능한 행동 수가 너무 많음(약 5,000개)
- → 상품에 따른 행동별 가입률을 기준으로 행동 분류를 설계
- → 각 상품별로 모델링을 할 때 유의미한 행동만 뽑아 진행(feature importance)
- → 50~100개의 유의미한 행동들만 사용
- 고객 프로파일 : 고객의 기본적인 정보(나이, 성별, 월평균 수신 평잔, 월평균 카드 승인 금액 등)
- Issue : feature의 수가 너무 많음(약 600개)
- → 상관관계 분석 후 0.9이상 feature에 대해 일부 제거
- → permutation importance를 활용
- → 100~200개의 유의미한 feature들을 활용
- 일배치 적재 파이프라인 구축(Python & Oracle)
- Issue : 일배치 적재 파이프라인 실행 시간이 약 1시간 정도 소요
- → Oracle : Query tunning 진행(인덱스 적용, 중복 엑세스 피하기 등)
- → Python : parquet을 활용하여 일부 컬럼만 read & dataframe의 apply 적용
- → 30분 이내로 시간 단축