어피닛에서 GenAI를 금융 심사에 활용해보기
안녕하세요! AI/Data팀 소속 Bentley입니다.
저희 팀은 최근 생성형 인공지능(GenAI)을 금융 리스크 관리에 실질적으로 적용하는 과정에서 핵심적인 기술적 과제를 해결했습니다.
그 결과, 생성형 인공지능 기반 대출심사 응답 토큰의 로그확률을 활용한 대출심사 연체확률 산정 및 보정 방법에 대한 특허 출원 절차를 완료하고 심사중
이번 포스팅에서는 기존 GenAI 모델의 한계였던 “응답 신뢰도를 정량적으로 해석하기 어렵다”는 문제를 데이터 사이언티스트의 시각에서 어떻게 접근·해결했는지, 그리고 그 결과 어떤 실무적 가치를 창출했는지를 공유합니다
1. 배경: GenAI의 ‘텍스트 답변’이 리스크 관리의 벽이 될 때
최근 금융권에서는 대출 심사에 GenAI를 도입해, 과거 복잡한 신용평가 모델이 다루던 정형 데이터(신분, 소득, 신용 정보)와 비정형 데이터(금융 명세서 PDF, 상담 기록 등)를 함께 이해하며 “승인(Y) / 거절(N) / 검토(U)” 같은 판단을 내릴 수 있게 되었습니다.
하지만 리스크 관리 관점에서 텍스트 형태의 결정만으로는 부족했습니다.
응답이 텍스트 형태로만 제공되면, 고객별 위험 수준(PD)을 정량적으로 구분하기 어렵기 때문입니다. 결국 같은 승인군 내에서도 위험도 차이를 세밀하게 반영하지 못하고, 금리 차등화나 세분화된 정책 운용이 제한되는 문제가 생깁니다.
저희의 목표는 명확했습니다.
모델의 “확신도”를 수치로 추출하여 정량적 PD로 변환하고, 이를 리스크 관리 엔진에 직접 연결하는 것입니다. 즉, “AI의 판단을 정책 의사결정에 연계할 수 있는 신뢰도 지표”로 만드는 것이었죠.
2. GenAI의 응답 토큰 로그확률을 PD로 변환하는 6단계 프로세스
이 프로세스는 GenAI의 응답 신뢰도(토큰 로그확률)를 정량화하여 금융 실무에서 활용 가능한 형태의 연체확률(PD)로 전환하는 기술적 절차입니다.
1단계. 다차원 고객 정보 수집 (Raw Data Sourcing)
정형(신용등급, 소득)·비정형(은행 명세서, 상담 기록)·행동 데이터를 폭넓게 수집합니다.
수집된 데이터를 RAG(Retrieval-Augmented Generation) 기반으로 가공하여, 신용 관련 문맥(Context)을 프롬프트에 반영함으로써 모델의 판단 근거를 강화합니다.
2단계. 프롬프트 설계 및 출력 강제 (Modeling Input Structure)
프롬프트를 지시문/컨텍스트/출력 서식으로 구조화하고, 결과를 Y(승인)/N(거절)/U(검토) 3토큰으로 고정합니다.
이는 로그확률 파싱 및 계산의 표준화를 위한 필수 전처리입니다.
3단계. 로그확률 획득 (GenAI Inference with Logprobs)
추론 시 토큰별 로그확률(logprobs) 옵션을 활성화합니다.
텍스트 결정(Y/N/U)과 함께 내재 확신도(로그확률)를 확보해, 설명가능성·정량평가의 기반을 만듭니다.
4단계. 결과 추출 및 표준화 (Data Cleaning & Parsing)
응답에서 Y/N/U 토큰을 파싱해 승인/거절/불확실로 정규화합니다.
비정상 케이스는 원칙적으로 U(불확실)로 처리합니다.
5단계. 확률 변환 (Mapping Logprobs → PoN)
로그확률을 시그모이드 함수로 매핑하여 거절 토큰 확률(PoN)로 변환합니다.
이 값은 후속 보정(Calibration) 단계의 입력 확률로 사용됩니다.
6단계. 도메인 적합 PD 보정 및 산출 (Calibration Layer)
PoN과 과거 실측 연체 데이터를 매칭해 보정 함수를 학습합니다.
이를 적용하면 금융 도메인에 최적화된 PD를 산출할 수 있으며,
리스크 엔진이 금리·한도·정책 결정 과정에 활용할 수 있습니다.
3. 우리가 이 기술을 통해 얻은 주요 인사이트
이번 연구를 통해 GenAI를 단순한 참고용 보조 도구가 아닌, 리스크 관리 프로세스 내 실질적 의사결정 보조 엔진으로 발전시킬 수 있었습니다.
그 과정에서 다음과 같은 세 가지 주요 인사이트를 얻었습니다.
신속한 시장 대응과 비용 효율성
모델 자체를 건드리지 않고 보정(calibration) 함수만 재학습해 변화에 대응합니다.
→ 파인튜닝 없이도 빠르게 반영되어 시간·비용을 크게 절감합니다.정밀한 정책 운용 가능성
산출된 도메인 적합 PD를 심사 정책 엔진에 연결해 임계값 기반 자동 의사결정, 금리/한도 차등화에 활용합니다.
→ 심사의 일관성과 설명가능성이 강화됩니다.확장성(Scalability)
국가·언어·상품군이 달라도 보정 함수만 별도 학습하면 적용 가능합니다.
→ 이를 통해 글로벌 서비스 확장 가능성을 검증했습니다..
4. 마무리하며
저희는 생성형 AI 응답의 토큰 로그확률을 활용해 연체확률(PD)을 산정·보정하는 방법(특허 출원 절차 완료)을 개발하며, 생성형 AI 결과를 금융 리스크 지표와 연결하는 기반을 마련했습니다.
어피닛은 단순한 AI 도입을 넘어,
모델의 내부 확신도를 정량화해 정책 운용·금리·한도 등 핵심 의사결정 과정에 반영하기 위한 연구를 진행하고 있으며,
현재 해당 기술을 대출 심사 프로세스 일부에 시범적으로 적용하고 있습니다.
앞으로도 생성형 AI가 금융 실무에서 실질적인 임팩트를 낼 수 있는 기술을 지속적으로 개발해 나가겠습니다.
지켜봐 주세요! 🙌