어피닛 AI 엔진이 고객의 EMI를 추정하는 방법

EMI 금액 추정을 통한 신흥국에서의 금융포용성 실현
Jace Shin's avatar
Nov 07, 2025
어피닛 AI 엔진이 고객의 EMI를 추정하는 방법

안녕하세요, 어피닛에서 AI & Data 조직을 이끌고 있는 Jace입니다. 어피닛은 인도 저소득층 및 중산층을 대상으로한 Mobile Instant Micro Credit 서비스에 필요한 대안신용평가 시스템을 제공하고 있습니다. 어피닛의 플랫폼과 대안신용평가 시스템을 이용하면 고객은 오프라인 방문이나 담보 없이 앱 신청만으로 1분만에 모든 신용평가 프로세스가 진행되고 심사 결과까지 확인할 수 있습니다. 인도와 같은 Emerging Market에서 서류 제출 없이 모든 프로세스를 온라인으로 진행하는 것에는 예상치 못한 도전들이 많이 있습니다. 이번 포스트에서는 그러한 도전 중 하나인 EMI Estimation에 대한 주제로 글을 쓸까 합니다.

EMI는 Equated Monthly Installment의 약자로서, 대출의 월납입금액을 의미합니다. 고객이 대출을 신청했을 때, 가장 중요한 것이 현재 고객의 다른 금융사로부터 대출을 몇 개 가지고 있는지, 그리고 그것들의 총 월납입금액이 얼마인지 파악하는 것은 중요한 일입니다. 또한 이번에 새로운 대출을 내준다면, 그것을 합산한 총 월납입금액은 어떻게 되는지, 그렇게 계산된 총 월납입금액과 소득과 비교해보면 어느 정도의 비중을 차지하는지 등 여러가지 분석에서 사용됩니다. 가처분소득(Disposable Income)을 계산할 때도 사용 되기도 합니다.

*가처분소득 = 월 소득 - 월 고정비용 - 월 EMI

여기에서 중요한 것은 타사에서 받은 대출에 대한 EMI 금액을 아는 것입니다. 고객이 보유한 대출에 대한 정보는 CB(Credit Bureau)에서 얻거나, SMS Data와 같은 대안 데이터를 통해서 얻어야 합니다. 한국의 CB사는 대표적으로 NICE와 KCB(Korea Credit Bureau) 두 회사가 있습니다. CB사에 비용을 지불하고 타사의 대출 정보를 얻을 수 있는데, 한국의 CB Data는 관리와 정제가 잘 되어 있어 대출 정보를 얻는데 아무 문제가 없습니다. 그러나 어피닛의 타겟 시장인 인도는 대표적인 신흥 시장으로서 이 부분에 대한 데이터 수집이 잘 되지 않아, 약 36%의 대출만 EMI 금액 정보가 제공됩니다. EMI 금액이 주어지지 않더라도, 원리금 균등 상환액 산출 공식에 의해서 대출 금액(Loan Amount), 상환기간(Tenure), 금리(Interest Rate)가 모두 주어지는 경우에 수학적으로 도출이 가능한데, 산출공식의 변수가 모두 주어진 경우를 합산을 한 경우를 포함하더라도 44.1% 의 케이스에 대해서만 EMI 금액이 주어집니다.

* EMI = PMT(interest, Tenure, Amount)

상환기간 / 금리 / EMI의 Coverage

이렇게 선진국에서는 문제가 되지 않는 부분이 신흥국으로 갔을 때는 도전적인 상황으로 주어질 때가 있습니다. 이런 상황을 보통 Emerging Market Challenges라고 부르고, 이러한 도전적인 상황을 극복하고 금융서비스를 제공할 때 “금융포용성(Financial Inclusion)을 실현했다” 라고 말합니다. 어피닛 AI팀은 인도시장에서의 금융포용성을 달성하기 위해서, 99.8%의 케이스에 대해서 EMI 금액을 추정할 수 있는 새로운 방법론을 개발했습니다.

어피닛이 독자 개발한 EMI Estimation Framework

어피닛은 EMI 금액을 추정하기 위해서 새로운 접근 방법을 시도했습니다. 기본적인 전략은 Divide & Conquer 전략입니다. 원리금 균등 상환액 산출 공식을 이미 알고 있기 때문에, 산출공식의 변수수인 대출 금액, 상환 기간, 금리 각각에 집중해서 결측값을 추정하는 접근방법을 취했습니다. 이 중 대출 금액은 100% Coverage로 값을 가지고 있었기 때문에, 상환 기간과 금리만 추정하면 되었습니다.

상환 기간, 금리 둘 중, EMI Amount에 미치는 영향이 “상환 기간(Tenure)”이 좀 더 중요하다고 판단하여 아래와 같은 플로우로 Estimation Framework를 개발하였습니다.

EMI Estimation Framework Flow

상환 기간이 더 중요한 이유는, 금리는 1%가 움직여도 원리금 월상환액이 10만원 기준 100원~1000원 단위로 움직이는 데 반해서, 상환 기간은 6개월에서 12개월로 늘어나면, 월 납입금액이 반절로 줄어드는 등 큰 폭으로 바뀌기 때문입니다. 이처럼 상환기간은 금리에 비해 상품에 따라 더 큰 폭으로 차이가 나기 때문에 더 관심을 기울여야하는 변수라고 볼 수 있습니다.

상환기간과 금리를 추정하기 위해 한 가지 중요한 요소를 더 고려하게 됩니다. 바로 SAM(Scheduled Amortization)이라는 요소인데요. 예를 들어, 대출 실행금액이 1000만원이고 만기가 24개월이고 현재 10개월이 지났는데, 대출 잔액이 700만원이라면 금리는 얼마가 될 것인가? 라는 질문이 있을 때, SAM(k) = Scheduled Amortization(k) = k회차에 계획된 대출원금의 상각금액 = 대출 실행 금액(Loan Amount) - 대출 잔액(Outstanding Balance at K) 를 고려하는 것입니다. 이를 고려했을 때, 대출 금리를 계속 바꿔보면서 아래와 같은 상환 계획을 그리고, 상환 계획을 고려했을 때 K개월 때의 계획된 대출 잔액 또는 계획된 대출원금 상각금액이 비슷하게 나올 때까지 적절한 금리를 찾는 것입니다.

24개월 만기 대출의 EMI 상환 스케쥴 (원금과 이자로 나누어서)

위 그래프에서 현재 대출이 10회차라고 하면,

 SAM(k) = Scheduled Amortization(k) = 1회차 ~ 10회차까지의 파란색 부분의 합

 대출잔액 = Outstanding Balance(k) = 11회차부터 24회까지의 파란색 부분의 합

이라고 볼 수 있습니다. 금리가 달라지면 이 값이 달라질 것이고, 총 상환 기간이 달라져도 10회차의 SAM(k) 값은 달라질 것입니다.

EMI Estimation Framework의 수학적인 유도

위에서처럼, Scheduled Amortization 개념을 이용해서 적절한 상환 기간, 금리를 여러 값을 고려해서 찾아볼 수 있습니다. 그러나 이렇게 접근하는 경우 너무 많은 시도를 해야하고, 그것이 최적값임을 보장할 수가 없습니다. 어피닛의 AI팀은 최적값을 찾기 위해서 수학적인 접근 방법을 취해서, 해석적인 해(Closed Form solution)를 찾거나 수치해석적 해를 찾는 방법론을 개발했습니다.

이러한 방법론은 특허*로도 출원 되어 있으니, 자세한 방법론을 참고하기 위해서는 특허 공개 전문을 직접 보시는 것을 추천 드립니다.

*특허

1. 신용보고서 기반 대출 상환기간 결측치 추정을 위한 해석적 시스템 및 방법 (출원번호: 10-2025-0162324)

2. 신용보고서 기반 대출 이자율 결측치 추정을 위한 수치해석적 시스템 및 방법 (출원번호: 10-2025-0163048)

3. 신용보고서 기반 대출 월납입액 결측치 추정을 위한 계층적 시스템 및 방법 (출원번호: 10-2025-0164076)

4. 금융 원리 기반 신용보고서 결측치 추정을 활용하여 금융지표를 산출하기 위한 계층적 방법 및 시스템 (출원번호: 10-2025-0165035)
 

또한 해당 방법론에 대해서 ACM ICAIF 2025 International Conference*에서 발표가 예정되어 있습니다. 관심 있으신 분들은 해당 발표 자료를 참고 부탁 드립니다.

*The TIE Framework: A Novel Hierarchical Solution for Accurate EMI Estimation in Emerging Markets

* FinREM Workshop @ ACM ICAIF 2025 Singapore Conference on AI in Finance

EMI Estimation Framework의 장점

EMI Estimation을 이렇게 추정하는 경우 아래와 같은 장점이 있습니다.

1. White-Box Design

어떻게 해서 해당 추정값이 도출되었는지 명확하게 설명이 가능합니다.

2. 금융적 일관성(Financial Consistency)

원리금 균등 상환액 산출 공식과 금융변수 사이의 관계를 이용했기 때문에, 추정값이 금융원리를 잘 따르고 추정된 세개의 값인 상환 기간, 금리, EMI의 일관성을 보장합니다.

3. 외삽 문제에 대한 강건성(Robustness to Extrapolation)

일반적인 ML 접근방식을 사용하게 되면, 금융변수 사이의 통계적인 관계와 데이터적인 패턴만을 인식하므로, 데이터 상으로 관측되지 않는 관계는 잘 잡지 못하게 됩니다. 예를 들어, 특정 대출상품의 특정 금액 구간에 대해서 모든 상환 기간 값이 결측인 경우, 해당 상환 기간에 대한 ML 모델의 예측력은 보장할 수가 없습니다. 그러나 본 EMI Estimation Framework를 사용하면 전혀 보지 못한 데이터 패턴이라도 합리적인 추정값을 생성해냅니다.

4. ML 방법론의 장점을 레버리지 가능

결측값의 초기값으로 ML 모델링의 예측을 적용할 수 있어서, ML과 대척점에 있는 것이 아니라, ML의 예측값을 훨씬 더 합리적인 추정값으로 바꿔주는 역할을 하게 됩니다.

도입 후의 변화

EMI Estimation Framework를 도입한 후 다음과 같은 긍정적인 변화를 이루었습니다.

1. 금융포용성(Financial Inclusion) 향상

기존에 월납입금 계산이 안 되던 고객에 대해서도 계산을 할 수 있게 해주어서, DTI(Debt-to-Income Ratio) 혹은 FOIR(Fixed Obligation to Income Ratio)와 같은 핵심적인 금융지표를 더 높은 커버리지로 산출을 할 수 있게 되었습니다. 이를 통해 대출심사 가능한 비율이 올라가고 대출승인율이 높아지게 되었습니다. 이를 통해 기존에 심사하기 힘들었던 고객들에게도 금융서비스를 제공할 수 있게 되었습니다.

2.  ACS(Alternative Credit Scoring) 모델 성능향상

현재 활성화된 대출 외에도 과거에 열였다가 닫힌 대출까지 EMI 누락값을 추정해서, 이를 통해 고객의 과거 대출의 총 월납입액과 그에 따른 상환/연체 기록을 추적할 수 있게 되었습니다. 이러한 추적을 통해 고객의 어느 정도의 총 월납입액까지가 적정 상한인지를 추정하여, 이를 ML Feature 데이터로 만들어서 사용했더니, 모델 성능이 비약적으로 향상 되었습니다.

마무리하며

어피닛의 타겟 시장은 인도입니다. 인도에서 제대로된 금융 혜택을 받는 인구는 14억 인구 중에서 매우 일부에 불과합니다. 어피닛은 모두를 위한 금융, ‘Finance for All’을 추구합니다. 이번에 소개한 사례는 이러한 노력의 일부입니다. 인도에는 아직도 금융으로 인한 혜택을 받지 못하는 사람들이 많기 때문에, 우리는 계속해서 더 많은 사람들에게 더 나은 금융 서비스를 제공하기 위하여 최선을 다할 것입니다.

Share article