
Por Jhoan Flores;
Sub Gerente de Modelos de Riesgos Técnicos en Pacífico Seguros.
Miembro del equipo de Riesgos Financieros de The Key.
Los modelos de Credit Scoring (CS) han sido utilizados como una herramienta fundamental para la mitigación del riesgo de crédito en las entidades financieras. Este se sustenta en la articulación estadístico-matemática de las características y el comportamiento financiero de los individuos para asignar una probabilidad de impago ante una obligación crediticia.
Tradicionalmente un modelo de CS se divide dependiendo de la etapa del proceso crediticio de interés. Así, estos pueden ser de admisión (cuando un futuro cliente viene a solicitar un préstamo) o de comportamiento (cuando el individuo ya es un cliente de la entidad). Los modelos de admisión se caracterizan por su limitado nivel de discriminación (más aún si hablamos de individuos no bancarizados); mientras que los comportamentales, al conocer el comportamiento del cliente, poseen un mayor nivel predictivo.
Ambas visiones utilizan información, cuando sea factible, de distintas fuentes, las cuales podemos agrupar en: Demográficos (información de las características intrínsecas al cliente, como la edad, la zona geográfica, nivel socioeconómico, etc.), Transaccional (comportamiento de compras, pagos, preferencias, montos, etc.); información de activos y pasivos y por ultimo, información del sistema financiero (Reporte Crediticio Consolidado o RCC). Con toda esta información y haciendo uso, en la mayoría de veces, de una regresión logística, se busca entender las características que llevan a cometer default a un cliente.
Por otro lado, con el surgir de nuevas metodologías en analítica avanzada nos hemos cuestionado la forma tradicional de cómo estamos construyendo este tipo de modelos. Pasamos de regresiones logísticas a modelos más sofisticados como los basados en gradientes y redes neuronales; algoritmos de optimización más sofisticados y exactos. Pero lo que no hemos cuestionado hasta ahora es el enfoque sobre el cual estamos construyendo estos modelos.
Cuando modelamos, tomamos a los individuos, pymes o empresas como islas. Es decir, analizamos exclusivamente la información propia de cada uno de estos agentes. Por ejemplo; para la generación de modelos de rating, nos concentramos en los EEFF de una empresa en particular, cuánto ha sido su incremento en utilidades, inventarios, historial crediticio, etc., olvidando el hecho de que, como casi todo en esta era, las empresas no trabajan solas, sino que tienen clientes y proveedores, sean estos otras empresas, personas o pymes.
Entonces, si estamos en un mundo cada vez más interconectado e interdependiente, ¿No es correcto pensar que esta interdependencia puede afectarnos? La respuesta es que no solo puede afectarnos sino que hasta puede definir nuestra estabilidad a largo plazo. La gran telaraña de interacciones financieras tejidas entre las empresas ha hecho que consideremos a estas como una variable adicional al momento de medir la capacidad crediticia.
Por ejemplo, imaginemos que una compañía cualquiera tiene dos clientes. A uno vende un 80% de sus ventas y el diferencial a la otra empresa. ¿Qué pasaría si la empresa que concentra la mayor cantidad de ventas quiebra? ¿Cómo afectaría a la estabilidad financiera de nuestra compañía? Pongamos otro ejemplo, imagínese que otra compañía solicita un crédito por 10 millones de soles y esta guarda relación comercial (como cliente o como proveedor) con otras 10 empresas, de las cuales 7 están en clasificación de pérdida en el sistema financiero y el diferencial en dudoso. ¿Cómo el comportamiento crediticio de mis relacionados afectará mi desempeño como cliente financiero? O analizar cuánto del mercado está concentrado en mis competidores o cómo estoy yo en referencia a ellos. Este enfoque es completamente distinto al tradicional. Pasamos de modelar bajo la premisa de “Cómo mis características” me convierten en buen pagador o no, a “Cómo las características de aquellos con quienes interactúo” afectan mi desempeño crediticio.
Pero nuevos enfoques requieren nuevas herramientas, y es aquí donde surgen algunas limitantes. Las herramientas más populares de analítica avanzada o Machine Learning (ML) no recogen de manera eficiente estas interacciones, dado que su enfoque se basa, en la mayoría de casos, en estudiar características propias de los objetos de estudio. Y como todo en la ciencia y la tecnología, la adaptación o reestructuración de las cosas van cambiando: Surgen nuevas técnicas capaces de adaptarse a estas nuevas realidades. Es en este escenario que surge la Ciencia de Redes (Network Science).
La Ciencia de Redes, busca entender, explicar y modelizar el efecto de estas interrelaciones en el estudio de un problema. Esta se sustenta en la Teoría de Grafos, una rama de las matemáticas discretas y la ciencia de la computación que considera a un fenómeno como una articulación interdependiente y estructurada de sus partes. Con un ejemplo, mostraremos como esta nueva herramienta podría ayudarnos a construir una visión distinta de un modelo de CS.
Consideremos un mercado hipotético donde sólo existan 7 empresas (panel (a) del Gráfico N° 1), centrémonos en una en particular (la empresa D) y representaremos a cada empresa como un nodo. Ahora bien, la empresa D es proveedor de la empresa G, por ello, representaremos esta relación con un enlace entre D y G (panel (b)) y por cada relación existente entre D y las demás empresas generaremos un enlace entre ellas (panel (c)). Este proceso de unir cada empresa relacionada por un enlace genera lo que se conoce como una red o grafo y es el insumo primordial de la Ciencia de Redes.
Gráfico N° 1: Proceso y complejidad en la generación de las redes financieras

Fuente: Elaborado por el autor.
Pero una red puede recoger más que sólo las relaciones. Por ejemplo, la fuerza o la magnitud de dichas relaciones. No es lo mismo que una compañía comercialice 10 millones de soles con una y 2 millones de soles con otra, ya que la dependencia de la relación en el primer monto es más fuerte. Este efecto puede ser recogido a través de un grafo ponderado donde cada enlace tiene un peso medido por la fuerza del enlace (véase el panel (d) del Gráfico N° 1).
Además de medir la fuerza del enlace, se puede distinguir entre los distintos canales por los cuales fluye el dinero. Por ejemplo, tomando el caso anterior, de los 10 millones de soles negociados; 7 millones de soles provienen de pagarés y el diferencial es efectivo. De esta forma se distinguen los distintos medios que hacen posible una operación comercial y así se puede potenciar alguno de ellos o incluso promover la venta y negociación por algún canal en específico. Este fenómeno puede ser representado por un multigrafo (múltiples enlaces que conectan a un par de nodos, véase panel (e) del Gráfico N° 1).
Como ocurre con cualquier técnica analítica, a mayor complejidad mayor debe ser la representación de la realidad. Es así que el multigrafo dirigido y ponderado, una modificación adicional donde se incluye la dirección por donde fluye el dinero, representa el comportamiento más real de cómo se llevan a cabo las transacciones.
Una vez construida nuestra red, sea un grafo simple o un multigrafo dirigido y ponderado, sobre esta se pueden obtener distintas conclusiones. Por ejemplo, podemos determinar qué tan lejos estamos respecto al líder del mercado en el que nos encontramos (nodo G y F del panel (a) del Gráfico N° 2), qué proporción de nuestros clientes / proveedores están en pérdida (nodos rojos del panel (b)), qué proporción de nuestros clientes / proveedores están en condición de pago dudoso (amarillo) y normal (verde), o incluso ser más ambiciosos y estudiar cómo las relaciones de aquellos con quienes interactúo me pueden afectar (como hallar la cantidad de clientes con utilidad negativa del total de mis proveedores, por ejemplo, panel (c) del Gráfico N° 2). En suma, el proceso de feature engineering puede ser inmenso.
Gráfico N° 2: Características e influencia de las relaciones

Fuente: Elaborado por el autor.
Pero además de permitirnos crear variables (que luego pueden ser usadas en un modelo tradicional de CS), también se pueden generar modelos de contagio.
Al identificar aquellos nodos que han cometido default, podemos generar un modelo de contagio y ver cómo afectaría este a aquellos con quienes se relacionan. Por ejemplo, la metodología de SA (Spread Activation) nos permite repartir esta probabilidad a los vecinos más cercanos o a través de una alteración del modelo SIR (Susceptible – Infected –Recovered).
En resumen, es amplio y basto el potencial que se puede obtener analizando la red comercial y financiera de las empresas. El mismo ejercicio se puede extrapolar a pymes y personas, ya que completa el esquema sobre el cual modelamos. Por tanto, un modelo ideal de CS no es sólo el que contempla información propia de la empresa sino aquel que complementa dicha información con la proveniente de las relaciones y el impacto que estas puedan tener. En la práctica estas redes son bastantes complejas en tamaño y en análisis (véase el video).
Video N° 1: Red sintética que muestra la complejidad de las redes en la práctica
Fuente: Elaborado por el autor.
Como conclusión, la Ciencia de Redes, y la analítica en general, buscan entender y aproximarse más a los distintos y cada vez más complejos fenómenos. Estamos convergiendo a un mundo mucho más conectado, a una época donde la información y los datos se están volviendo el activo más importante, y la analítica es la forma en cómo rentabilizamos dichos activos.
Con todo esto, necesitamos cambiar la forma tradicional de pensar y permitir que la disrupción (bien llevada) nos permita explorar nuevas formas de cómo hacer las cosas. Porque al final, mucho de nuestra personalidad, gustos, comportamiento y acciones lo podemos resumir en simples datos.
Imagen de cabecera: https://bit.ly/2IG35T5