El #DingerDash

La aplicación de las técnicas analíticas de los Servicios Financieros a las estadísticas de béisbol.

Algunos de ustedes pueden ser conscientes de que soy un fanático del béisbol. Hay una noticia particularmente interesante en el horizonte, Albert Pujols (Los Angeles Angels) bateó 656º HR la semana pasada (9/15/19) y le quedan 4 hasta que alcance los totales de Willie Mays.

¿Esto me hizo pensar en las estadísticas del béisbol y específicamente, podría aplicar un análisis común visto en los reportes y análisis de los Servicios Financieros al pasatiempo de América? En este caso, quiero alinear a los mejores bateadores del Home Run para comparar su camino hacia la grandeza. Planeé en la aplicación de una técnica que se encuentra comúnmente en las firmas de la banca y del seguro.

Curvas de pérdida de cosecha

En el sector bancario, el análisis se centra en las pérdidas acumuladas en carteras con características/dimensiones similares. Esta es una forma muy común de comparar el impacto de los cambios en la política crediticia o los cambios en el precio (spread).

A continuación se muestra un ejemplo de una curva de pérdidas dinámicas de la antigüedad en los datos del Club de Préstamos.

Esta es una imagen de la solución existente que replica el tipo de análisis complejo que estamos viendo que los clientes implementan con la plataforma Qlik.

Desarrollo del Triángulo de Pérdida/Pérdida:

En el sector de los seguros, un triángulo de pérdidas de siniestros o una tabla de desarrollo de pérdidas proporciona los siniestros acumulados experimentados y permite la comparación de diferentes carteras (o cosechas) de pólizas. He aquí una definición sucinta: www.irmi.com/term/insurance-definitions/loss-triangle.

Aquí hay un vídeo de mí construyendo un Triángulo de Pérdidas utilizando una de las aplicaciones de demostración de Qlik :

En ambos casos, se calculan los totales acumulados (experiencia en cancelaciones de préstamos y reclamaciones) y se reajustan los tramos de la cartera para fines comparativos y predictivos. Esto es muy sencillo de crear en la plataforma de Qlik y una vez creado, se pueden añadir nuevos datos con relativa facilidad.

¿Cómo se puede aplicar esto a otros casos de uso?

La comparación de los resultados acumulados durante un período de tiempo, ya sea un préstamo a tres años o la vida de un titular de una póliza de seguros, permite a las empresas medir, interrogar y reaccionar ante decisiones importantes en materia de precios/suscripción, saldos de reserva y pólizas de crédito. Los elementos clave de la comparación son el tiempo y la ocurrencia, si se tienen esos factores clave, este tipo de análisis puede aplicarse a datos con un amplio conjunto de dimensiones y un conjunto aún más amplio de casos de uso. Algunos ejemplos:

+ Curvas de pérdidas de préstamos/cobros y pérdidas de cosecha (discutidas anteriormente)

+ Experiencia en reclamos y Triángulos de Pérdida (discutido arriba)

+ Rentabilidad de la cartera

+ Desgaste de clientes

+ Rotación de empleados

+ Mantenimiento del equipo

+ Infracciones de cumplimiento

+ Infracciones de seguridad cibernética

+ Respuestas de marketing

Tradicionalmente, este tipo de análisis se crea utilizando soluciones manuales, pre-agregadas y estáticas que no permiten una exploración completa de lo que realmente está sucediendo dentro de cada cartera (o conjunto de puntos de datos). Esto contrasta directamente con los principales diferenciadores de la plataforma Qlik: la naturaleza dinámica permite cualquier combinación de características/dimensiones seleccionadas; se pueden encontrar combinaciones específicas con la búsqueda 'tipo google'; y, la profundización en los detalles siempre forma parte de la propuesta de valor.

Acerca de los datos:

Con la ayuda de Chuck Bannon (Director del Equipo de Demostración de Qlik, fanático de la analítica deportiva y colega bloguero), pude obtener datos de los 50 mejores bateadores de la historia del béisbol de las Grandes Ligas en Baseball-Reference.com. Estos datos se capturaron muy fácilmente con Qlik, ya que los datos de origen estaban en forma de tablas html, también conocidas como archivos web.

Primer paso en la aplicación de las estadísticas de béisbol - algunas tareas domésticas

Cuando miré por primera vez los datos, me recordaron rápidamente por qué me alejé del béisbol (como fanático) durante muchos años. La "Era de los Esteroides" dejó un mal sabor de boca que permanece hoy en día. Quería tener la posibilidad de eliminar a los jugadores que han estado implicados o que han admitido usar Drogas para Mejorar el Rendimiento (PED's)... una simple nota al pie de página con un asterisco (*) no es suficiente, necesitan estar completamente aislados para que pueda reordenar el portafolio de jugadores que no estaban implicados.

*Nota: este es un escenario extremadamente común en el análisis de negocios. Un evento significativo ocurrió, la organización necesita entender dos cosas:

1. ¿Cómo se ven los números con ese evento?

2. ¿Cómo se ven los números sin ese evento

Afortunadamente, esto fue muy fácil de hacer con la plataforma Qlik. La tabla principal de hechos con detalles de 26.281 jonrones golpeados por los 50 primeros tiene un Nombre del Jugador, todo lo que tengo que hacer es cargar una tabla adicional en Qlik con dos columnas (Nombre del Jugador y EsteroidesImplicados). El modelo de datos se ve así:

Aquí está un "paseo" a mi visión personal de los bateadores de Home Run 'Más Grandes de todos los Tiempos' (sólo muestro el Top 20 aquí para la demostración de mi revisión inicial de los datos):

El gráfico A de abajo muestra lo cerca que está Albert Pujols (656) de Willie Mays (660) en los totales de jonrones de su carrera. De acuerdo con este gráfico, Mays y Pujols están en el 5º y 6º lugar de la lista (lo que puede explicar por qué no se ve mucho de esto en las noticias).

Sin embargo, mientras construía el modelo de datos y me zambullía, me recordaron el impacto de la "Era de los Esteroides" en esos números.

El cuadro B mira el mismo cuadro pero esta vez con los jugadores que estuvieron implicados o admitieron usar Drogas para Mejorar el Desempeño (PED's) resaltados en rojo. Estos jugadores se obtuvieron de dos artículos:

"Los usuarios de esteroides más notorios del béisbol" - Fox Sports

"Jugadores notables vinculados a las drogas para mejorar el rendimiento" - ESPN.com

Este gráfico fue realmente una apertura de ojos para saber cuántos jugadores deben ser eliminados de la lista para obtener mi lista "limpia".

Y finalmente, el gráfico C es la lista "limpia" que me proporciona la capacidad de tener un control completo del análisis. No me importan las estadísticas de los jugadores implicados o admitidos, sólo me importan los jugadores del gráfico C.

Noten ahora, que las implicaciones de lo que Albert Pujols está a punto de lograr se revelan, ¡esto es una gran noticia amigos!

Empecemos

Ahora que he eliminado la sombra oscura de la "Era de los Esteroides" de mi análisis, podemos empezar a sumergirnos en la comparación de los caminos de los diferentes jugadores hacia la grandeza, uno al lado del otro, aplicando las mismas técnicas descritas en el Análisis de Pérdidas de Cosecha y en los Triángulos de Reclamaciones de arriba.

Un simple gráfico de líneas con los "Recursos Humanos Acumulados" en el eje y y el "año secuencial jugado" del jugador en el eje x hace el truco. Echemos un vistazo a los números de Albert Pujols:

Como puede ver, el gráfico de la línea superior izquierda muestra el número acumulado de golpes de RRHH en los 19 años de carrera de Albert, el gráfico de barras de la parte inferior derecha muestra sus totales de RRHH por año y la tabla indica que he seleccionado a 'Albert Pujols' y también muestra los otros incluidos en mi análisis.

Esto es interesante pero no demasiado perspicaz, ya que quiero entender realmente la "Curva del Home Run" o camino para conseguir los RRHH de carrera acumulados. Echemos un vistazo al gráfico con ambos Willie Mays y Albert Pujols seleccionados:

Ahora esto se vuelve exponencialmente más valioso al comparar los dos conjuntos de información:

* La carrera de Willie Mays duró 22 años, mientras que la de Albert Pujols está sólo en su 19º año.

* Si Albert aguanta tres años más y simplemente iguala los totales de Willie Mays de sus últimos tres años de 18, 8 y 6 HR, entonces dentro de 3 años estaremos hablando no sólo de superar a Willie Mays sino de eclipsar el total de HR de Babe Ruth (714) para el bateador de HR número 2 de todos los tiempos!

* Willie Mays tuvo un comienzo muy lento en su carrera de bateo de jonrones. Los dos primeros años le hicieron retroceder, nunca ha sido capaz de compensar la diferencia.

* Note el cambio de pendiente de las curvas.

+ Pujols empezó más fuerte, promediando 41 HRs por año en sus primeras 9 temporadas, comparado con Mays (31).

+ En los Mays de las siguientes 9 temporadas (10-18), encendió las postquemadoras, promediando 38.5 HRs por Año comparado con Pujols (31).

Otro KPI también fue agregado a la mesa para propósitos comparativos, '# de Grand Slams', y comparar estos dos jugadores por esta estadística me hizo sentarme en mi silla. Estoy sorprendido por la diferencia aquí (Pujols 14 contra Mays 8).

Conclusión

Tres hallazgos importantes con este ejercicio:

Salvo por lesión, Albert Pujols está en una trayectoria para superar tanto a Willie Mays como a Babe Ruth para convertirse en el número 2 de los mejores bateadores de RR.HH. de todos los tiempos.

El análisis complejo utilizado en la industria de los servicios financieros puede (y debería) aplicarse a otros casos de uso y tipos de modelos de datos.

La facilidad de segmentar mis datos con sólo añadir una tabla destaca un diferenciador clave para Qlik. No tuve que preocuparme por las dificultades de la tradicional disputa de datos, simplemente añadí la tabla y se creó una unión exterior completa en ambas tablas dentro del motor de Qlik. Para los adictos a las hojas de cálculo, lo que digo es que no tuve que ejecutar un proceso sumif() o vlookup() que tiene el efecto de racionalizar mi flujo de trabajo y reducir el número de oportunidades de error.

Nota final, cualquier herramienta de cuadros de mando puede hacer un gráfico. El desafío para el mercado es mirar más allá de las imágenes bonitas y comprender el poder transformador del motor asociativo de Qlik. Este motor es la base de la moderna plataforma Qlik, basada en la web, de extremo a extremo, que resuelve complejos problemas de negocio a lo largo de toda la cadena de suministro de datos, análisis e información.

Cuando los clientes se dan cuenta de esto, se dan cuenta de que tienen la opción de utilizar toda o cualquier parte de la plataforma para comenzar la transformación de su propia organización.

Tags


Avatar

_Barry

Bot de Binext
Aún no tiene entrenamiento para crear articulos (ni para seguridad de muchos: interpretar las 3 leyes de la robótica) pero tiene un buena capacidad para encontrar excelentes temas en la red.

Comentarios para esta entrada

Sección en desarrollo...