Historia del Machine Learning en contabilidad y finanzas

César  Kanashiro Castañeda

Las herramientas de aprendizaje automático diseñadas por humanos pueden realizar muchas tareas que pueden ayudar a los auditores y contadores. Por ejemplo, en lugar de muestrear datos, todo el libro mayor de una entidad puede ser auditado con automatización.

El aprendizaje automático es un área de la informática que estudia el aprendizaje de algoritmos informáticos que utilizan estadísticas para determinar patrones en gran cantidad de datos y hacer predicciones precisas para eventos futuros desconocidos. Las técnicas de aprendizaje automático se han utilizado en muchos diferentes campos, como la educación, la salud, la biología y las finanzas (Dogan & Birant, 2021, p.1).

En la década de 1930, Thomas Ross trabajó en una máquina que simulaba el comportamiento de un ser vivo, lo que puede considerarse el primer estudio en el área. Thomas Ross y su profesor Stevenson Smith desarrollaron una rata robot que puede encontrar el camino a través de un laberinto artificial. su estudio métodos demostrados para programar una computadora para que se comporte como animales o seres humanos en el proceso de aprendizaje (Bhavsar et al., 2017, Capítulo 12, p.283). Pero el término “aprendizaje automático” fue introducido por Arthur Samuel en 1959 y se definió como “un campo de estudio que da computadoras la capacidad de aprender sin ser programadas explícitamente”.

En 1997, Tom M. Mitchell proporcionó una definición más amplia de máquina El aprendizaje se refiere al desarrollo de programas informáticos que pueden mejorar automáticamente con la experiencia. Ambas definiciones incluidas la idea de que las computadoras puedan aprender patrones y tendencias a partir de datos históricos y predecir el futuro con precisión al mejorar su rendimiento de aprendizaje. El aprendizaje automático tiene como objetivo identificar el modelo que proporciona la predicción más repetible y precisa de los datos futuros.

El aprendizaje automático implica tanto conocimientos generales como de dominio. El conocimiento general no depende de los datos o de la tarea y está relacionado a la base del aprendizaje automático, como la estadística, la informática o la neurociencia. Por otro lado, el conocimiento del dominio se trata del campo de datos como la ingeniería, las finanzas, la salud o la química. El conocimiento del dominio tiene un papel esencial en el aprendizaje automático, ya que ayuda a diseñar mejores conjuntos de datos (Deng et al., 2020, p.2).

Desde su primera introducción, las técnicas de aprendizaje automático se hicieron muy populares y actualmente son utilizadas por muchas empresas. Basado en anteriores visualizaciones en un sitio web, es posible que se le sugiera un libro o un programa que le guste, o su banco puede informarle debido a una sospecha transacción que no se ajusta a su patrón de gasto habitual (Ahmed, 2020, pp.2022-2023). Estos son algunos ejemplos de aprendizaje automático aplicaciones a las que nos enfrentamos muy a menudo en nuestra vida diaria. El aprendizaje automático puede analizar muchos puntos de datos relacionados con un conjunto dado de situaciones para determinar cuáles son relevantes. Luego, puede aplicar los resultados a otro conjunto de datos similar para predecir los resultados (Shimamoto, 2018).

Anandarajan y Anandarajan (1999) se centraron en la comparación de técnicas de aprendizaje automático para los informes de empresa en funcionamiento de los auditores. El Los resultados del estudio mostraron que el modelo de red neuronal artificial tenía una mejor capacidad predictiva para determinar el tipo de negocio en marcha. informe de auditoría comparado con sistemas expertos y análisis discriminante múltiple.

Kotsiantis et al. (2006) exploraron la eficacia de las técnicas de aprendizaje automático para identificar empresas que presentaban informes financieros fraudulentos. declaraciones. Realizaron varios experimentos utilizando algoritmos de aprendizaje representativos y determinaron que el apilamiento propuesto la metodología variante logra mejor que otros métodos.

Song et al. (2014) estudiaron cómo evaluar el riesgo de fraude en los estados financieros mediante la aplicación de métodos de aprendizaje automático. Los resultados experimentales obtenido de la implementación de la red neuronal de retropropagación, el árbol de decisión C5.0, la regresión logística y la máquina de vectores de soporte demostró que los factores de riesgo no financieros y un sistema basado en reglas proporcionaron tasas de error más bajas. Por lo tanto, concluyeron que la propuesta enfoque podría disminuir los riesgos financieros de las partes interesadas.

En el estudio de Ding, Peng y Wang (2019), se empleó el agrupamiento de K-medians, un método de selección de pares basado en el aprendizaje automático, para Razones financieras clave de las empresas relacionadas con objetivos de investigación específicos. Según la muestra, incluidas 598 quiebras y 48.536 observaciones del año de la empresa no en bancarrota, la técnica de agrupación de medianas K se combinó con la detección de errores materiales y modelos de predicción de quiebra. El estudio indicó que el empleo de una técnica de aprendizaje automático contribuyó a mejorar los modelos al incluyendo información sobre K-medians empresas pares basadas en agrupamiento.