Business Sector Classification And Beyond Using Machine Learning
El propósito de este documento es presentar el trabajo sobre la sectorización y clasificación de Holdings usando Machine Learning (en español, Aprendizaje Automático) que se ha desarrollado en la Central de Balances en el Banco de España durante el último año. Este trabajo también ha sido presentado en el World Statistics Congress (WSC) en Ottawa en julio de 2023, organizado por el International Statistics Institute (ISI). Este documento es parte de una serie de charlas sobre Bancos Centrales organizadas por el Comité Irving Fisher (IFC) en el mismo congreso. El trabajo presentado se puede dividir en dos partes diferenciadas: en primer lugar, obtener un procedimiento automatizado que ayude a distinguir compañías como Holding o Sede Central en el contexto de Actividad Económica. En otras palabras, el propósito es detectar entidades con posibles CNAE 6420 o 7010 verificando si aquellas que declaran tales actividades muestran indicadores (ratios económicos y financieros) de serlo, y viceversa, entre aquellas que no declaran esas actividades, sus datos (principalmente sus estados financieros anuales) indican el potencial de serlo. En segundo lugar, el objetivo es realizar una sectorización institucional (es decir, la clasificación necesaria para los sistemas de Cuentas Nacionales, diferente a la mera actividad económica) de compañías Holding/Sede Central, es decir, clasificarlas en sectores Financiero/No Financiero. Para lograr esto, se utiliza como punto de partida el modelo y la información generada en la primera parte del proyecto. Para cumplir con ambas tareas, se utiliza Inteligencia Artificial, en particular modelos de aprendizaje automático supervisado para clasificación. Un modelo supervisado requiere un conjunto previo de compañías etiquetadas, lo que significa que necesita compañías categorizadas de antemano y con total certeza como Holding/Sede/otras o Financiera/No Financiera. En las bases de datos disponibles en la Central de Balances (de ahora en adelante, CB) del Departamento de Estadística, hay una ...
Publisher: |
Banco de España / Madrid / Madrid : Banco de España, 2024-04-04 |
---|---|
Subject: | Machine Learning | Business Classification | Supervised Models | Holdings | Institutional Sectorisation | Head Offices | Data Integration | Variable Selection | Quality Control | Aprendizaje automático | Clasificación empresarial | Modelos supervisados | Sectorización institucional | Sedes centrales | Integración de datos | Selección de variables | Control de calidad | Inteligencia artificial | Instituciones financieras no bancarias |
Saved in:
Saved in favorites
Similar items by subject
-
Machine learning in credit risk: measuring the dilemma between prediction and supervisory cost
Alonso, Andrés, (2020)
-
Alonso, Andrés, (2021)
-
Alonso, Andrés, (2021)
- More ...