Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal

Manuel Francisco  Dulce Vanegas; Adam  Beltrán Gómez

doi:10.21789/22561498.1732

Enviado: 2021-04-05

Publicado: 2021-04-05

DOI: 10.21789/22561498.1732

Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal

Manuel Francisco Dulce Vanegas

Maestría en Ingeniería y Analítica de datos, Facultad de Ciencias Naturales e Ingeniería, Universidad de Bogotá Jorge Tadeo Lozano, Colombia

Universidad de Bogotá Jorge Tadeo Lozano, Colombia

manuelf.dulcev@utadeo.edu.co

https://orcid.org/0000-0002-8210-7754

Adam Beltrán Gómez

Facultad de Ingeniería, Universidad Católica de Colombia, Colombia

Universidad Católica de Colombia, Colombia

revista.mutis@utadeo.edu.co

https://orcid.org/0000-0001-8329-6991

Ver/Descargar

PDF

FLIP

XML

Dimensions

PlumX

Número: Vol. 11 Núm. 1 (2021)

Cómo citar

Dulce Vanegas, M. F. ., & Beltrán Gómez, A. . (2021). Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal. Revista Mutis, 11(1), 48–64. https://doi.org/10.21789/22561498.1732

Más formatos de cita

ACM ACS APA ABNT Chicago Harvard IEEE MLA Turabian Vancouver

Descargar cita

Endnote/Zotero/Mendeley (RIS) BibTeX

Términos de licencia ▼

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.

Resumen

Las entidades fiscalizadoras superiores, y en específico su ente rector, la Organización Internacional de las Entidades Fiscalizadoras Superiores (INTOSAI), han impulsado en los últimos cuatro años iniciativas encaminadas al uso de tecnologías y métodos para sus procesos de vigilancia y fiscalización que sean replicables y que generen resultados tangibles en el contexto fiscal. En este sentido, la Contraloría General de la República de Colombia viene fortaleciendo su infraestructura tecnológica y capacidades técnicas con mirar a mejorar y optimizar sus esfuerzos en cuanto a la vigilancia de los recursos de los colombianos. Aunque dicha tarea no es sencilla, esta entidad ha logrado detectar patrones de aquellos contratistas que acaparan la contratación estatal, logrando estar en diferentes sectores económicos sin tener probablemente la competencia técnica para cumplir el objeto contractual estipulado. A estos se les conoce en el ámbito de la Contraloría General como contratistas “multiobjeto”. En el presente artículo se muestra la construcción de un conjunto de datos de 1.998 registros etiquetado por expertos, que corresponden a contratos del sector educativo en Colombia. Con este instrumento se llevó a cabo el entrenamiento y las pruebas sobre un clasificador automático construido para los objetos contractuales a fin de detectar presuntos contratistas “multiobjeto”. Adicionalmente, se encontró que el mejor algoritmo de clasificación fue “Máquina de Soporte Vectorial Lineal”, con una exactitud de 84 %, el cual permitió finalmente listar por agrupamiento los presuntos contratistas de este tipo.

Palabras clave

minería de texto

aprendizaje de máquina

contratación estatal

control fiscal

Text mining

machine learning

state’s procurement

fiscal control and surveillance

Citas

Al-Amini, H. S. (2020). The future of public sector auditing: Living in times of change. International Journal of Government Auditing, 47(1), 4-5. http://intosaijournal.org/wp-content/uploads/2020/02/INTOSAI-Journal_Winter-2020.pdf

Álvarez-Jareño, J. A., Badal-Valero, E., & Pavía, J. M. (2018). Aplicación de métodos estadísticos, económicos y de aprendizaje automático para la detección de la corrupción. Revista Internacional de Transparencia e Integridad, 9, 1-11. https://dialnet.unirioja.es/servlet/articulo?codigo=6977094

Bologa, A. R., Bologa, R., & Flores, A. (2010). Big data and specific analysis methods for insurance fraud detection. Database Systems Journal, 1(1), 30-39.
Contraloría General de la República de Colombia [CGR]. (2018). Plan Estratégico CGR 2018-2022. CGR.

Córdoba-Larrarte, C. F. (2019). Océano: monitoreo eficiente en la contratación pública. Economía Colombiana, 356, 4-5. https://www.economiacolombiana.co/revista/oceano-393

García, J., Molina, J. M., Berlanga, A., Patricio, M. A., Bustamante, A. L., & Padilla, W. R. (2018). Ciencia de datos. Técnicas analíticas y aprendizaje estadístico. Alfaomega.

Giraldo-Polanía, L. A, Parra-Ortiz, J. W., Cotrino-García, Y., Dulce-Vanegas, M. F., & Tafur-Díaz, J. (2018). Big data. Análisis de caso en la Contraloría de Bogotá con la entrega de bonos. Contraloría de Bogotá. https://www.olacefs.com/wp-content/uploads/2018/10/1%c2%b0-Premio-Bogot%c3%a1-Colombia.pdf

Hsu, B. M. (2020). Comparison of supervised classification models on textual data. Mathematics, 8(5). https://doi.org/10.3390/MATH8050851

Li, S. (2018). Multi-class text classification with scikit-learn. https://towardsdatascience.com/multi-class-text-classification-with-scikit-learn-12f1e60e0a9f

Mohamed, A. (2005). Survey on multiclass classification methods. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.175.107&rep=rep1&type=pdf

Organización Internacional de Entidades Fiscalizadoras Superiores [INTOSAI] (s.f.) About us. https://www.intosai.org/about-us

Othman, R., Aris, N. A., Mardziyah, A., Zainan, N., & Amin, N. M. (2015). Fraud detection and prevention methods in the Malaysian public sector: Accountants’ and internal auditors’ perceptions. Procedia Economics and Finance, 28(April), 59-67. https://doi.org/10.1016/s2212-5671(15)01082-5

Pedregosa, F., Varoquaux, G., Gramfor, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Pettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825-2830.

Rennie, J. D. M., & Rifkin, R. (2001). Improving multiclass text classification with the support vector machine. Massachusetts Institute of Technology.

Song, Y. Y., & Lu, Y. (2015). Decision tree methods: Applications for classification and prediction. Shanghai Archives of Psychiatry, 27(2), 130-135. https://doi.org/10.11919/j.issn.1002-0829.2

Wirth, R., & Hipp, J. (2000). CRISP-DM: Towards a standard process model for data mining. Proceedings of the Fourth International Conference on the Practical Application of Knowledge Discovery and Data Mining. http://citeseerx.ist.psu.edu/viewdoc/summary? https://doi.org/10.1.1.198.5133

Descargas

Los datos de descargas todavía no están disponibles.

Datos de publicación

Este artículo

Otros artículos

Revisores/as por pares

0

2.4

Perfil evaluadores/as N/D

Declaraciones de autoría

Disponibilidad de datos

N/D

16%

Financiación externa

No

32%

Conflictos de intereses

N/D

11%

Esta revista

Otras revistas

Artículos aceptados

2%

33%

Días para la publicación

0

145

Indexado en

Editor y equipo editorial: Perfiles
Sociedad académica: Universidad de Bogotá Jorge Tadeo Lozano
Editorial: Universidad de Bogotá Jorge Tadeo Lozano

Citado por

Detección de contratistas multiobjeto mediante minería de textos para focalizar el ejercicio del control y vigilancia fiscal

Autores/as

Manuel Francisco Dulce Vanegas

Adam Beltrán Gómez

Dimensions

PlumX

Resumen

Citas

Descargas

Datos de publicación

Declaraciones de autoría

Indexado en

Citado por

Enviar un artículo

tutoriales

early_pub

acerca-de

Información

incluida_en

redessociales

Código QR

mas_vistos

Número actual