Application of data mining in open data from Ecuador: Crimes

Authors

DOI:

https://doi.org/10.18050/RevUCVHACER.v11n1a8

Keywords:

Análisis de datos, Software de ordenador, Delincuencia, Reconocimiento de patrones

Abstract

In recent years, Ecuador has seen a significant increase in various crimes, mainly homicides and robberies. The government and citizens must obtain, in a permanent and timely manner, significant data and information on the crimes committed, which will help in decision-making, in the definition of policies and strategies adjusted to the local environment, in order to reduce the levels of crime, which affects society and its development. This article proposes to make a recognition of the reality of open data in Ecuador on crime, and the process of data mining, using Pentaho and Orange. The process of Knowledge Discovery in Databases (KDD) was followed to develop the process of analysis of criminal data and the corresponding identification of patterns related to crime. This study identified the existence of a set of documents that provide legal support for the application of open data in public administration; however, limited official sources of crime-related open data were identified. Data was extracted and taken from the Ministry of Government, validating, through data mining tools, the potential usefulness for the exploration and detection of crime patterns and their consequent benefit in the decision making power of competent bodies.
Keywords: Data analysis, computer software, delinquency, pattern recognition.

References

Abella, A., Ortiz-de-Urbina-Criado, M. y De-Pablos-Heredero, C. (2018). Indicadores de calidad de datos abiertos: El caso del portal de datos abiertos de Barcelona. El Profesional de la Información, 27(2), 375-382. https://doi.org/10.3145/epi.2018.mar.16

Allahyari, M., Pouriyeh, S., Assefi, M., Safaei, S., Trippe, E. D., Gutierrez, J. B. y Kochut, K. (2017). A Brief Survey of Text Mining: Classification, Clustering and Extraction Techniques. ArXiv:1707.02919 [Cs]. http://arxiv.org/abs/1707.02919

Alves, A., Neves, D., Santos, L., Rodrigues, M. y Do Nascimento, R. (2018). Open Government Data Usage Overview: A Systematic Literature Mapping. Proceedings of the Euro American Conference on Telematics and Information Systems, 29(1), 1-8. https://doi.org/10.1145/3293614.3293619

Arteaga, D., Remigio, R. y Calderón, D. (2018). Minería de Datos Aplicado al Marketing. Número Especial de la Revista Aristas: Investigación Básica y Aplicada, 6(12), 23-28. http://fcqi.tij.uabc.mx/usuarios/revistaaristas/numeros/N12/articulos/23-28.pdf

Awiti, J., Vaisman, A. A. y Zimányi, E. (2020). Design and implementation of ETL processes using BPMN and relational algebra. Data & Knowledge Engineering, 129, 1-14. https://doi.org/10.1016/j.datak.2020.101837

Barrenechea, O., Mendieta, A., Armas, J. y Madrid, J. (2019). Data Governance Reference Model to streamline the supply chain process in SMEs. 2019 IEEE XXVI International Conference on Electronics, Electrical Engineering and Computing (INTERCON), 1-4. https://doi.org/10.1109/INTERCON.2019.8853634

Birks, D., Coleman, A. y Jackson, D. (2020). Unsupervised identification of crime problems from police free-text data. Crime Science, 9(1), 18. https://doi.org/10.1186/s40163-020-00127-4

Britos, P., Fernández, E., Merlino, H., Pollo-Cataneo, F., Rodríguez, D., Procopio, C., Rancan, C. y García-Martínez, R. (2008, octubre). Explotación de información aplicada a inteligencia criminal en Argentina. XIV Congreso Argentino de Ciencias de la Computación. https://core.ac.uk/download/pdf/15778666.pdf

CEPAL. (2021, diciembre). Ecuador – Sistema político electoral. Observatorio de Igualdad de Género de América Latina y el Caribe. https://oig.cepal.org/es/paises/12/system

Cerda, J. y Cifuentes, L. (2012). Uso de curvas ROC en investigación clínica: Aspectos teórico-prácticos. Revista chilena de infectología, 29(2), 138-141. https://doi.org/10.4067/S0716-10182012000200003

Cerda, J. y Cifuentes, L. (2012). Uso de curvas ROC en investigación clínica. Aspectos teórico-prácticos. Revista Chilena de Infectología, 29(2), 138-141. https://www.scielo.cl/pdf/rci/v29n2/art03.pdf

Coimbra, L. y Briones, Á. (2019). Crimen y castigo. Una reflexión desde América Latina. URVIO: Revista Latinoamericana de Estudios de Seguridad, 24, 26-41. https://doi.org/10.17141/urvio.24.2019.3779

De Juana-Espinosa, S. y Luján-Mora, S. (2019). Open government data portals in the European Union: Considerations, development, and expectations. Technological Forecasting and Social Change, 149, 119769. https://doi.org/10.1016/j.techfore.2019.119769

Fayyad, U., Piatetsky-Shapiro, G. y Smyth, P. (1996a). From Data Mining to Knowledge Discovery in Databases. AI Magazine, 17(3), 37-54.

Fayyad, U., Piatetsky-Shapiro, G. y Smyth, P. (1996b). The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM, 39(11), 27-34. https://doi.org/10.1145/240455.240464

Faziludeen, S. y Sankaran, P. (2016). ECG Beat Classification Using Evidential K -Nearest Neighbours. Procedia Computer Science, 89, 499-505. https://doi.org/10.1016/j.procs.2016.06.106

Feijoó, E., Gutiérrez, N., Torres, D. y Orellana, M. (2018). Costos de la delincuencia y su impacto socio-económico en el Ecuador. Intercostos. https://intercostos.org/wp-content/uploads/2018/01/FEIJOO-GONZALEZ.pdf

García-García, J. y Curto-Rodríguez, R. (2018). Divulgación de información pública de las comunidades autónomas españolas (2013-2017): Portal de datos abiertos, portal de transparencia y web institucional. El Profesional de la Información, 27(5), 1051-1061. https://doi.org/10.3145/epi.2018.sep.09

Gladshiya, V. B. Sharmila, D. K. (2021). Analyzing the risk factors and predicting the learning ability of students during pandemic and comparing machine learning algorithms using Orange tool. Turkish Journal of Physiotherapy and Rehabilitation, 32(3), 1411-1418. www.turkjphysiotherrehabil.org

Gobierno de la República del Ecuador. (2021). Misión/Visión. Ministerio de Gobierno del Ecuador. https://www.ministeriodegobierno.gob.ec/valores-mision-vision/

Han, J. y Kamber, M. (2012). Data Mining. Morgan Kaufmann Publishers. Elsevier.

Haro, S., Zúñiga, L., Meneses A., Vera, L. y Escudero, A. (2018). Métodos de clasificación en minería de datos meteorológicos. Perfiles, 2(20), 107-113. https://doi.org/10.47187/perf.v2i20.40

Harvy, I., Matitaputty, G. A., Girsang, A. S., Michael, S. e Isa, S. M. (2019). The Use of Book Store GIS Data Warehouse in Implementing the Analysis of Most Book Selling. 2019 7th International Conference on Cyber and IT Service Management (CITSM), 1-5. https://doi.org/10.1109/CITSM47753.2019.8965404

Herrera-Melo, C. A. y González Sanabria, J. S. (2019). Proposal for the Evaluation of Open Data Portals. Revista Facultad de Ingeniería, 29(54), e10194. https://doi.org/10.19053/01211129.v29.n0.2020.10194

Instituto Nacional de Estadísticas y Censos de Ecuador. (2018). Clasificación Nacional de Delitos con Fines Estadísticos. Versión Provisional. https://www.cepal.org/sites/default/files/presentations/septima-reunion-gtci-clasificacion-nacional-delitos-con-fines-estadisticos-inec-ecuador.pdf

IX Conferencia Iberoamericana de Ministros de Administración Pública y Reforma del Estado. (2007). Carta Iberoamericana de Gobierno Electrónico. https://clad.org/wp-content/uploads/2020/07/Carta-Iberoamericana-de-Gobierno-Electronico.pdf

Kosorukov, A. A. (2017). Digital government model: Theory and practice of modern public administration. Journal of Legal, Ethical and Regulatory Issues, 20(3), 141. https://www.abacademies.org/articles/Digital-government-model-theory-and-practice-of-modern-public-administration-1544-0044-20-3-141.pdf

Lausch, A. (2014). Data mining and linked open data –New perspectives for data analysis in environmental research. Ecological Modelling, 295, 5-17. https://doi.org/10.1016/j.ecolmodel.2014.09.018

Leite, N., Pedrosa, I. y Bernardino, J. (2019). Open Source Business Intelligence on a SME: A Case Study using Pentaho. 2019 14th Iberian Conference on Information Systems and Technologies (CISTI), 1-7. https://doi.org/10.23919/CISTI.2019.8760740

Máchová, R., Hub, M. y Lnenicka, M. (2018). Usability evaluation of open data portals: Evaluating data discoverability, accessibility, and reusability from a stakeholders’ perspective. Aslib Journal of Information Management, 70(3), 252-268. https://doi.org/10.1108/AJIM-02-2018-0026

Ministerio de Gobierno del Ecuador. (2019). Plan Nacional de Seguridad Ciudadana y Convivencia Social Pacífica 2019-2030. ONU Mujeres, Programa de las Naciones Unidas para el Desarrollo. https://www.ministeriodegobierno.gob.ec/wp-content/uploads/2019/08/PLAN-NACIONAL-DE-SEGURIDAD-CIUDADANA-Y-CONVIVENCIA-SOCIAL-PACI%CC%81FICA-2019-2030-1_compressed.pdf

Ministerio de Gobierno del Ecuador. (2021). Indicadores de Seguridad Ciudadana. http://cifras.ministeriodegobierno.gob.ec/comisioncifras/inicio.php

Ministerio de Telecomunicaciones y de la Sociedad de la Información. (2020a). Acuerdo Ministerial No. 011-2020. Aplicación de minería de datos en datos abiertos de Ecuador: Delitos. https://www.gobiernoelectronico.gob.ec/wp-content/uploads/2020/04/Acuerdo-Poli%CC%81tica-Datos-Abiertos-17.04.20-v4-signed.pdf

Ministerio de Telecomunicaciones y de la Sociedad de la Información. (2020b). Acuerdo Ministerial No. 035-2020. https://www.gobiernoelectronico.gob.ec/wp-content/uploads/2021/02/Acuerdo-35-2020-Guia-Datos-Abiertos-20201211-signed-signed-signed-signed.pdf

Nascimento, F., Cesar da Rocha, J. y Garcia, A. C. B. (2018). Automated Evaluation of Open Government Data Portals: A Case Study. International Journal of Electronic Government Research, 14(3), 57-72. https://doi.org/10.4018/IJEGR.2018070105

Naser, A. y Rosales, D. (2016, noviembre). Panorama regional de los datos abiertos. Avances y desafíos en América Latina y el Caribe. Naciones Unidas.

Oficina de las Naciones Unidas contra la Droga y el Delito (UNODC). (2015). Clasificación Internacional de Delitos con Fines Estadísticos. Oficina de las Naciones Unidas contra la Droga y el Delito (UNODC).

Padmavaty, V., Geetha, C. y Priya, N. (2020). Analysis of data mining tool Orange. International Journal of Modern Agriculture, 9(4), 1146-1150. http://www.modern-journals.com/index.php/ijma/article/view/485/412

Parra, V., Syed, A., Mohammad, A. y Halgamuge, M. (2016). Pentaho and Jaspersoft: A Comparative Study of Business Intelligence Open Source Tools Processing Big Data to Evaluate Performances. International Journal of Advanced Computer Science and Applications, 7(10), 20-29. https://doi.org/10.14569/IJACSA.2016.071003

Pérez, C. y Santín, D. (2007). Minería de datos: Técnicas y herramientas. Ediciones Paraninfo S.A.

Piatetsky-Shapiro, G. (1990). Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop. AI Magazine. https://doi.org/10.1609/aimag.v11i4.873

Ratra, R. y Gulia, P. (2020). Experimental Evaluation of Open Source Data Mining Tools (WEKA and Orange). International Journal of Engineering Trends and Technology, 68(8), 30-35. https://doi.org/10.14445/22315381/IJETT-V68I8P206S

Raykar, S. S. y Shet, V. N. (2020). Cognitive Analysis of Data Mining Tools Application in Health Care Services. 2020 International Conference on Emerging Trends in Information Technology and Engineering (Ic-ETITE), 1-7. https://doi.org/10.1109/ic-ETITE47903.2020.442

Registro Oficial de Ecuador. (2021). Registro Oficial Suplemento No371 del 15 de enero de 2021. https://www.registroficial.gob.ec/index.php/registro-oficial-web/publicaciones/suplementos/item/download/13451_91cc67cffde9b156b6ae042bf07cf966

República del Ecuador. (2018). Constitución de la República del Ecuador. https://www.ambiente.gob.ec/wp-content/uploads/downloads/2018/09/Constitucion-de-la-Republica-del-Ecuador.pdf

Rodríguez, Y. y Díaz, A. (2009). Herramientas de Minería de Datos. Revista Cubana de Ciencias Informáticas, 3(3-4), 73-80. https://www.redalyc.org/pdf/3783/378343637009

Royo-Montañés, S. y Benítez-Gómez, A. (2019). Portales de datos abiertos. Metodología de análisis y aplicación a municipios españoles. Profesional de la Información, 28(6), 1-13. https://doi.org/10.3145/epi.2019.nov.09

Sangeetha Lakshmi, y Jayashree, M. (2018). Comparative Analysis of Various Tools for Data Mining and Big Data Mining. International Journal of Engineering Research And Techonology (IJERT), 7(11), 239-245. https://www.irjet.net/archives/V6/i4/IRJET-V6I4156.pdf

Saxena, S. (2018). Open government data (OGD) in six Middle East countries: An evaluation of the national open data portals. Digital Policy, Regulation and Governance, 20(4), 310-322. https://doi.org/10.1108/DPRG-10-2017-0055

Schauppenlehner, T. y Muhar, A. (2018). Theoretical Availability versus Practical Accessibility: The Critical Role of Metadata Management in Open Data Portals. MDPI Sustainability, 10(2), 545. https://doi.org/10.3390/su10020545

Shafique, U. y Qaiser, H. (2014). A Comparative Study of Data Mining Process Models (KDD, CRISP-DM and SEMMA). International Journal of Innovation and Scientific Research, 12(1), 217-222. http://www.ijisr.issr-journals.org/abstract.php?article=IJISR-14-281-04

Steyerberg, E., Van Calster, B. y Pencina, M. (2011). Medidas del rendimiento de modelos de predicción y marcadores pronósticos: Evaluación de las predicciones y clasificaciones. Revista Española de Cardiología, 64(9), 788-794. https://doi.org/10.1016/j.recesp.2011.04.017

Temesio, S., García, S. y Pérez, A. (2021). Rendimiento estudiantil en tiempo de pandemia: Percepciones sobre aspectos con mayor impacto. Revista Iberoamericana de Tecnología en Educación y Educación en Tecnología, 28, e45. https://doi.org/10.24215/18509959.28.e45

Timarán Pereira, S. R., Hernández Arteaga, I., Caicedo Zambrano, S. J., Hidalgo Troya, A. y Alvarado Pérez, J. C. (2016). El proceso de descubrimiento de conocimiento en bases de datos. Descubrimiento de patrones de desempeño académico con árboles de decisión en las competencias genéricas de la formación profesional. https://doi.org/10.16925/9789587600490

Timarán-Pereira, S., Hernández-Arteaga, I., Caicedo-Zambrano, S., Hidalgo-Troya, A. y Alvarado-Pérez, J. (2016). Descubrimiento de patrones de desempeño académico con árboles de decisión en las competencias genéricas de la formación profesional. Ediciones Universidad Cooperativa de Colombia. https://doi.org/10.16925/9789587600490

Valenga, F., Fernández, E., Merlino, H., Rodríguez, D., Procopio, C. y Britos, P. (2008). Minería de Datos Aplicada a la Detección de Patrones Delictivos en Argentina. VII Jornadas Iberoamericanas de Ingeniería del Software e Ingeniería del Conocimiento, 10. https://www.researchgate.net/publication/221359973_Mineria_de_Datos_Aplicada_a_la_Deteccion_de_Patrones_Delictivos_en_Argentina

Verma, K., Bhardwaj, S., Arya, R., Salim, M., Bhushan, M., Kumar, A. y Samant, P. (2019). Latest Tools for Data Mining and Machine Learning. International Journal of Innovative Technology and Exploring Engineering (IJITEE), 8(9S), 18-23. https://doi.org/10.35940/ijitee.I1003.0789S19

VIII Cumbre de las Américas. (2018). Compromiso de Lima. http://www.summit-americas.org/LIMA_COMMITMENT/LimaCommitment_es.pdf

Villalta, C., Castillo, J. y Torres, J. (2016). Violent Crime in Latin American Cities. Inter-American Development Bank. https://doi.org/10.18235/0000428

Wang, D., Chen, C. y Richards, D. (2018). A prioritization-based analysis of local open government data portals: A case study of Chinese province-level governments. Government Information Quarterly, 35(4), 644-656. https://doi.org/10.1016/j.giq.2018.10.006

XVII Conferencia Iberoamericana de Ministras y Ministros de Administración Pública y Reforma del Estado. (2016). Carta Iberoamericana de Gobierno Abierto. Centro Latinoamericano de Administración para el Desarrollo. https://clad.org/wp-content/uploads/2020/07/Carta-Iberoamericana-de-Gobierno-Abierto-07-2016.pdf

Zhu, X. Freeman, M. (2019). An evaluation of U.S. municipal open data portals: A user interaction framework. Journal of the Association for Information Science and Technology, 70(1), 27-37. https://doi.org/10.1002/asi.24081

Published

2022-03-11

How to Cite

COLINA VARGAS, A. M., & ESPINOZA MINA, M. A. (2022). Application of data mining in open data from Ecuador: Crimes. UCV Hacer, 11(1), 79–93. https://doi.org/10.18050/RevUCVHACER.v11n1a8

Issue

Section

Research Articles

Most read articles by the same author(s)

Obs.: This plugin requires at least one statistics/report plugin to be enabled. If your statistics plugins provide more than one metric then please also select a main metric on the admin's site settings page and/or on the journal manager's settings pages.