Aplicación de minería de datos en datos abiertos de Ecuador: Delitos
DOI:
https://doi.org/10.18050/RevUCVHACER.v11n1a8Palabras clave:
Análisis de datos, Software de ordenador, Delincuencia, Reconocimiento de patronesResumen
Ecuador en los últimos años ha registrado un significativo incremento de diversos delitos, principalmente homicidios y robos. El gobierno y la ciudadanía deben obtener, de forma permanente y oportuna, datos e información significativa de los delitos consumados; que favorezcan a la toma de decisiones, en la definición de políticas y estrategias ajustadas al entorno local, para la disminución de los niveles de la delincuencia, que afecta a la sociedad y a su desarrollo. Este articulo propone hacer un reconocimiento de la realidad de los datos abiertos en el Ecuador sobre delincuencia, y del proceso de minería de datos, utilizando Pentaho y Orange. Se siguió el proceso de Descubrimiento de Conocimiento en Bases de Datos (KDD), para desarrollar el proceso de análisis de datos criminales y la correspondiente identificación de patrones relacionados con los delitos. Este estudio permitió identificar la existencia de un conjunto de documentos que dan sustento legal a la aplicación de datos abiertos en la Administración pública; sin embargo, se identificaron limitadas fuentes oficiales de datos abiertos relacionadas con delitos. Se extrajo y se tomó datos del Ministerio de Gobierno, validando, a través de herramientas de minería de datos, la potencial utilidad para la exploración y detección de patrones delictivos y su consecuente beneficio en el poder de decisión de organismos competentes.
Palabras clave: Análisis de datos, software de ordenador, delincuencia, reconocimiento de patrones.
Citas
Abella, A., Ortiz-de-Urbina-Criado, M. y De-Pablos-Heredero, C. (2018). Indicadores de calidad de datos abiertos: El caso del portal de datos abiertos de Barcelona. El Profesional de la Información, 27(2), 375-382. https://doi.org/10.3145/epi.2018.mar.16
Allahyari, M., Pouriyeh, S., Assefi, M., Safaei, S., Trippe, E. D., Gutierrez, J. B. y Kochut, K. (2017). A Brief Survey of Text Mining: Classification, Clustering and Extraction Techniques. ArXiv:1707.02919 [Cs]. http://arxiv.org/abs/1707.02919
Alves, A., Neves, D., Santos, L., Rodrigues, M. y Do Nascimento, R. (2018). Open Government Data Usage Overview: A Systematic Literature Mapping. Proceedings of the Euro American Conference on Telematics and Information Systems, 29(1), 1-8. https://doi.org/10.1145/3293614.3293619
Arteaga, D., Remigio, R. y Calderón, D. (2018). Minería de Datos Aplicado al Marketing. Número Especial de la Revista Aristas: Investigación Básica y Aplicada, 6(12), 23-28. http://fcqi.tij.uabc.mx/usuarios/revistaaristas/numeros/N12/articulos/23-28.pdf
Awiti, J., Vaisman, A. A. y Zimányi, E. (2020). Design and implementation of ETL processes using BPMN and relational algebra. Data & Knowledge Engineering, 129, 1-14. https://doi.org/10.1016/j.datak.2020.101837
Barrenechea, O., Mendieta, A., Armas, J. y Madrid, J. (2019). Data Governance Reference Model to streamline the supply chain process in SMEs. 2019 IEEE XXVI International Conference on Electronics, Electrical Engineering and Computing (INTERCON), 1-4. https://doi.org/10.1109/INTERCON.2019.8853634
Birks, D., Coleman, A. y Jackson, D. (2020). Unsupervised identification of crime problems from police free-text data. Crime Science, 9(1), 18. https://doi.org/10.1186/s40163-020-00127-4
Britos, P., Fernández, E., Merlino, H., Pollo-Cataneo, F., Rodríguez, D., Procopio, C., Rancan, C. y García-Martínez, R. (2008, octubre). Explotación de información aplicada a inteligencia criminal en Argentina. XIV Congreso Argentino de Ciencias de la Computación. https://core.ac.uk/download/pdf/15778666.pdf
CEPAL. (2021, diciembre). Ecuador – Sistema político electoral. Observatorio de Igualdad de Género de América Latina y el Caribe. https://oig.cepal.org/es/paises/12/system
Cerda, J. y Cifuentes, L. (2012). Uso de curvas ROC en investigación clínica: Aspectos teórico-prácticos. Revista chilena de infectología, 29(2), 138-141. https://doi.org/10.4067/S0716-10182012000200003
Cerda, J. y Cifuentes, L. (2012). Uso de curvas ROC en investigación clínica. Aspectos teórico-prácticos. Revista Chilena de Infectología, 29(2), 138-141. https://www.scielo.cl/pdf/rci/v29n2/art03.pdf
Coimbra, L. y Briones, Á. (2019). Crimen y castigo. Una reflexión desde América Latina. URVIO: Revista Latinoamericana de Estudios de Seguridad, 24, 26-41. https://doi.org/10.17141/urvio.24.2019.3779
De Juana-Espinosa, S. y Luján-Mora, S. (2019). Open government data portals in the European Union: Considerations, development, and expectations. Technological Forecasting and Social Change, 149, 119769. https://doi.org/10.1016/j.techfore.2019.119769
Fayyad, U., Piatetsky-Shapiro, G. y Smyth, P. (1996a). From Data Mining to Knowledge Discovery in Databases. AI Magazine, 17(3), 37-54.
Fayyad, U., Piatetsky-Shapiro, G. y Smyth, P. (1996b). The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM, 39(11), 27-34. https://doi.org/10.1145/240455.240464
Faziludeen, S. y Sankaran, P. (2016). ECG Beat Classification Using Evidential K -Nearest Neighbours. Procedia Computer Science, 89, 499-505. https://doi.org/10.1016/j.procs.2016.06.106
Feijoó, E., Gutiérrez, N., Torres, D. y Orellana, M. (2018). Costos de la delincuencia y su impacto socio-económico en el Ecuador. Intercostos. https://intercostos.org/wp-content/uploads/2018/01/FEIJOO-GONZALEZ.pdf
García-García, J. y Curto-Rodríguez, R. (2018). Divulgación de información pública de las comunidades autónomas españolas (2013-2017): Portal de datos abiertos, portal de transparencia y web institucional. El Profesional de la Información, 27(5), 1051-1061. https://doi.org/10.3145/epi.2018.sep.09
Gladshiya, V. B. Sharmila, D. K. (2021). Analyzing the risk factors and predicting the learning ability of students during pandemic and comparing machine learning algorithms using Orange tool. Turkish Journal of Physiotherapy and Rehabilitation, 32(3), 1411-1418. www.turkjphysiotherrehabil.org
Gobierno de la República del Ecuador. (2021). Misión/Visión. Ministerio de Gobierno del Ecuador. https://www.ministeriodegobierno.gob.ec/valores-mision-vision/
Han, J. y Kamber, M. (2012). Data Mining. Morgan Kaufmann Publishers. Elsevier.
Haro, S., Zúñiga, L., Meneses A., Vera, L. y Escudero, A. (2018). Métodos de clasificación en minería de datos meteorológicos. Perfiles, 2(20), 107-113. https://doi.org/10.47187/perf.v2i20.40
Harvy, I., Matitaputty, G. A., Girsang, A. S., Michael, S. e Isa, S. M. (2019). The Use of Book Store GIS Data Warehouse in Implementing the Analysis of Most Book Selling. 2019 7th International Conference on Cyber and IT Service Management (CITSM), 1-5. https://doi.org/10.1109/CITSM47753.2019.8965404
Herrera-Melo, C. A. y González Sanabria, J. S. (2019). Proposal for the Evaluation of Open Data Portals. Revista Facultad de Ingeniería, 29(54), e10194. https://doi.org/10.19053/01211129.v29.n0.2020.10194
Instituto Nacional de Estadísticas y Censos de Ecuador. (2018). Clasificación Nacional de Delitos con Fines Estadísticos. Versión Provisional. https://www.cepal.org/sites/default/files/presentations/septima-reunion-gtci-clasificacion-nacional-delitos-con-fines-estadisticos-inec-ecuador.pdf
IX Conferencia Iberoamericana de Ministros de Administración Pública y Reforma del Estado. (2007). Carta Iberoamericana de Gobierno Electrónico. https://clad.org/wp-content/uploads/2020/07/Carta-Iberoamericana-de-Gobierno-Electronico.pdf
Kosorukov, A. A. (2017). Digital government model: Theory and practice of modern public administration. Journal of Legal, Ethical and Regulatory Issues, 20(3), 141. https://www.abacademies.org/articles/Digital-government-model-theory-and-practice-of-modern-public-administration-1544-0044-20-3-141.pdf
Lausch, A. (2014). Data mining and linked open data –New perspectives for data analysis in environmental research. Ecological Modelling, 295, 5-17. https://doi.org/10.1016/j.ecolmodel.2014.09.018
Leite, N., Pedrosa, I. y Bernardino, J. (2019). Open Source Business Intelligence on a SME: A Case Study using Pentaho. 2019 14th Iberian Conference on Information Systems and Technologies (CISTI), 1-7. https://doi.org/10.23919/CISTI.2019.8760740
Máchová, R., Hub, M. y Lnenicka, M. (2018). Usability evaluation of open data portals: Evaluating data discoverability, accessibility, and reusability from a stakeholders’ perspective. Aslib Journal of Information Management, 70(3), 252-268. https://doi.org/10.1108/AJIM-02-2018-0026
Ministerio de Gobierno del Ecuador. (2019). Plan Nacional de Seguridad Ciudadana y Convivencia Social Pacífica 2019-2030. ONU Mujeres, Programa de las Naciones Unidas para el Desarrollo. https://www.ministeriodegobierno.gob.ec/wp-content/uploads/2019/08/PLAN-NACIONAL-DE-SEGURIDAD-CIUDADANA-Y-CONVIVENCIA-SOCIAL-PACI%CC%81FICA-2019-2030-1_compressed.pdf
Ministerio de Gobierno del Ecuador. (2021). Indicadores de Seguridad Ciudadana. http://cifras.ministeriodegobierno.gob.ec/comisioncifras/inicio.php
Ministerio de Telecomunicaciones y de la Sociedad de la Información. (2020a). Acuerdo Ministerial No. 011-2020. Aplicación de minería de datos en datos abiertos de Ecuador: Delitos. https://www.gobiernoelectronico.gob.ec/wp-content/uploads/2020/04/Acuerdo-Poli%CC%81tica-Datos-Abiertos-17.04.20-v4-signed.pdf
Ministerio de Telecomunicaciones y de la Sociedad de la Información. (2020b). Acuerdo Ministerial No. 035-2020. https://www.gobiernoelectronico.gob.ec/wp-content/uploads/2021/02/Acuerdo-35-2020-Guia-Datos-Abiertos-20201211-signed-signed-signed-signed.pdf
Nascimento, F., Cesar da Rocha, J. y Garcia, A. C. B. (2018). Automated Evaluation of Open Government Data Portals: A Case Study. International Journal of Electronic Government Research, 14(3), 57-72. https://doi.org/10.4018/IJEGR.2018070105
Naser, A. y Rosales, D. (2016, noviembre). Panorama regional de los datos abiertos. Avances y desafíos en América Latina y el Caribe. Naciones Unidas.
Oficina de las Naciones Unidas contra la Droga y el Delito (UNODC). (2015). Clasificación Internacional de Delitos con Fines Estadísticos. Oficina de las Naciones Unidas contra la Droga y el Delito (UNODC).
Padmavaty, V., Geetha, C. y Priya, N. (2020). Analysis of data mining tool Orange. International Journal of Modern Agriculture, 9(4), 1146-1150. http://www.modern-journals.com/index.php/ijma/article/view/485/412
Parra, V., Syed, A., Mohammad, A. y Halgamuge, M. (2016). Pentaho and Jaspersoft: A Comparative Study of Business Intelligence Open Source Tools Processing Big Data to Evaluate Performances. International Journal of Advanced Computer Science and Applications, 7(10), 20-29. https://doi.org/10.14569/IJACSA.2016.071003
Pérez, C. y Santín, D. (2007). Minería de datos: Técnicas y herramientas. Ediciones Paraninfo S.A.
Piatetsky-Shapiro, G. (1990). Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop. AI Magazine. https://doi.org/10.1609/aimag.v11i4.873
Ratra, R. y Gulia, P. (2020). Experimental Evaluation of Open Source Data Mining Tools (WEKA and Orange). International Journal of Engineering Trends and Technology, 68(8), 30-35. https://doi.org/10.14445/22315381/IJETT-V68I8P206S
Raykar, S. S. y Shet, V. N. (2020). Cognitive Analysis of Data Mining Tools Application in Health Care Services. 2020 International Conference on Emerging Trends in Information Technology and Engineering (Ic-ETITE), 1-7. https://doi.org/10.1109/ic-ETITE47903.2020.442
Registro Oficial de Ecuador. (2021). Registro Oficial Suplemento No371 del 15 de enero de 2021. https://www.registroficial.gob.ec/index.php/registro-oficial-web/publicaciones/suplementos/item/download/13451_91cc67cffde9b156b6ae042bf07cf966
República del Ecuador. (2018). Constitución de la República del Ecuador. https://www.ambiente.gob.ec/wp-content/uploads/downloads/2018/09/Constitucion-de-la-Republica-del-Ecuador.pdf
Rodríguez, Y. y Díaz, A. (2009). Herramientas de Minería de Datos. Revista Cubana de Ciencias Informáticas, 3(3-4), 73-80. https://www.redalyc.org/pdf/3783/378343637009
Royo-Montañés, S. y Benítez-Gómez, A. (2019). Portales de datos abiertos. Metodología de análisis y aplicación a municipios españoles. Profesional de la Información, 28(6), 1-13. https://doi.org/10.3145/epi.2019.nov.09
Sangeetha Lakshmi, y Jayashree, M. (2018). Comparative Analysis of Various Tools for Data Mining and Big Data Mining. International Journal of Engineering Research And Techonology (IJERT), 7(11), 239-245. https://www.irjet.net/archives/V6/i4/IRJET-V6I4156.pdf
Saxena, S. (2018). Open government data (OGD) in six Middle East countries: An evaluation of the national open data portals. Digital Policy, Regulation and Governance, 20(4), 310-322. https://doi.org/10.1108/DPRG-10-2017-0055
Schauppenlehner, T. y Muhar, A. (2018). Theoretical Availability versus Practical Accessibility: The Critical Role of Metadata Management in Open Data Portals. MDPI Sustainability, 10(2), 545. https://doi.org/10.3390/su10020545
Shafique, U. y Qaiser, H. (2014). A Comparative Study of Data Mining Process Models (KDD, CRISP-DM and SEMMA). International Journal of Innovation and Scientific Research, 12(1), 217-222. http://www.ijisr.issr-journals.org/abstract.php?article=IJISR-14-281-04
Steyerberg, E., Van Calster, B. y Pencina, M. (2011). Medidas del rendimiento de modelos de predicción y marcadores pronósticos: Evaluación de las predicciones y clasificaciones. Revista Española de Cardiología, 64(9), 788-794. https://doi.org/10.1016/j.recesp.2011.04.017
Temesio, S., García, S. y Pérez, A. (2021). Rendimiento estudiantil en tiempo de pandemia: Percepciones sobre aspectos con mayor impacto. Revista Iberoamericana de Tecnología en Educación y Educación en Tecnología, 28, e45. https://doi.org/10.24215/18509959.28.e45
Timarán Pereira, S. R., Hernández Arteaga, I., Caicedo Zambrano, S. J., Hidalgo Troya, A. y Alvarado Pérez, J. C. (2016). El proceso de descubrimiento de conocimiento en bases de datos. Descubrimiento de patrones de desempeño académico con árboles de decisión en las competencias genéricas de la formación profesional. https://doi.org/10.16925/9789587600490
Timarán-Pereira, S., Hernández-Arteaga, I., Caicedo-Zambrano, S., Hidalgo-Troya, A. y Alvarado-Pérez, J. (2016). Descubrimiento de patrones de desempeño académico con árboles de decisión en las competencias genéricas de la formación profesional. Ediciones Universidad Cooperativa de Colombia. https://doi.org/10.16925/9789587600490
Valenga, F., Fernández, E., Merlino, H., Rodríguez, D., Procopio, C. y Britos, P. (2008). Minería de Datos Aplicada a la Detección de Patrones Delictivos en Argentina. VII Jornadas Iberoamericanas de Ingeniería del Software e Ingeniería del Conocimiento, 10. https://www.researchgate.net/publication/221359973_Mineria_de_Datos_Aplicada_a_la_Deteccion_de_Patrones_Delictivos_en_Argentina
Verma, K., Bhardwaj, S., Arya, R., Salim, M., Bhushan, M., Kumar, A. y Samant, P. (2019). Latest Tools for Data Mining and Machine Learning. International Journal of Innovative Technology and Exploring Engineering (IJITEE), 8(9S), 18-23. https://doi.org/10.35940/ijitee.I1003.0789S19
VIII Cumbre de las Américas. (2018). Compromiso de Lima. http://www.summit-americas.org/LIMA_COMMITMENT/LimaCommitment_es.pdf
Villalta, C., Castillo, J. y Torres, J. (2016). Violent Crime in Latin American Cities. Inter-American Development Bank. https://doi.org/10.18235/0000428
Wang, D., Chen, C. y Richards, D. (2018). A prioritization-based analysis of local open government data portals: A case study of Chinese province-level governments. Government Information Quarterly, 35(4), 644-656. https://doi.org/10.1016/j.giq.2018.10.006
XVII Conferencia Iberoamericana de Ministras y Ministros de Administración Pública y Reforma del Estado. (2016). Carta Iberoamericana de Gobierno Abierto. Centro Latinoamericano de Administración para el Desarrollo. https://clad.org/wp-content/uploads/2020/07/Carta-Iberoamericana-de-Gobierno-Abierto-07-2016.pdf
Zhu, X. Freeman, M. (2019). An evaluation of U.S. municipal open data portals: A user interaction framework. Journal of the Association for Information Science and Technology, 70(1), 27-37. https://doi.org/10.1002/asi.24081
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 UCV Hacer
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.