Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Resumen
Este artículo representa la información disponible en bases de datos no relacionales, aprovechando los beneficios de escalabilidad, alta disponibilidad, resiliencia y facilidad proporcionados por estas. Así mismo, se da a conocer una serie de algoritmos suministrados por el motor de bases de datos de grafos Neo4j para computar métricas de grafos, nodos y relaciones. En primer lugar, se consolida un conjunto de datos públicos tomado del sistema de ventas online de Mercado Libre. Posteriormente, se modelan los datos obtenidos en un esquema de grafos que tiene como nodos a los usuarios, quienes pueden ser vendedores, compradores, productos y sus características. Como siguiente paso, se aplican algoritmos que calculan métricas del grafo, junto con sus nodos y relaciones, visualizando de esta manera los resultados obtenidos. Para finalizar, se identifican las categorías ofertadas más importantes, las comunidades existentes y los usuarios más influyentes.
Palabras clave:
Citas
Carrillo-Gelvez, G. (2019). Conjunto de datos de Mercadolibre [data set]. GitHub. https://github.com/gersongelvez/TESIS_MAESTRIA/tree/master/DATOS
Das, S. R., & Sisk, J. (2005). Financial communities. Journal of Portfolio Management, 31(4), 112-123. https://doi.org/10.3905/jpm.2005.592103
DB-Engines (2020a). DB-Engines ranking. https://db-engines.com/en/ranking
DB-Engines (2020b). DB-Engines ranking of graph DBMS. https://db-engines.com/en/ranking/graph+dbms
Dinero. (2020, agosto 10). Mercado Libre: ¿cómo llegó a ser la firma más valiosa de Latinoamérica? https://www.dinero.com/empresas/articulo/mercado-libre-es-la-empresa-mas-valiosa-de-america-latina-en-2020/295269
Eboli, M. (2007). Systemic risk in financial networks: A graph-theoretic approach. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.466.7515&rep=rep1&type=pdf
Kanavos, A., Drakopoulos, G., & Tsakalidis, A. (2017). Graph community discovery algorithms in Neo4j with a regularization-based evaluation metric. Proceedings of the 13th International Conference on Web Information Systems and Technologies (WEBIST 2017) (pp. 403-410). WEBIST. https://doi.org/10.5220/0006382104030410
Kleinberg, J. M. (1999). Authoritative sources in a hyperlinked environment. Journal of the ACM, 46(5), 604-632. https://doi.org/10.1145/324133.324140
Molloy, I., Chari, S., Finkler, U., Wiggerman, M., Jonker, C., Habeck, T., Park, Y., Jordens, F., & van-Schaik, R. (2017). Graph analytics for real-time scoring of cross-channel transactional fraud. En J. Grossklags & B. Preneel (eds.), Financial Cryptography and Data Security (pp. 22-40). Springer. https://doi.org/10.1007/978-3-662-54970-4_2
Neo4j. (2020a). Neo4j Graph Data Science Library. https://neo4j.com/graph-data-science-library/
Neo4j. (2020b). The Graph of Thrones [Season 7 Contest]. https://neo4j.com/blog/graph-of-thrones/
Neo4j (2020c). Neo4j Graph database concepts. https://neo4j.com/docs/getting-started/current/graphdb-concepts/#graphdb-concepts
Page, L., Brin, S., Motwani, R., & Winograd, T. (1999). The PageRank Citation Ranking: Bringing order to the web. Stanford InfoLab. http://ilpubs.stanford.edu:8090/422/
Pragma (2018). Los beneficios de las bases de datos NoSQL. https://www.pragma.com.co/blog/los-beneficios-de-las-bases-de-datos-nosql
Ribeiro, J., Silva, P., Duarte, R., Davids, K., & Garganta, J. (2017). Team sports performance analysed through the lens of social network theory: Implications for research and practice. Sports Medicine, 47(9), 1689-1696. https://doi.org/10.1007/s40279-017-0695-1
Rossi, R. A., & Ahmed, N. K. (2015). The network data repository with interactive graph analytics and visualization. arXiv, 2. http://arxiv.org/abs/1410.3560
Sadowski, G., & Rathle, P. (2014). Fraud detection: Discovering connections with graph databases. Neo4j. https://neo4j.com/whitepapers/white-paper-fraud-detection/
Scott, J., & Carrington, P. (2011). The SAGE handbook of social network analysis. SAGE.
Scott, J. (2011). Social network analysis: Developments, advances, and prospects. SOCNET, 1, 21-26. https://doi.org/10.1007/s13278-010-0012-6
Svensson, J. (2020). SDTimes. https://sdtimes.com/databases/guest-view-relational-vs-graph-databases-use/
Pérez, J., Arenas, M., & Gutierrez, C. (2009). Semantics and complexity of SPARQL. ACM Transactions on Database Systems, 34(3), 1-45. https://doi.org/10.1145/1567274.1567278
Vicknair, C., Macias, M., Zhao, Z., Nan, X., Chen, Y., & Wilkins, D. (2010). A comparison of a graph database and a relational database. Proceedings of the 48th Annual Southeast Regional Conference (pp. 1-6). ACM. https://doi.org/10.1145/1900008.1900067
Virji-Babul, N., Hilderman, C. G. E., Makan, N., Liu, A., Smith-Forrester, J., Franks, C., & Wang, Z. J. (2014). Changes in functional brain networks following sports-related concussion in adolescents. Journal of Neurotrauma, 31(23), 1914-1919. https://doi.org/10.1089/neu.2014.3450
Weng, J., Lim, P., Jiang, J., & He, Q. (2010). Twitterrank: Finding topic-sensitive influential Twitterers. Proceedings of the third ACM International Conference on Web Search and Data Mining (261-270). ACM. https://doi.org/10.1145/1718487.1718520