Publicación: Generación de Consultas de Rastreo Web Mediante Herramientas Big Data
dc.contributor.advisor | Roldan Nariño, Raúl Fabian | |
dc.contributor.author | Àvila Quintero, Johan Andrés | |
dc.contributor.author | Celis Prieto, Jefferson Francisco | |
dc.contributor.author | Gacha Castiblanco, Rubén Darío | |
dc.contributor.author | Perez Morales, Nelson Yecid | |
dc.date.accessioned | 2021-10-12T18:38:43Z | |
dc.date.available | 2021-10-12T18:38:43Z | |
dc.date.issued | 2016 | |
dc.description.abstract | Durante muchos años se han generado millones de petabytes de datos que no fueron jamás procesados, hasta la llegada de Google que observó el valor de la información que perdía al no procesarla, desde ese momento empresas como IBM, ORACLE, SAP, entre otras, han trabajado en el análisis y procesamiento de sus datos para la toma de decisiones que les permita crecer en el mercado. Por lo anterior, se desarrolla esta investigación con el objeto de dar a conocer las características de procesamiento de grandes volúmenes de datos (Big Data). Así mismo, realizar una demostración que permita la generación de consultas a los datos alojados en la plataforma Amazon Web Service (AWS), proporcionados por la organización Common Crawl. A continuación, se utiliza la metodología de investigación de Larson & Chang, la cual permite encontrar cuáles son los pasos para el desarrollo de proceso del Big Data. Una vez terminada esta etapa se procede a seguir el marco de trabajo Scrum, el cual reduce el tiempo del proceso de desarrollo, permitiendo que el producto se genere por fases y en cada fase se realicen procedimientos como descarga, procesamiento, consulta y visualización de datos mediante herramientas como Hadoop, MapReduce, Java y PHP que conjuntamente permiten el desarrollo de un prototipo de procesamiento Big Data, el cual realiza búsquedas de tendencias en los millones de datos recolectados en la web, además de permitir consultas por medio de comparativos porcentuales, parámetros como keywords y URL, facilitando así, el análisis de la información. | spa |
dc.description.degreelevel | Pregrado | spa |
dc.description.degreename | Ingeniero(a) de Sistemas | spa |
dc.description.researcharea | Desarrollo | spa |
dc.description.tableofcontents | -Planteamiento de la pregunta o problema de investigación -Introducción -Justificación -Objetivos -Antecedentes -Modelo cibernético Big Data | spa |
dc.format.extent | 89 Paginas | spa |
dc.format.mimetype | application/pdf | spa |
dc.identifier.uri | https://repositoriocrai.ucompensar.edu.co/handle/compensar/3235 | |
dc.language.iso | spa | spa |
dc.publisher.faculty | Facultad de Ingeniería | spa |
dc.publisher.place | Bogotá D.C | spa |
dc.publisher.program | Ingeniería de Sistemas | spa |
dc.relation.references | Alaimo, M. (2015). Proyectos Ágiles con Scrum: Flexibilidad, aprendizaje, innovación y colaboración en contextos complejos . España: Editorial Dunken | spa |
dc.relation.references | Avison, D. E., & Fitzgerald, G. ( 2012). Information system development. Maidenhead: McGraw-Hill Education | spa |
dc.relation.references | Beck et al. . (2001). Manifiesto por el Desarrollo Ágil de Software . Utah: Manifiesto Ágil. | spa |
dc.relation.references | Brun, J. (2014). Big data en el contact center. Obtenido de Transcom: http://blog.transcom.com/es/big-data-en-el-contact-center/ | spa |
dc.relation.references | Davenport, T. (2014). Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Boston: Hardvard Business Review. | spa |
dc.relation.references | IBM. (2012). ¿Qué es Big Data? Obtenido de Biblioteca técnica: https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/ | spa |
dc.relation.references | IBM. (2012). IBM Software Group . Atlanta: International Business Machines. | spa |
dc.relation.references | IBM. (2012). The Four V's of Big Data. Obtenido de Infographics & Animations: http://www.ibmbigdatahub.com/infographic/four-vs-big-data | spa |
dc.relation.references | IEEE . (s.f.). Task Force on Requirements Engineering. Software Engineering Resources . New York: Roger S. Pressman & Associates . | spa |
dc.relation.references | Larson, D., & Chang, V. (2016). A review and future direction of agile, business intelligence, analytics and data science. International Journal of Information Management, 36, (5), 700-710 | spa |
dc.relation.references | López, D. (2013). Análisis de las posibilidades de uso de Big Data en las organizaciones . Obtenido de Universidad de Cantabria: https://repositorio.unican.es/xmlui/bitstream/handle/10902/4528/TFM%20 %20David%20L%C3%B3pez%20Garc%C3%ADaS.pdf?sequence=1 | spa |
dc.relation.references | Manyika, et al. . (2011). Big data: The next frontier for innovation, competition, and productivity. Obtenido de McKinsey Global Institute: http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the next-frontier-for-innovation | spa |
dc.relation.references | Oracle. (s.f.). What is Big Data? Obtenido de Overview: https://www.oracle.com/es/big data/index.html | spa |
dc.relation.references | Sage experience. (2015). El Big Data para pymes: así pueden sacarle partido las empresas (infografía). Obtenido de Economía y empresas: http://blog.sage.es/economia empresa/el-big-data-para-pymes-infografia/ | spa |
dc.relation.references | The Standish Group. (1995). The CHAOS report. Washington: Standish. | spa |
dc.rights | Fundación Universitaria Compensar, 2016 | spa |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | spa |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | spa |
dc.source | Formato PDF | spa |
dc.subject.proposal | Data Warehouse | spa |
dc.subject.proposal | Valor de la información | spa |
dc.subject.proposal | Hadoop | spa |
dc.subject.proposal | Metadatos | spa |
dc.subject.proposal | MapReduce | spa |
dc.subject.proposal | Java | spa |
dc.title | Generación de Consultas de Rastreo Web Mediante Herramientas Big Data | spa |
dc.type | Trabajo de grado - Pregrado | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | spa |
dc.type.content | Text | spa |
dc.type.driver | info:eu-repo/semantics/bachelorThesis | spa |
dc.type.redcol | https://purl.org/redcol/resource_type/TP | spa |
dc.type.version | info:eu-repo/semantics/publishedVersion | spa |
dspace.entity.type | Publication | |
oaire.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
oaire.version | http://purl.org/coar/version/c_970fb48d4fbd8a85 | spa |