Publicación:
Generación de Consultas de Rastreo Web Mediante Herramientas Big Data

dc.contributor.advisorRoldan Nariño, Raúl Fabian
dc.contributor.authorÀvila Quintero, Johan Andrés
dc.contributor.authorCelis Prieto, Jefferson Francisco
dc.contributor.authorGacha Castiblanco, Rubén Darío
dc.contributor.authorPerez Morales, Nelson Yecid
dc.date.accessioned2021-10-12T18:38:43Z
dc.date.available2021-10-12T18:38:43Z
dc.date.issued2016
dc.description.abstractDurante muchos años se han generado millones de petabytes de datos que no fueron jamás procesados, hasta la llegada de Google que observó el valor de la información que perdía al no procesarla, desde ese momento empresas como IBM, ORACLE, SAP, entre otras, han trabajado en el análisis y procesamiento de sus datos para la toma de decisiones que les permita crecer en el mercado. Por lo anterior, se desarrolla esta investigación con el objeto de dar a conocer las características de procesamiento de grandes volúmenes de datos (Big Data). Así mismo, realizar una demostración que permita la generación de consultas a los datos alojados en la plataforma Amazon Web Service (AWS), proporcionados por la organización Common Crawl. A continuación, se utiliza la metodología de investigación de Larson & Chang, la cual permite encontrar cuáles son los pasos para el desarrollo de proceso del Big Data. Una vez terminada esta etapa se procede a seguir el marco de trabajo Scrum, el cual reduce el tiempo del proceso de desarrollo, permitiendo que el producto se genere por fases y en cada fase se realicen procedimientos como descarga, procesamiento, consulta y visualización de datos mediante herramientas como Hadoop, MapReduce, Java y PHP que conjuntamente permiten el desarrollo de un prototipo de procesamiento Big Data, el cual realiza búsquedas de tendencias en los millones de datos recolectados en la web, además de permitir consultas por medio de comparativos porcentuales, parámetros como keywords y URL, facilitando así, el análisis de la información.spa
dc.description.degreelevelPregradospa
dc.description.degreenameIngeniero(a) de Sistemasspa
dc.description.researchareaDesarrollospa
dc.description.tableofcontents-Planteamiento de la pregunta o problema de investigación -Introducción -Justificación -Objetivos -Antecedentes -Modelo cibernético Big Dataspa
dc.format.extent89 Paginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.urihttps://repositoriocrai.ucompensar.edu.co/handle/compensar/3235
dc.language.isospaspa
dc.publisher.facultyFacultad de Ingenieríaspa
dc.publisher.placeBogotá D.Cspa
dc.publisher.programIngeniería de Sistemasspa
dc.relation.referencesAlaimo, M. (2015). Proyectos Ágiles con Scrum: Flexibilidad, aprendizaje, innovación y colaboración en contextos complejos . España: Editorial Dunkenspa
dc.relation.referencesAvison, D. E., & Fitzgerald, G. ( 2012). Information system development. Maidenhead: McGraw-Hill Educationspa
dc.relation.referencesBeck et al. . (2001). Manifiesto por el Desarrollo Ágil de Software . Utah: Manifiesto Ágil.spa
dc.relation.referencesBrun, J. (2014). Big data en el contact center. Obtenido de Transcom: http://blog.transcom.com/es/big-data-en-el-contact-center/spa
dc.relation.referencesDavenport, T. (2014). Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Boston: Hardvard Business Review.spa
dc.relation.referencesIBM. (2012). ¿Qué es Big Data? Obtenido de Biblioteca técnica: https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/spa
dc.relation.referencesIBM. (2012). IBM Software Group . Atlanta: International Business Machines.spa
dc.relation.referencesIBM. (2012). The Four V's of Big Data. Obtenido de Infographics & Animations: http://www.ibmbigdatahub.com/infographic/four-vs-big-dataspa
dc.relation.referencesIEEE . (s.f.). Task Force on Requirements Engineering. Software Engineering Resources . New York: Roger S. Pressman & Associates .spa
dc.relation.referencesLarson, D., & Chang, V. (2016). A review and future direction of agile, business intelligence, analytics and data science. International Journal of Information Management, 36, (5), 700-710spa
dc.relation.referencesLópez, D. (2013). Análisis de las posibilidades de uso de Big Data en las organizaciones . Obtenido de Universidad de Cantabria: https://repositorio.unican.es/xmlui/bitstream/handle/10902/4528/TFM%20 %20David%20L%C3%B3pez%20Garc%C3%ADaS.pdf?sequence=1spa
dc.relation.referencesManyika, et al. . (2011). Big data: The next frontier for innovation, competition, and productivity. Obtenido de McKinsey Global Institute: http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the next-frontier-for-innovationspa
dc.relation.referencesOracle. (s.f.). What is Big Data? Obtenido de Overview: https://www.oracle.com/es/big data/index.htmlspa
dc.relation.referencesSage experience. (2015). El Big Data para pymes: así pueden sacarle partido las empresas (infografía). Obtenido de Economía y empresas: http://blog.sage.es/economia empresa/el-big-data-para-pymes-infografia/spa
dc.relation.referencesThe Standish Group. (1995). The CHAOS report. Washington: Standish.spa
dc.rightsFundación Universitaria Compensar, 2016spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)spa
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/spa
dc.sourceFormato PDFspa
dc.subject.proposalData Warehousespa
dc.subject.proposalValor de la informaciónspa
dc.subject.proposalHadoopspa
dc.subject.proposalMetadatosspa
dc.subject.proposalMapReducespa
dc.subject.proposalJavaspa
dc.titleGeneración de Consultas de Rastreo Web Mediante Herramientas Big Dataspa
dc.typeTrabajo de grado - Pregradospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1fspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesisspa
dc.type.redcolhttps://purl.org/redcol/resource_type/TPspa
dc.type.versioninfo:eu-repo/semantics/publishedVersionspa
dspace.entity.typePublication
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa
oaire.versionhttp://purl.org/coar/version/c_970fb48d4fbd8a85spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Proyecto De Grado BigData.pdf
Tamaño:
2.54 MB
Formato:
Adobe Portable Document Format
Descripción:

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
14.48 KB
Formato:
Item-specific license agreed upon to submission
Descripción: