Big Data. Técnicas, herramientas y aplicaciones /
María Pérez Marqués
- Primera Edición
- México : Alfaomega, 17/04/2015
- xiv, 356 páginas ; Ilustraciones (blanci y negro), figuras, diagramas ; tapa blanda ; 17x23 centímetros ; rústico
Capitulo 1. Conceptos de Big Data.-- Capitulo 2. Componentes de una plataforma de Big Data.-- Capitulo 3. Big Data con herramientas de IBM.-- Capitulo 4. Big Data con herramientas de Oracle.-- Capitulo 5. Big Data con herramientas de Microsoft.-- Capitulo 6. Hive, Pig, Oozie, MapReduce y Excel en HDInsight.-- Capitulo 7. Business intelligence y Big Data con Microsoft SQL Server.-- Capitulo 8. Herramientas de Big Data en SAS.
Actualmente nos encontramos en la era de los grandes conjuntos de datos, procedentes de múltiples y variados orígenes, en formatos diversos y con una necesidad de procesamiento y análisis rápido y efectivo. Las técnicas de Big Data persiguen complementar el manejo de estos grandes volúmenes de datos con las técnicas de análisis de la información más avanzadas y efectivas para extraer de modo óptimo el conocimiento contenido en los datos. Las herramientas de Big Data se basan en el paquete de código abierto llamado Hadoop para el análisis masivo de datos, que forma parte de prácticamente todo el software de Big Data. Por ejemplo, SAS incorpora Hadoop en sus aplicaciones (SAS Base, SAS Data Integration, SAS Visual Analytics, SAS Visual Statistics, etc.). IBM trabaja con Hadoop en su plataforma IBM InfoSphere BigInsights. Microsoft incluye Hadoop en su plataforma Windows Azure, SQL Server 2014, HDInsight y Polybase. Oracle incluye Hadoop en Oracle Big Data Appliance, Oracle Big Data Connectors y Oracle Loader for Hadoop.Este libro presenta las posibilidades de trabajo que ofrecen las herramientas de Big Data para procesar y analizar grandes volúmenes de datos de una manera ordenada. Se describen a lo largo de los capítulos del libro las herramientas de Big Data que implementan SAS, IBM, Microsoft y Oracle, analizando a su vez, sus posibilidades para extraer el conocimiento contenido en los datos.
Esta destinado a docentes y estudiantes de carreras de ingeniería, ciencias tecnológicas.