Introducción a Apache Hadoop

Ponentes Marco Martínez y Alejandro González Acerca de los ponentes
Fecha 14 diciembre, 2011 18:00 - 20:00

Escuela Politécnica Superior de la Universidad CEU San Pablo

Urbanización Montepríncipe s/n
Boadilla del Monte, Madrid
91 372 40 35

Paradigma Tecnológico y Javahispano organizaron este Seminario gratuito de Introducción a Apache Hadoop el 1 de diciembre de 2011. El seminario fue impartido por Marco Martínez y Alejandro González.

Apache Hadoop es una librería open Source para procesamiento distribuido donde caracterizada principalmente por su fiabilidad y escalabilidad. La clave de Hadoop es la posibilidad de manejar grandes cantidades de datos bajo un modelo de programación simple.

A continuación se describen los contenidos impartidos en el seminario:

  1. Contenido Teórico
    • Historia. Se comentó el origen que montó la librería
    • Sistema de ficheros Hadoop Distributed File System
    • Arquitectura
    • Mecanismos de replicacion de datos
    • Robustez
    • Posibilidades de configuracion
    • Integridad de datos
    • Casos reales de uso (Empresas que lo usan y volumenes de datos)
    • Hadoop MapReduce
      • Que es MapReduce.
      • Arquitectura Hadoop MapReduce.
      • Cómo funciona y fases del MapReduce.
      • Posibilidades de configuración.
  2. Contenido Práctico
    • Creamos un cluster hadoop con la distribución de cloudera
    • Ejemplo práctico Map/Reduce.

Acerca de los ponentes

Marco Martínez es un analista programador con 3 años de experiencia en el desarrollo de software. Marco trabaja sobre todo con Java, sin dejar de lado lenguajes como Groovy y Python y la ultimas tendencias de base de datos NoSQL. Está enfocado principalmente al desarollo de buscadores utilizando Apache Solr y Apache Lucene.

Ver toda la actividad de Marco Martínez

Alejandro González es un analista programador con más de 4 años de experiencia en el desarrollo de software. Ha trabajado sobre todo con lenguajes dinámicos como Perl y Python en el ambito del NLP, Sentiment Analysis, Motores de busqueda y aplicaciónes de monitorización y seguimiento de tendencias y opiniones en redes sociales.Le atrae especialmente la adquisición y analisis automático de grandes volúmenes de información para inferir tendencias y patrones de propagación de ideas en internet, así como tecnologías de BigData, tanto de persistencia como de computación.Actualmente se encuentra en Paradigma Tecnológico trabajando en varios proyectos de Sentiment Analysis y de detección y seguimiento de movimientos en redes sociales.

Ver toda la actividad de Alejandro González