Cinco preguntas de Big Data para Paco Nathan

Diseñar el programa de una gran conferencia como Big Data Spain es un reto tan interesante como una enorme responsabilidad colectiva. Por ejemplo, ¿expondrías a una audiencia de más de 800 expertos internacionales en Big Data a un auto-denominado “Científico Malvado y Loco” para dar la charla inaugural de un evento de dos días de duración?

Eso es exactamente lo que hice invitando a Paco Nathan a las 3ª y 4ª ediciones de la conferencia. Confieso que yo ya conocía la inmensa reputación de Paco en el sector. Además,  sus modales exquisitos y calidad humana le sitúan en las antípodas del Dr. Strangelove de Stanley Kubrick. Paco es licenciado en Matemáticas y en Computación por Stanford. Actualmente es director del equipo de O’Reilly Learning con sede en Sebastopol (California), tras más de 30 años de experiencia en Bell Labs y muchas otras empresas grandes y pequeñas que incluyen áreas como sistemas distribuidos, programación funcional e inteligencia artificial.

Preguntas sobre Big Data a Paco Nathan

Cinco preguntas acerca del Big Data

Pregunté a Paco hace unas semanas en Madrid si sus compromisos como conferenciante y sus numerosos proyectos le dejan tiempo para sentarse y programar. Me contestó que efectivamente su equipo y él están ocupados en eso precisamente. A juzgar por la acogida del taller de introducción a Apache Spark en Big Data Spain, su dominio de los lenguajes funcionales y Scala está al nivel de los desarrolladores más exigentes.

Recogemos aquí otras preguntas que le hicimos. La última es un tanto interesada: aproveché su gran experiencia para que sugiriese mejoras a Big Data Spain como conferencia internacional.

Pregunta #1: Ciencia de Datos o Analítica de Datos.

“Analítica” es un término más antiguo [que Ciencia de Datos] y que puede que sea más usado, pero que tiene un significado menos amplio. En mi opinión la palabra analítica está relacionada con organizaciones donde los dirigentes estaban familiarizados con conceptos como “modelización de datos”, “inteligencia de negocio”, “almacenamiento de datos”, etc., términos dominantes alrededor de los años 90.

Intentar competir hoy en mercados globales, donde las empresas dentro de la generación de Uber y Salesforce tienen una gran potencia y flexibilidad, implica prácticas mucho más actualizadas. Además la Ciencia de Datos implica evitar los silos, tanto en términos de gestión de datos como de mentalidad.

Pregunta #2: Los especialistas en marketing tienen, como los pescadores, la reputación de exagerar a menudo. ¿Nos puedes dar un ejemplo de un caso real de flujo de datos “masivos” cuya gestión y análisis podría beneficiarse de las tecnologías punta de Big Data?

Genómica, neurología, investigación del cáncer, bioinformática y biología en general. Estamos viendo grandes avances en genómica, debido a que generan datos a una altísima velocidad y las tecnologías Big Data son efectivas y económicas para su uso en investigación.

Echa un vistazo a las charlas de Timothy Danford. CodeNeuro y el trabajo del laboratorio de Jeremy Freeman en el campo de la neurociencia es otro ejemplo de cuán enormes son las tasas de datos en las ciencias humanas y la cantidad de trabajo importante que se puede lograr usando tecnologías Big Data, lo que hasta hace poco tiempo simplemente no era viable.

Pregunta #3: Explica lo que es un ‘quasi-truismo‘ acerca de los datos y danos un ejemplo que te guste especialmente.

La pregunta me recuerda a una charla que di este verano en el campus de Galvanize (Seattle) :-) En esa ocasión intenté orientar a los estudiantes de Ciencia de Datos hablando acerca de importantes, pero no siempre intuitivas, tendencias actuales en el sector. En concreto, quería evitar hacer distinciones demasiado estrictas, ya que algunas de esas tendencias representan matices muy sutiles. Eso es algo crucial para los que acaban de entrar en este campo.

El “code-inceptionism” es el que más me gusta [“incepcionismo” es una técnica de detección y clasificación de imágenes por redes neuronales]. La Ciencia de Datos da contexto y enriquece la investigación y la predicción echando mano de múltiples disciplinas científicas e incluso artísticas muy dispares. Sin embargo las universidades fomentan el “des-contextualizar” las materias separándolas en disciplinas estancas. La Ciencia de Datos es una ciencia aplicada, un complemento para otros fundamentos universitarios.

El de “las curvas de aprendizaje son para siempre” es el que más me interesa de los quasi-truismos que propuse. La Ciencia de Datos puede contribuir a entender y quizás resolver problemas sociales importantes a gran escala.

Pregunta #4: ¿Como consigues ayudar tanto a empresas como a start-ups? ¿El tamaño de una organización o empresa es importante para que Big Data sea una fuerza disruptiva?

Es una pregunta que lleva tiempo preocupándome: las empresas y las start-ups son dos entidades que parecen en conflicto. Sin embargo, recientemente he sigo testigo de cómo un investigador de neurociencia con un solo microscopio en tan solo unos días de experimentación puede generar más datos que todo un gran banco en el mismo periodo. Por lo tanto, dentro del contexto de los datos, la línea que divide a las grandes y pequeñas compañías parece no ser tan nítida.

La fuerza disruptiva tiene más que ver con el proceso de cambio dentro de una organización, lo que cambia es el acceso a la combinación de datos. Antes la información estaba en silos poco o nada conectados. Hoy lo que cambia es la forma de pensar acerca de cómo aprovechar esos datos. El tamaño total del mercado disponible (del “negocio”) es quizás la otra pregunta más importante que podemos hacernos ahora mismo.

Pregunta #5: Big Data Spain ha coincididio este año en Madrid con el CphI Worlwide, un congreso farmacéutico de gran magnitud. La audiencia de decenas de miles de asistentes al CphI deja pequeña la de los más de 800 asistentes provenientes de cientos de compañias y los 50 ponentes que han asistido de todo el mundo. ¿Como puede Big Data Spain convertirse en el evento anual más relevante en Europa, si no el más grande?

Big Data Spain cuenta con unas ventajas excelentes que escalan muy bien. En primer lugar, la ubicación del evento: ¡en España! Muchos de los ponentes europeos que conozco prefieren visitar España antes que asistir a otras conferencias que tienden a estar en el Norte de Europa ¿Y quién no? :-) Siempre me alegro de poder venir a España.

Otro aspecto es el idioma. El contenido bilingüe en español e inglés llega muy lejos. Podría ser una buena idea pagar traducciones de las charlas y presentaciones en ambos idiomas.

Un punto interesante que he notado tras haber participado en conferencias en España e Hispanoamérica es la velocidad con la que se difunde el contenido a través de las redes sociales. Países latinos en Europa –España, Portugal, Italia, quizás Francia– comparten más que el lenguaje con América: Hay una cultura en común, los lazos de amigos y familia, muchas compañías trabajando a ambos lados del Atlántico, intercambios entre universidades, etc. Todo esto puede ayudar al liderazgo de un Big Data localizado en España, estableciéndose como punto focal a través de América Latina y así ganar ponentes, patrocinadores, etc. El acceso a contenidos de calidad en español ahora se extiende hasta gran parte de Estados Unidos. ¡Hay que aprovechar esa ventaja!

El precio es una tercera consideración. Según vaya creciendo la conferencia, también lo harán los patrocinadores, por lo que es de esperar que el precio de la asistencia se mantenga tan asequible como hasta ahora. El apoyo a estudiantes también sería una buena medida a tomar. En algunas conferencias de Estados Unidos, vemos empresas que celebran concursos para estudiantes de posgrado ofreciendo becas para asistir a eventos que se celebran en el extranjero. Eso sirve tanto a estudiantes como a inversores, aumentando la riqueza de la propia conferencia. También ayudaría a reforzar la presencia de España como destino para un público más global.

También estaría bien considerar añadir streaming a la conferencia, para que aquellos que no puedan asistir en persona puedan participar desde sitios remotos. Esto suele ser muy efectivo por ejemplo en el Cassandra Summit, donde el streaming casi dobla la audiencia total del evento. Y otra vez, esto ayuda a aumentar el alcance para ponentes y patrocinadores, a la vez que se consigue aumentar la audiencia.

MBA con experiencia profesional de más de 14 años en París y Londres, hoy es parte de Paradigma en las áreas de marketing digital y analítica. Rubén tiene la fortuna de ser Curator y responsable de la conferencia Big Data Spain, uno de los eventos más importantes de Europa acerca de Analítica, Cloud, IoT y Machine Learning.

Ver toda la actividad de Rubén Martínez

Recibe más artículos como este

Recibirás un email por cada nuevo artículo.. Acepto los términos legales

Escribe un comentario