Autor

Roberto Maestre desarrolla su trabajo, junto con sus compañeros de Paradigma Labs, en los campos de Procesado de lenguaje natural, análisis de redes, rastreo de información y web semántica. Estudió Informática en la UPM, y actualmente se encuentra realizando su doctorado en el campo de los modelos algebraicos para la construcción de sistemas expertos y de razonamiento automático en el DIA FI-UPM. Anteriormente trabajó en el CSIC en el proyecto TECT de la ESF relacionado con el estudio de redes dinámicas de cooperación. Siempre dispuesto a probar una nueva tecnología o poner a prueba una teoría.

Ponente en

Twitter Dynamics. Procesado y visualización

  • 19 de enero del 2012
  • Ponentes Roberto Maestre y Francisco Javier Alba
  • Escuela Politécnica Superior de la Universidad CEU San Pablo

Paradigma Tecnológico y Javahispano organizaron este Seminario gratuito Twitter Dynamics, Adquisición, procesado y visualización de datos, el 19 de enero de ... sigue leyendo

Redactor en

NETMOB 2013, MIT: ¡Paradigma estuvo allí !

Los días 1, 2 y 3 de Mayo tuvo lugar la 3ª conferencia internacional sobre el análisis y procesamiento de trazas de comunicaciones móviles, NETMOB 2013. Decenas de grupos de I+D+i de todo el mundo, vinculados tanto al ámbito académico como al empresarial, expusieron los últimos logros y avances en este campo tan excitante, que está cobrando más importancia cada día por su inmenso potencial y por las muy diversas e innumerables aplicaciones donde se está utilizando. Y es que, según el MIT’s Technology Review, “reality mining on mobile communications is one of ’10 Emerging Technologies That Will Change the World’”.

Precisamente fue en el MIT (Boston), la universidad de ciencia y tecnología más puntera del mundo (por algo ha dado 78 premios Nobel), el inmejorable escenario donde tuvo lugar este gran evento.

Resultado de imagen de mit boston

sigue leyendo…

Paradigma en el desafío de Orange D4D en el MIT

El trabajo titulado “D4D Challenge, Commuting Dynamics 4 Change” fue realizado por un equipo de, entre otros, ingenieros e investigadores de Paradigma Labs, del laboratorio de SIG-CSIC y de la Universidad Complutense (UCM). Los autores son R. Maestre, R. Lario, M. Muñoz, R. Abad, J. González y A. Martín de Paradigma, Esther Pérez Asensio del CSIC y José Luis Fernández-Pacheco de la UCM.

El trabajo conjunto ha sido seleccionado entre más de 250 proyectos de equipos internacionales para la competición final del desafío lanzado por Orange D4D. La selección se anuncia en la NetMob2013 del 1, 2 y 3 de mayo en el Massachusetts Institute of Technology (MIoptando por lo tanto a uno de los cuatro premios propuestos (Best Overal, Best Scientific, Best Development Insight and Best Visualisation).

Resultado de imagen de Orange D4D

sigue leyendo…

15 Octubre 2011: Revolución Global en Twitter

#15oct y #ows

El 15 de octubre de 2011 fue un día histórico a nivel mundial: Millones de personas alrededor del globo se echaron a la calle para protestar contra la crisis financiera, movilizados en gran parte a través de las redes sociales, y en concreto, Twitter. El movimiento, marcado con hashtags como #15o,#15oct, estuvo fuertemente basado en las reivindicaciones #15m y #ows (“Occupy Wall Street”), recalcando que el 99% de la gente NO es responsable de los juegos financieros que hacen que el 1% restante se enriquezca a su costa (#weare99)

Proceso

Presentamos la evolución en el tiempo de la actividad en Twitter relacionada con estos movimientos alrededor del 15-O. Con un conjunto de partida de 1,2 millones de tweets, capturados desde el 13 de octubre hasta el 18 de octubre de 2011, hemos trabajado para ofrecer visualizaciones globales geolocalizadas, locales (donde se pueden observar los avances de la marcha en cuatro ciudades: Nueva York, San Francisco, Barcelona y Madrid) y, por último, cómo evolucionaron los hashtags (en volumen y composición) en ese intervalo de tiempo.
sigue leyendo…

Generales 20N: Candidatos y Clima Emocional

Análisis de Climas Emocionales

Hace mucho tiempo que trabajamos en lo que se conoce como ‘sentiment analysis’ o el análisis de la actitud del ‘emisor’ de un texto/opinión (positiva o negativa), bien sea en general, o respecto a una entidad (compañía, persona, producto, etc..). La minería emocional o ‘mood analysis’ pretende ir un paso más allá en el análisis emocional de un usuario, tratando de encontrar las emociones que provocan en él determinadas situaciones.

En los vídeos que se incluyen, se dibuja la evolución en el tiempo del ‘clima emocional’ que ha rodeado a los candidatos Mariano Rajoy y Alfredo Pérez Rubalcaba en Twitter, es decir: qué emociones subyacen en los usuarios cuando ‘tweetean’ sobre cada uno de los dos candidatos. Los estados emocionales incluidos en el motor de análisis son los siguientes: Sorpresa,Indignacion, Decepcion, Enfado, Miedo, Alegria y Esperanza
sigue leyendo…

Generales 20N: Candidatos y Áreas Temáticas

Áreas Temáticas

El objetivo de las visualizaciones de candidatos por áreas en Twitter es detectar de qué temáticas de su Programa Electoral (o bien de áreas que puedan formar parte de las preocupaciones del ciudadano) se habla en mayor o menor medida en Twitter cuando un tweet se refiere a un candidato. Cada Área (Terrorismo, Inmigración, Medio Ambiente, Sanidad, Economia, Educacion, Trabajo/Paro, Medio Ambiente, Vivienda) está compuesta a su vez por pequeñas subáreas, y la visualización de ambas nos permite hacernos una idea del ‘panorama ideológico’ percibido por los usuarios de Twitter respecto a cada uno de los candidatos.

En los siguiente vídeos disponemos de una animación temporal desde el 11 de noviembre hasta el cierre de la jornada electoral para los candidatos Mariano Rajoy y Alfredo Pérez Rubalcaba.

sigue leyendo…

A D4D Data Visualization

Orange Data for Development is an open data challenge, encouraging research teams around the world to use four datasets of anonymous call patterns of Orange’s Ivory Coast subsidiary, to help address society development questions in novel ways. The data sets are based on anonymized Call Detail Records extracted from Orange’s customer base, covering the months of December 2011 to April 2012.

D4D Viz Approach

sigue leyendo…

D4D Challenge completed!!

As we explained in a previous post, during the last months we have been working on a project for the Orange D4D Challenge. Our main task has been analyzing and visualizing the provided mobile communication datasets (collected in Ivory Coast from December, 2011 to April, 2012) looking for relevant and original findings for the society of this West-African country, that is, showing deductions in an easy and friendly way which helps government and NGOs to perform more accurate and correct decisions.

header-d4d_full-width

sigue leyendo…

Is Big Data an opportunity to spot outliers in a time-constrained world?

An outlier or black swan (Black swan theory, 2012) is a strange value, it is difficult to detect when is going to befall.

The black swan theory or theory of black swan events is a metaphor that describes an event that is a surprise (to the observer),it has a major impact, and after the fact is often inappropriately rationalized with the benefit of hindsight. For instance (Taleb, 2007), the 11-S attack was a kind of an outlier, theoretically nobody could foresee this event: it was the first of its kind, and it had a major impact in the whole world.

There is a huge discussion on the matter is wheter you should or should not apply this technology to your business. If your business is related with human behaviour and its dynamics, pattern discover or complex dynamic systems we believe that the answers could be “yes”, the whole information is essential: outliers are intrinsically inside.

sigue leyendo…

D4D Challenge accepted!

We are glad to announce that a multidisciplinary team formed by engineers and scientifics of Paradigma Labs and Spanish National Research Council will take part into Orange "Data for Development" D4D Challenge. Orange challenge Orange “Data for Development” - D4D - is an open data challenge, encouraging research teams around the world to use four datasets of anonymous call patterns of Orange's Ivory Coast subsidiary, to help address society development questions in novel ways. The d...

Throughput analysis with Continuous-time Markov Chains simulations and design of realiable cloud services system based on Gunicorn, Tornado and Iptables

At this moment a lot of companies offer end-point services (data providers, semantic analysis, ...) that we can integrate with our applications. However, when designing our own service, it could be tough find the ideal parameters to configure it and to find the best software to make it scalable and highly available. Continuous-Time Markov Chains (Yin, G. et all, 1998) (CTMC) provides an ideal framework to estimate this most important parameters, and by means of simulations we can find them....

Openinfluence

Openinfluence is an open-metric developed at Paradigmalabs and tries to define the relevance of each user in Twitter. It is open because you can see the formula and contribute to improve it. You can see the formula in the picture below: As you can see, the formula has two main components "Popularity" and "Influence". Popularity is related to static properties of your social network. It's some kind of "potential influence", the beforehand capability of getting your tweets spread.Influence is...

Retweet Monitor plugin for Gephi

With this Plugin for Gephi, ParadigmaLabs wants to provide the community with an useful tool to analyze Twitter information. We have encapsulated all the complexity behind a simple button. A retweet is one of the main actions for information propagation, and now you can make your own analysis in real time by means of Gephi and the Retweet Monitor plugin.

It´s internal mechanisms are fairly simple. The software will connect to the TwitterStream, then apply(if desired) a content filter. All the information gathered will be displayed by Gephi, and you can then apply the standard algorithms and layouts in order to create a representative visualization.

sigue leyendo…

15th October on Twitter: Global Revolution ‘Mapped’

#15oct and #ows

15th October 2011 was a world-level milestone day: Millions of people aroud the globe occupied the streets to protest against global financial crisis, influenced in a great measure by the power of social networks, essentially Twitter. The protest movement, tagged as #15o and #15oct was heavily based upon #15m (Spain) and #ows (“Occupy Wall Street”), social movements around the notion that 99% of the people is NOT responsible of the ‘financial games’ played by a minor 1% that get rich in the process of sucking their wealth from the remaining 99% (#weare99)

The Process

We present evolution through time of related Twitter activity, around 15th October 2011. Taking a Dataset of 1.2 million tweets (ranging from 13th October to 18th October), we worked to offer some global (geolocated) visualizations, local visualizations (centered around New York, San Francisco, Barcelona and Madrid) and, lastly, a visualization about how did the associated hashtags evolved in that time frame.
sigue leyendo…

Information Propagation in Twitter’s Network

It’s well-known that Twitter’s most powerful use is as tool for real-time journalism. Trying to understand its social connections and outstanding capacity to propagate information, we have developed a mathematical model to identify the evolution of a single tweet.

The way a tweet is spread through the network is closely related with Twitter’s retweet functionality, but retweet information is fairly incomplete due to the fight for earning credit/users by means of being the original source/author. We have taken into consideration this behavior and our approach uses text similarity measures as complement of retweet information. In addition, #hashtags and urls are included in the process since they have an important role in Twitter’s information propagation. sigue leyendo…

Twitter Network Viz: March 2011 iPad 2 launch

In this video, we present the network evolution around March iPad 2 launch conversation.

Data was collected using twitter real-time API, on March 2nd, 2011,  totalling around 50k tweets+retweets

After that, we used Gephi Streaming feature in tandem with its Force Atlas Layout, et voilà, Gephi instant gratification!

sigue leyendo…