AWS Redshift ha experimentado una fuerte evolución durante los últimos años y se ha consolidado como una opción potente y flexible en el mundo de los data warehouses.

En este episodio hablamos de cómo ha ido cambiando Redshift a lo largo de los años y qué es lo que le convierte en una opción interesante frente a sus competidores.

¿Qué es AWS Redshift y qué lo diferencia de otros data warehouses?

Redshift es la solución de data warehouse en la nube de Amazon Web Services. Se distingue por tres factores clave:

¿Cuáles han sido los principales avances de Redshift en los últimos años?

La evolución de Redshift ha sido notable. Algunos de los avances más relevantes son:

En conjunto, Redshift se ha alineado con las tendencias actuales del mercado, manteniéndose competitivo y moderno.

¿Cómo ayudan Redshift Serverless y el modo “stand-by” a optimizar costes y cómo se integra Redshift con datos almacenados en S3?

La capacidad de pausar clústeres permite adaptar Redshift a casos de uso intermitentes, como cargas batch mensuales. Durante los periodos inactivos, solo se paga por almacenamiento.

Redshift Serverless, por su parte, ofrece un modelo de pago por uso, ideal para cargas de trabajo variables o impredecibles, eliminando la necesidad de gestionar infraestructura.

Desde sus inicios, Redshift se ha integrado con Amazon S3 mediante el comando “COPY”. A esto se suma ahora la funcionalidad auto-copy, que permite mantener sincronizados los datos con un bucket de forma automática y continua, detectando cambios en tiempo real en rutas específicas.

¿Cómo facilita Redshift el intercambio de datos con terceros a través de AWS Data Exchange?

AWS Data Exchange es el marketplace de datos de AWS. Permite compartir datasets públicamente o de forma privada, con un modelo de suscripción gestionado directamente por Amazon. Surgió a finales de 2019 y disponibiliza diariamente miles de productos de datos de proveedores muy diversos.

AWS se encarga de la facturación y control de acceso, generando facturas individuales para cada cliente de forma sencilla y automática, facilitando al usuario la gestión de este tipo de procedimientos más administrativos (compartición, gestión de las facturas, etc).

Por otro lado, los datasets se exponen a este mercado bajo distintas licencias, y éstas pueden ser muy granulares: acceso a nivel de schema, tabla, vistas e incluso funciones de usuario.

Como comentábamos, AWS se encarga de todo: factura, cobro e incluso de quitar acceso a los consumidores cuando caducan sus licencias. Con apoyo de Lake Formation, se puede definir de forma centralizada el acceso a una tabla incluso a nivel de fila o columna, e incluso restringir el acceso a ciertos objetos del datashare.

AWS Redshift ha evolucionado desde su lanzamiento en 2013 hasta convertirse en una plataforma madura, flexible y competitiva. La combinación de funcionalidades avanzadas, opciones de integración, mejoras en coste y enfoque Zero ETL lo consolidan como una de las mejores soluciones de data warehouse en la nube.

¿Profundizamos más sobre AWS Redshift?

Te dejamos por aquí un post, también de nuestra compañera Eloísa: AWS Redshift, un data warehouse entre los mejores

¿Dónde escuchar nuestros podcast?

Puedes escucharlos en las principales plataformas de podcast: Ivoox, Spotify, YouTube, Apple Podcast y Amazon Music.

Foto de portada: Unsplash

Cuéntanos qué te parece.

Los comentarios serán moderados. Serán visibles si aportan un argumento constructivo. Si no estás de acuerdo con algún punto, por favor, muestra tus opiniones de manera educada.

Suscríbete