Tutoriales

Introducción a Snowflake Data Warehouse

En este tutorial, analizaremos qué es un almacén de datos de Snowflake, la arquitectura de Snowflake, cómo crear una cuenta de prueba gratuita para una prueba de manejo y cómo acceder a Snowflake WebUI.

1. ¿Qué es Snowflake Data Cloud Warehouse?

Snowflake es una plataforma de almacenamiento de datos basada en la nube desarrollada sobre la nube. A partir de ahora, los proveedores de nube populares como Amazon Web Services (AWS), Microsoft Azure y Google Cloud son compatibles con Snowflake.

Sin hardware (virtual o real) o software para instalar, configurar o mantener, ya que se ejecuta completamente en una infraestructura de nube pública.los copos de nieve son reales Software como servicio producto.

El modelo de almacenamiento de datos proporcionado por Snowflake es más rápido, más fácil de configurar y más adaptable que los sistemas de almacenamiento de datos típicos.

Debido a sus características únicas, se ha convertido rápidamente en el líder en soluciones de gestión de datos de mercado analítico.

Copo de nieve – Almacén de datos

2. Arquitectura de copos de nieve

El diseño de la base de datos Snowflake es una combinación de sistemas de base de datos de disco compartido y nada compartido. Snowflake, al igual que los sistemas de disco compartido, utiliza un almacén de datos central para almacenar datos y es accesible desde todos los nodos de cómputo de la plataforma.

Snowflake realiza cálculos utilizando un clúster de computación MPP (procesamiento paralelo masivo), donde cada nodo del clúster mantiene una parte de un conjunto de datos completo localmente, similar a un sistema de nada compartido.

Este enfoque combina la conveniencia de administración de datos de un diseño de disco compartido con los beneficios de velocidad y escalamiento horizontal de una arquitectura compartida.

Arquitectura de copo de nieve
Arquitectura de copo de nieve

Hay 3 capas en la arquitectura Snowflake.

  1. capa de almacenamiento,
  2. capa de computación,
  3. Capa de servicios en la nube.

Analicemos cada capa en detalle.

2.1.capa de almacenamiento

Snowflake divide los datos en un número infinito de microparticiones, cada una de las cuales está optimizada y comprimida internamente. Almacena datos en forma de columnas.

Los datos se guardan en la nube y se administran mediante un enfoque de disco compartido, lo que facilita la administración de datos. En una arquitectura de nada compartido, esto garantiza que los usuarios no tengan que preocuparse por la distribución de datos entre múltiples nodos.

Para obtener datos para el procesamiento de consultas, los nodos de cómputo están vinculados a la capa de almacenamiento. Dado que los niveles de almacenamiento son independientes, solo pagamos por el almacenamiento que usamos en promedio por mes.

El almacenamiento de Snowflake es elástico porque se proporciona en la nube y se paga mensualmente en función de cada terabyte consumido.

El precio del almacenamiento lo cobra el proveedor de la nube en función de la utilización mensual del almacenamiento, lo que significa que los costos de almacenamiento se determinan utilizando la cantidad promedio de almacenamiento utilizado por mes después de la compresión.

2.2 Capa de computación

Esta capa consiste en un almacén virtual de unidades informáticas escalables.

La capa de cómputo obtiene datos de la capa de almacenamiento y los almacena en caché localmente para mejorar los resultados de consultas futuras, es decir, cada almacén virtual tiene su propio caché.

Múltiples almacenes virtuales pueden ejecutarse simultáneamente, mantener ACID y realizar múltiples procesamientos de datos simultáneos.
En Snowflake, se pueden construir múltiples almacenes virtuales de acuerdo con la carga de trabajo para satisfacer diferentes necesidades.

Estos repositorios son de naturaleza MPP (procesamiento paralelo masivo). Cada almacén virtual puede usar un nivel de almacenamiento.

El almacén virtual tiene su propio clúster de computación y no interactúa con otros almacenes virtuales, es decir, una arquitectura de nada compartido.

El precio de este almacén será dinámico, es decir, la tarifa se calculará en función de la cantidad de unidades informáticas que consuma, se calculará como créditos.

Por lo tanto, cada vez que el almacén de datos realiza un cálculo, solo se ejecuta el reloj de facturación en ese momento. A continuación se muestran las métricas de facturación para diferentes tamaños de almacenes de datos.

Tamaño del almacén virtualcréditos por hora
X-pequeño1
pequeña2
Moderar4
Grande8
de gran tamañodieciséis
2X-Grande32
3X-Grande64
4X-Grande128
5X-Grande256
6X-Grande512
Almacenamiento de datos – Créditos

Esta facturación será por segundo de uso. El cargo mínimo es de un minuto, es decir, una vez contabilizado el data warehouse, el cargo mínimo comenzará a partir de un minuto de uso. Por ejemplo, si solo lo usa durante 30 segundos, el tiempo de carga es de un minuto.

2.3 Capa de servicios en la nube

Esta capa contiene todas las operaciones coordinadas en Snowflake, como la autenticación, la seguridad, la gestión de metadatos para los datos cargados y el optimizador de consultas.

La capa de servicio proporciona interfaces de cliente SQL para operaciones de datos como DDL y DML. Este servicio en la nube también se puede extender como otras capas.

El precio de este servicio en la nube no se cobrará directamente. De forma predeterminada, algunos créditos se asignarán a los servicios en la nube, ya que estos servicios también requieren potencia informática para funcionar.

La facturación de los servicios en la nube comienza cuando el uso supera el 10 % del uso informático total por día. Por ejemplo, si el cálculo operativo usó 100 créditos y el servicio en la nube usó 15 créditos, entonces el cargo por el servicio en la nube sería 15 – (10 % de 100) = 15.

3. ¿Qué es el crédito?

Los créditos son la unidad de cargo en Snowflake. El importe de cada crédito se calculará en función de la edición y el proveedor de la nube.Puedes ver y estimar precios aquí asociación.

Puede elegir un proveedor de nube, una región y una moneda; obtendrá una tarifa estimada por crédito.

Precios de copos de nieve
Precios de copos de nieve

4. Crea una cuenta de copo de nieve

Copo de nieve proporciona una Prueba gratis Considere una prueba de manejo; es Valor de uso de $400Puede crear una cuenta de prueba gratuita en el siguiente enlace.

En la página de registro, ingrese sus datos básicos y haga clic en Continuar.

Página de registro de copo de nieve
Página de registro de copo de nieve

Seleccione la edición de Snowflake, el proveedor de la nube y la región. Asegúrese de tener marcada la casilla Acuerdo de licencia, luego haga clic en Iniciar.

Elija Snowflake Edition y Cloud Provider
Elija Snowflake Edition y Cloud Provider

Se enviará un correo electrónico de confirmación a su correo electrónico registrado.

Registro de copo de nieve completado
Registro de copo de nieve completado

Vaya a la bandeja de entrada de su correo electrónico, abra el correo electrónico de activación de Snowflake Support y haga clic en el enlace «Haga clic para activar». Será redirigido al nuevo donde puede establecer el nombre de usuario y la contraseña.

Correo electrónico de activación de copo de nieve
Correo electrónico de activación de copo de nieve

Establecer nombre de usuario y contraseña. Haga clic en Iniciar para continuar.

Configurar una cuenta de copo de nieve
Configurar una cuenta de copo de nieve

Una vez iniciado, recibirá un correo electrónico de confirmación de que su cuenta ha sido activada. Haz clic en el enlace «Iniciar sesión en Snowflake».

Correo electrónico de confirmación de la cuenta de Snowflake
Correo electrónico de confirmación de la cuenta de Snowflake

Ahora será redirigido a la página de inicio de sesión de Snowflake WebUI.

Interfaz web de copo de nieve
Interfaz web de copo de nieve

en conclusión

En este artículo, aprendimos sobre los conceptos y la arquitectura de Snowflake y abrimos una cuenta de prueba gratuita para POC y propósitos de prueba. También discutimos cómo acceder a WebUl de Snowflake.

Veremos cómo instalar SnowSQL, acceder a Snowflake usando SnowSQL (CLI) y conocer varias actividades de administración de bases de datos en los próximos artículos.

recurso:

LEER  Cómo redirigir la salida del comando de shell

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba