
En este tutorial, analizaremos qué es un almacén de datos de Snowflake, la arquitectura de Snowflake, cómo crear una cuenta de prueba gratuita para una prueba de manejo y cómo acceder a Snowflake WebUI.
1. ¿Qué es Snowflake Data Cloud Warehouse?
Snowflake es una plataforma de almacenamiento de datos basada en la nube desarrollada sobre la nube. A partir de ahora, los proveedores de nube populares como Amazon Web Services (AWS), Microsoft Azure y Google Cloud son compatibles con Snowflake.
Sin hardware (virtual o real) o software para instalar, configurar o mantener, ya que se ejecuta completamente en una infraestructura de nube pública.los copos de nieve son reales Software como servicio producto.
El modelo de almacenamiento de datos proporcionado por Snowflake es más rápido, más fácil de configurar y más adaptable que los sistemas de almacenamiento de datos típicos.
Debido a sus características únicas, se ha convertido rápidamente en el líder en soluciones de gestión de datos de mercado analítico.
2. Arquitectura de copos de nieve
El diseño de la base de datos Snowflake es una combinación de sistemas de base de datos de disco compartido y nada compartido. Snowflake, al igual que los sistemas de disco compartido, utiliza un almacén de datos central para almacenar datos y es accesible desde todos los nodos de cómputo de la plataforma.
Snowflake realiza cálculos utilizando un clúster de computación MPP (procesamiento paralelo masivo), donde cada nodo del clúster mantiene una parte de un conjunto de datos completo localmente, similar a un sistema de nada compartido.
Este enfoque combina la conveniencia de administración de datos de un diseño de disco compartido con los beneficios de velocidad y escalamiento horizontal de una arquitectura compartida.
Hay 3 capas en la arquitectura Snowflake.
- capa de almacenamiento,
- capa de computación,
- Capa de servicios en la nube.
Analicemos cada capa en detalle.
2.1.capa de almacenamiento
Snowflake divide los datos en un número infinito de microparticiones, cada una de las cuales está optimizada y comprimida internamente. Almacena datos en forma de columnas.
Los datos se guardan en la nube y se administran mediante un enfoque de disco compartido, lo que facilita la administración de datos. En una arquitectura de nada compartido, esto garantiza que los usuarios no tengan que preocuparse por la distribución de datos entre múltiples nodos.
Para obtener datos para el procesamiento de consultas, los nodos de cómputo están vinculados a la capa de almacenamiento. Dado que los niveles de almacenamiento son independientes, solo pagamos por el almacenamiento que usamos en promedio por mes.
El almacenamiento de Snowflake es elástico porque se proporciona en la nube y se paga mensualmente en función de cada terabyte consumido.
El precio del almacenamiento lo cobra el proveedor de la nube en función de la utilización mensual del almacenamiento, lo que significa que los costos de almacenamiento se determinan utilizando la cantidad promedio de almacenamiento utilizado por mes después de la compresión.
2.2 Capa de computación
Esta capa consiste en un almacén virtual de unidades informáticas escalables.
La capa de cómputo obtiene datos de la capa de almacenamiento y los almacena en caché localmente para mejorar los resultados de consultas futuras, es decir, cada almacén virtual tiene su propio caché.
Múltiples almacenes virtuales pueden ejecutarse simultáneamente, mantener ACID y realizar múltiples procesamientos de datos simultáneos.
En Snowflake, se pueden construir múltiples almacenes virtuales de acuerdo con la carga de trabajo para satisfacer diferentes necesidades.
Estos repositorios son de naturaleza MPP (procesamiento paralelo masivo). Cada almacén virtual puede usar un nivel de almacenamiento.
El almacén virtual tiene su propio clúster de computación y no interactúa con otros almacenes virtuales, es decir, una arquitectura de nada compartido.
El precio de este almacén será dinámico, es decir, la tarifa se calculará en función de la cantidad de unidades informáticas que consuma, se calculará como créditos.
Por lo tanto, cada vez que el almacén de datos realiza un cálculo, solo se ejecuta el reloj de facturación en ese momento. A continuación se muestran las métricas de facturación para diferentes tamaños de almacenes de datos.
Tamaño del almacén virtual | créditos por hora |
X-pequeño | 1 |
pequeña | 2 |
Moderar | 4 |
Grande | 8 |
de gran tamaño | dieciséis |
2X-Grande | 32 |
3X-Grande | 64 |
4X-Grande | 128 |
5X-Grande | 256 |
6X-Grande | 512 |
Esta facturación será por segundo de uso. El cargo mínimo es de un minuto, es decir, una vez contabilizado el data warehouse, el cargo mínimo comenzará a partir de un minuto de uso. Por ejemplo, si solo lo usa durante 30 segundos, el tiempo de carga es de un minuto.
2.3 Capa de servicios en la nube
Esta capa contiene todas las operaciones coordinadas en Snowflake, como la autenticación, la seguridad, la gestión de metadatos para los datos cargados y el optimizador de consultas.
La capa de servicio proporciona interfaces de cliente SQL para operaciones de datos como DDL y DML. Este servicio en la nube también se puede extender como otras capas.
El precio de este servicio en la nube no se cobrará directamente. De forma predeterminada, algunos créditos se asignarán a los servicios en la nube, ya que estos servicios también requieren potencia informática para funcionar.
La facturación de los servicios en la nube comienza cuando el uso supera el 10 % del uso informático total por día. Por ejemplo, si el cálculo operativo usó 100 créditos y el servicio en la nube usó 15 créditos, entonces el cargo por el servicio en la nube sería 15 – (10 % de 100) = 15.
3. ¿Qué es el crédito?
Los créditos son la unidad de cargo en Snowflake. El importe de cada crédito se calculará en función de la edición y el proveedor de la nube.Puedes ver y estimar precios aquí asociación.
Puede elegir un proveedor de nube, una región y una moneda; obtendrá una tarifa estimada por crédito.
4. Crea una cuenta de copo de nieve
Copo de nieve proporciona una Prueba gratis Considere una prueba de manejo; es Valor de uso de $400Puede crear una cuenta de prueba gratuita en el siguiente enlace.
En la página de registro, ingrese sus datos básicos y haga clic en Continuar.
Seleccione la edición de Snowflake, el proveedor de la nube y la región. Asegúrese de tener marcada la casilla Acuerdo de licencia, luego haga clic en Iniciar.
Se enviará un correo electrónico de confirmación a su correo electrónico registrado.
Vaya a la bandeja de entrada de su correo electrónico, abra el correo electrónico de activación de Snowflake Support y haga clic en el enlace «Haga clic para activar». Será redirigido al nuevo donde puede establecer el nombre de usuario y la contraseña.
Establecer nombre de usuario y contraseña. Haga clic en Iniciar para continuar.
Una vez iniciado, recibirá un correo electrónico de confirmación de que su cuenta ha sido activada. Haz clic en el enlace «Iniciar sesión en Snowflake».
Ahora será redirigido a la página de inicio de sesión de Snowflake WebUI.
en conclusión
En este artículo, aprendimos sobre los conceptos y la arquitectura de Snowflake y abrimos una cuenta de prueba gratuita para POC y propósitos de prueba. También discutimos cómo acceder a WebUl de Snowflake.
Veremos cómo instalar SnowSQL, acceder a Snowflake usando SnowSQL (CLI) y conocer varias actividades de administración de bases de datos en los próximos artículos.
recurso: