Esta es la época del año en la que comenzamos a mirar hacia el futuro y pensar en las tendencias continuas en nuestras diversas industrias. Una cosa es segura en la industria del almacenamiento: la demanda de capacidad sigue siendo alta y la industria observa un crecimiento exponencial continuo.
Tabla de Contenidos
Crecer, crecer, crecer
Cada día se crean más y más datos. Es verdaderamente ininterrumpido. Solo en 2021, se predice que la capacidad de los proveedores de almacenamiento empresarial se acercará a los 150 exabytes, ¡y se espera que este número aumente nuevamente en 2022!
Ahora vemos que los discos duros de 20 TB en el mercado pueden ayudar a satisfacer estas necesidades, pero debemos estar atentos al crear clústeres de almacenamiento, porque la velocidad de acceso de estos discos duros no ha cambiado realmente en los últimos años. En un escenario de falla, debemos volver a crear una copia de los datos o fragmentos de código de borrado, y puede llevar muchas horas usar una unidad de tan alta capacidad.
Por lo tanto, la regla general sigue siendo la misma: una gran cantidad de unidades más pequeñas puede conducir a un sistema más predecible para cualquier capacidad. Por supuesto, debe seguir siendo pragmático para equilibrar los requisitos de capacidad y el costo de aumentar el número de husillos.
Memoria flash, más densa y rápida.
En los últimos años, hemos sido testigos de un gran salto en la memoria flash orientada a la capacidad. Intel presentó recientemente una unidad NAND 3D QLC de 30 TB, superando incluso la unidad rotativa tradicional más grande. Aunque no recomendamos usarlos para cargas de trabajo de escritura muy grandes, ciertamente tienen un lugar en el sistema de almacenamiento y pueden aumentar el rendimiento además de la configuración tradicional basada en ejes. Además, existen ventajas en el uso de la electricidad, que se vuelve cada vez más importante en los clusters a gran escala a medida que la escala se expande, ¡incluso en el borde donde el presupuesto de electricidad puede ser muy limitado!
Almacenamiento informático
Un área interesante y novedosa de la tecnología de disco duro es el concepto de almacenamiento informático, que agrega más inteligencia a los discos duros y SSD que usamos en servidores y clústeres de almacenamiento.
Hemos visto trabajo en esta área antes, pero los casos de uso son casi demasiado estrechos. Seagate creó un disco duro llamado Kinetic, que expone una interfaz de almacenamiento de objetos de clave / valor a través de Ethernet en lugar de la interfaz de bloque SAS o SATA habitual. Esto es interesante para aquellos de nosotros que estamos construyendo almacenamiento de objetos a mayor escala. Esto significa que agregar cada disco duro al clúster también aumentará la cantidad de recursos informáticos adicionales, formando así un océano de informática y almacenamiento altamente escalable. Además, reduce significativamente el dominio de falla a un solo disco en lugar de un servidor completo que contiene varios discos. Sin embargo, este concepto no recibió mucha atención porque requería cambios importantes en el software utilizado para construir clústeres de almacenamiento. En lo que respecta a Ceph, no hay suficientes recursos en cada unidad para ejecutar todo el OSD.
Avance rápido hasta 2021, y vemos que algunas empresas más pequeñas comienzan a proporcionar productos que mantienen las interfaces típicas SAS y SATA, pero también brindan opciones de eficiencia de capacidad, como compresión o cifrado, unidades, sin ningún poder de procesamiento de host o cambios en el servidor para ejecutar software.
Esto es muy similar a lo que hemos visto en el campo de Ethernet, donde algunas tareas se descargan en tarjetas de red inteligentes. Al utilizar algunos dispositivos de almacenamiento con capacidad informática, ya es posible acceder a los recursos informáticos de estas unidades y utilizarlos para preprocesar conjuntos de datos. Cuando tiene un sistema de almacenamiento con miles de unidades, esto se convierte en una gran cantidad de potencia informática adicional que puede usar.
Repatriación de datos-despilfarro después de la pandemia
En los últimos dos años, todos hemos visto cambios tremendos en la forma en que trabajamos. Para respaldar esto, muchas empresas han recurrido a las nubes públicas para ayudarlas a expandir inmediatamente sus operaciones y mantener su negocio como de costumbre. La optimización de costos es en gran medida una consideración secundaria.
Sin embargo, a medida que las empresas se adaptan a estos nuevos métodos operativos, ahora estamos viendo un enfoque renovado en la optimización de costos y la eficiencia. El almacenamiento sigue siendo la infraestructura más inadecuada para la computación en la nube, porque el uso suele ser estático o en continua expansión, y no hay posibles picos y valles en la computación.
Cada vez más empresas son conscientes del costo de almacenar datos en la nube y están considerando soluciones cercanas a la nube en las que ejecutan su propio hardware en una instalación de alojamiento adyacente a la instalación del principal proveedor de nube y los conectan a través de una interconexión privada. Esto no solo reduce los costos de inmediato, sino que también significa que no habrá penalizaciones al migrar a otros proveedores de la nube en el futuro.
envolver
¡Les deseamos a todos unas felices vacaciones y un próspero año nuevo!
Las soluciones de almacenamiento de código abierto como Ceph pueden ayudar fácilmente a resolver los desafíos de crecimiento y expansión que enfrenta toda la industria. Obtenga más información sobre cómo implementar Ceph en nuestro reciente seminario web.