Canonical, el editor de Ubuntu, anunció hoy la disponibilidad general de Data Science Stack (DSS), una solución de ciencia de datos lista para usar que habilita entornos de aprendizaje automático en su estación de trabajo de IA. Es completamente de código abierto, de uso gratuito y nativo de Ubuntu. También se puede acceder a él en otras distribuciones de Linux, Windows usando el Subsistema de Windows Linux (WSL) y macOS usando Multipass. DSS es una herramienta basada en interfaz de línea de comandos que luego incluye Jupyter Notebooks, MLflow y marcos como PyTtorch y TensorFflow en la orquestación. Canonical proporciona mantenimiento de seguridad para todos los paquetes de software incluidos en la solución, garantizando la parcheación oportuna de las vulnerabilidades y la protección del software y los artefactos creados.
Tabla de Contenidos
Configure su entorno de aprendizaje automático con solo tres comandos
La adopción de la inteligencia artificial está generalizada, pero también lo son los desafíos para implementarla con éxito. Considere las siguientes estadísticas Deloitte:
- El 40% de las organizaciones están adoptando inteligencia artificial
- El 25% de los profesionales de la IA se ven obstaculizados por la dependencia de los paquetes de software.
- El 24% de los profesionales de la inteligencia artificial tienen dificultades para obtener recursos informáticos
En este contexto, los líderes empresariales se sienten presionados a mejorar rápidamente sus capacidades de IA y demostrar el retorno de la inversión en proyectos de IA. Reducir el tiempo necesario para configurar un entorno de aprendizaje automático es fundamental para acelerar la entrega de proyectos y la fase de exploración inicial de la inteligencia artificial dentro de la organización. Es por eso que creamos Data Science Stack (DSS).
Solo se necesitan tres comandos para configurar una pila de ciencia de datos (DSS), lo que permite una exploración inicial rápida en una estación de trabajo de IA. Los profesionales solo necesitan configurar la capa de orquestación de contenedores, instalar DSS CLI e inicializar la pila de ciencia de datos para acceder al entorno. Esto se puede hacer en 10 a 30 minutos, dependiendo del nivel de experiencia del practicante.
Chris Schnabel, gerente del ecosistema de Silicon Alliance en Canonical, explica: “Debido a que los profesionales de la IA pueden ejecutar comandos simples, esto elimina la carga de administrar cualquier dependencia de la suite o aprovisionar recursos informáticos. De forma predeterminada, DSS incluye acceso al Jupyter Notebook desarrollado, MLflow para experimentos. seguimiento y registro de modelos, y marcos de aprendizaje automático como Pytorch y Tensorflow. Sin embargo, los usuarios pueden personalizar la pila de ciencia de datos y agregar nuevas bibliotecas de acuerdo con sus propios casos de uso.
Para los profesionales, DSS ayuda a familiarizarse con las herramientas disponibles para entornos de aprendizaje automático a gran escala. DSS también proporciona una ruta de migración para ayudarlos a hacer crecer sus iniciativas de IA a medida que sus proyectos maduran.
Optimizado para funcionar en cualquier tipo de hardware
Creamos pilas de ciencia de datos que funcionan en cualquier tipo de hardware para optimizar la experiencia del usuario y permitirles obtener el mejor rendimiento en el hardware de su elección. DSS utiliza marcos de aprendizaje automático optimizados de diferentes proveedores, como PyTorch y TensorFlow, para brindar a los usuarios las opciones de distribución más populares y lograr los niveles de rendimiento más altos posibles. Intel, por su parte, impulsa la optimización del hardware en la fase inicial de estos proyectos comunitarios. Sin embargo, para obtener acceso temprano a mejoras y funciones de rendimiento (como la compatibilidad con GPU Intel) antes de llegar al nivel superior, los profesionales de la IA también pueden acceder atex y IPEXDistribuciones PyTorch y Tensorflow de Intel. IPEX e ITEX aprovechan las extensiones vectoriales avanzadas (AVX), las instrucciones de red neuronal vectorial (VNNI) y las extensiones de matriz avanzadas (AMX) para agregar un rendimiento de optimización mejorado al hardware. Al integrar estas extensiones, además de la aceleración de GPU, DSS se beneficia de la aceleración de operaciones comunes en casos de uso de IA, lo que reduce el tiempo de entrenamiento del modelo y acelera la fase experimental de los proyectos de ML.
«La pila de ciencia de datos de Canonical proporciona una base importante para que los profesionales de la inteligencia artificial mejoren rápidamente sus capacidades de aprendizaje automático y ciencia de datos», afirmó Arun Gupta, vicepresidente y director general de Intel Open Ecosystem. «Al alinearnos con PyTorch y TensorFlow, garantizamos». Los desarrolladores utilizan las herramientas más avanzadas disponibles. Nuestra colaboración a través del proyecto OPEA amplifica este impacto, simplificando el desarrollo de la IA y haciendo que la innovación sea más accesible para todos.
Las estaciones de trabajo con IA son productos estratégicos para muchos fabricantes de computadoras. Soluciones como Data Science Stack les permiten ofrecer una experiencia perfecta en cualquier dispositivo, ayudándoles a diversificar su elección de GPU sin comprometer la experiencia del usuario.
Obtenga seguridad y soporte de un único proveedor
McKinsey Según el informe, el 51% de las organizaciones que utilizan IA consideran que la ciberseguridad es el principal riesgo que deben mitigar, seguida del cumplimiento normativo (36%). Esto afecta a todos los niveles y escalas del desarrollo del aprendizaje automático, desde estaciones de trabajo de IA hasta centros de datos o dispositivos periféricos.
Cuando los científicos de datos configuran entornos de aprendizaje automático, utilizan contenedores y herramientas de código abierto de diferentes fuentes sin tener que considerar los riesgos de seguridad. Dentro de una empresa, la seguridad también puede convertirse rápidamente en una carga para los administradores de sistemas, que necesitan implementar y mantener una variedad de herramientas, que a menudo varían debido a la falta de estándares. DSS proporciona una arquitectura coherente para entornos de aprendizaje automático que se puede implementar a escala en muchas máquinas.
Ubuntu es la distribución de Linux más utilizada (Fuente: StackOverflow Informe), una gran cantidad de profesionales de IA/ML lo utilizan en sus proyectos. A medida que los líderes empresariales asignen presupuestos para proyectos de aprendizaje automático y los profesionales comiencen la exploración inicial, también comenzarán a implementar soluciones en estaciones de trabajo.
Las organizaciones pueden adquirir soporte y mantenimiento de seguridad a través de Ubuntu Pro. Las empresas pueden beneficiarse del soporte empresarial para las soluciones de ML en su entorno para que puedan resolver rápidamente los problemas de acuerdo con los SLA de Canonical.
Para obtener más información sobre el apilamiento de la ciencia de datos, vea nuestro seminario web. Proporcionaremos una descripción general de las funciones de las que puede beneficiarse y demostraremos una configuración de tres comandos.