Dado que Intel no planea tener una CPU de escritorio con capacidades de IA hasta finales de este año, los fabricantes de PC están recurriendo a nuevas empresas de chips, y el Lenovo ThinkCentre Neo Ultra puede mostrar el camino, potencialmente con tarjetas de IA de MemryX y Kinara en su interior.
Lenovo lanzará la PC ThinkCentre Neo Ultra en junio por alrededor de $ 1,000, dijo el gerente de producto Bryan Lin desde el stand de Lenovo en CES 2024. Si bien la documentación de Lenovo no enumera oficialmente ninguno de los procesadores de IA, es probable que se incluyan. La pequeña computadora de escritorio de creación de contenido estuvo en CES mostrando ambas tarjetas de IA.
Si bien AMD, Intel y Qualcomm han mostrado procesadores móviles con NPU AI integradas, solo AMD ha anunciado un procesador Ryzen de escritorio con una APU en su interior. Intel, que posee la participación dominante en la industria de procesadores de PC, tendrá que esperar hasta el lanzamiento del lago Arrow para poner una NPU a disposición de los fabricantes de PC de escritorio.
Mientras tanto, cada vez más fabricantes de PC se están dando cuenta de que en realidad se puede construir una “PC con IA” con solo una CPU y una GPU, mientras que las NPU proporcionan una IA con mayor eficiencia energética. Si usted es un fabricante de PC de escritorio y normalmente tiene menos preocupaciones sobre el consumo de energía, eso puede ser suficiente. Pero las empresas que quieren aplicar la IA para ganar dinero, la quieren ahora, y les importa minimizar el consumo de energía a escala. Al menos en esto, el mercado empresarial puede adelantarse a las PC de consumo.
Mark Hachman/IDG
«Lo que estamos viendo ahora es que la tarjeta gráfica discreta tiene demasiada hambre en términos de factor de forma y potencia, diseño térmico, etcétera», dijo Lin. «Por lo tanto, una tarjeta NPU que consuma entre 5 y 10 vatios puede brindarnos un cierto nivel de capacidades de IA».
Pero ¿qué pasará cuando se estrene Arrow Lake?
«Con Arrow Lake lo que estoy entendiendo es que todavía es muy limitado [in terms of] poder”, dijo Lin. “Entonces, al menos dentro de 18 a 24 meses, creo que [AI accelerators] seguirá siendo parte de ello. Y especialmente para computadoras de escritorio, donde no tenemos la limitación de la batería”.
Mark Hachman/IDG
El ThinkCentre Neo Ultra incluirá hasta un procesador Intel Core i9 vPro de una arquitectura no revelada, con hasta 64 GB de memoria DDR5-5200. También incluirá una GPU Nvidia GeForce RTX 4060 de clase creadora, hasta 4 TB de almacenamiento SSD y una fuente de alimentación interna de 350 W. Es un chasis de 3,6 litros y mide 7,67 x 7,67 x 4,21 pulgadas.
Lenovo tiene lo que llama un motor de inteligencia artificial, que dirige las cargas de trabajo a donde más le convenga, dijo Lin.
Mark Hachman/IDG
Lin dijo que hay varias nuevas empresas de chips de IA con las que la compañía está trabajando, incluidas MemryX y Kinara, las dos compañías de chips de IA que se exhiben en el stand.
Conozca MemryX, uno de los primeros aceleradores de IA
MemryX fabrica el acelerador MX3 Edge AI. El kit de desarrollo de software de la compañía, y lo que Lenovo muestra dentro del ThinkCentre, se compone de cuatro chips MX3 montados en una tarjeta PCI Express M.2 (Gen3, algo sorprendente), aunque también puede ejecutarse dentro de una tarjeta USB 3.2. .
MemryX califica cada MX3 como capaz de realizar 10 TFLOP (billones de operaciones de punto flotante) en lugar de los TOPS más convencionales. Esto se debe a que el MX3 utiliza por defecto operaciones de punto flotante de 16 bits y pesos de 8 bits, en lugar de operaciones de números enteros que son una métrica más común, según Roger Peene, vicepresidente de desarrollo de productos y negocios de MemryX.
«Cuando exista la oportunidad de utilizar soluciones discretas, todo el mundo las utilizará hasta que Intel o AMD las integren», afirmó Peene. “Así que todo el mundo sabe que Intel está detrás… han intensificado su marketing. Claramente no están contentos de que Lenovo elija una startup para ejecutar IA en una PC. Así que esa es la historia”.
Mark Hachman/IDG
Cada MX3 consume de 1 a 2 vatios en promedio, dijo Peene. Los chips son compatibles con Linux, Android y Windows, así como con los marcos TensorFlow, TensorFlow-lite, PyTorch, ONNX y Keras.
Cada chip puede ejecutar un modelo con 10 millones de parámetros de 8 bits, escalados según sea necesario. Fuera de la caja, el MX3 puede ejecutar YOLO v7 tiny a 416×416, 375 fps (x2) sin poda ni entrenamiento, o SSDMobileNet (224×224) a 1403 fps.
No hemos tenido la oportunidad de hablar con Kinara, aunque la empresa lanzado su procesador Ara-2 Edge AI el otoño pasado. «Como ejemplo de sus capacidades para procesar modelos de IA generativa, Ara-2 puede alcanzar 10 segundos por imagen para Difusión estable y decenas de tokens/segundo para LLaMA-7B», dijo la compañía en un comunicado de prensa.
Mark Hachman/IDG
Tanto el chip MemryX como el Kinara AI se están posicionando en primer lugar como AI para el reconocimiento de imágenes, y una demostración de MemryX muestra cómo podría reconocer si los trabajadores de la construcción se habían puesto el equipo de protección adecuado. Aún así, la IA se puede utilizar para todo tipo de propósitos: juegos, avatares, modelos/chatbots en el idioma local y más.
Sin embargo, lo que es más importante es que empresas como Nvidia, Rendition, 3Dfx y otras se lanzaron hace años como aceleradores 3D y ahora, después de que algunas se quedaron en el camino, dominan la industria de la creación de contenidos y los juegos. Espere una nueva ola de tarjetas aceleradoras de IA para desafiarlos.