This website uses cookies

Read our Privacy policy and Terms of use for more information.

En el correo de hoy:

  • 🌶️ OpenAI ya no depende 100% de Nvidia: su chip Jalapeño marca un antes y después

  • 🏃 Google pierde a más científicos top ante Anthropic (la fuga de cerebros continúa)

  • 💸 Las empresas empiezan a racionar tokens de IA porque los empleados los agotan rápido

🌶️ OPENAI PRESENTA JALAPEÑO: SU PRIMER CHIP DISEÑADO CON BROADCOM

La noticia que muchos esperaban finalmente llegó: OpenAI acaba de presentar Jalapeño, su primer procesador personalizado desarrollado en colaboración con Broadcom.

Y no, no es un chip para entrenar modelos, sino algo mucho más estratégico: está optimizado específicamente para inferencia, es decir, para ejecutar los modelos de IA que ya usamos todos los días.

¿Por qué es tan importante? Porque la inferencia representa el 80-90% de los costos operativos de OpenAI. Cada vez que usas ChatGPT, cada respuesta que genera, cada imagen que crea DALL-E, todo eso requiere procesamiento de inferencia.

Hasta ahora, OpenAI dependía casi exclusivamente de chips Nvidia, que si bien son excelentes, son genéricos y costosos. Jalapeño está diseñado desde cero para las necesidades específicas de los modelos de lenguaje de OpenAI.

Esto nos dice varias cosas.

  • Primero, que OpenAI está jugando a largo plazo y quiere controlar toda su stack tecnológica.

  • Segundo, que la demanda de inferencia es tan masiva que justifica la inversión millonaria en hardware personalizado.

  • Y tercero, que estamos viendo el inicio de una nueva carrera armamentista en chips de IA, donde cada gran player querrá su propio silicio.

Broadcom, conocido por diseñar chips personalizados para Google (TPU) y otros gigantes tech, aporta la experiencia en fabricación que OpenAI necesitaba.

La alianza tiene sentido: OpenAI pone el conocimiento sobre qué necesitan sus modelos, Broadcom pone la ingeniería de semiconductores.

El mensaje para la industria es claro: quien controle el hardware, controlará los costos. Y quien controle los costos, podrá escalar más rápido. Nvidia sigue siendo el rey indiscutible, pero ahora tiene competencia directa de sus propios clientes. La era del hardware de IA personalizado acaba de comenzar.

Noticias Express

🔥 La carrera del silicio se intensifica: Ars Technica profundiza en cómo OpenAI y Broadcom diseñaron el chip para manejar inferencia de LLMs a escala masiva, en medio de la lucha por satisfacer la demanda global. Leer mas

🚪 Más científicos abandonan Google por Anthropic: Jonas Adler y Alexander Pritzel se unen al éxodo hacia Anthropic, siguiendo los pasos de Noam Shazeer y John Jumper en una fuga de talento preocupante para Google. Leer mas

🤖 Agility Robotics sale a bolsa vía SPAC por $2.5B: La startup de robots humanoides que nació en Oregon State en 2015 espera recaudar $620 millones con su salida a bolsa. Leer mas

📉 Cerebras se desploma en bolsa tras su primer reporte: Las acciones del fabricante de chips de IA cayeron después de proyectar márgenes más estrechos, aunque el CEO dice que hubo un malentendido con los inversionistas. Leer mas

⚖️ Anthropic acusa a Alibaba de extraer capacidades de Claude: Anthropic afirma que Alibaba extrajo ilegalmente las capacidades de su modelo Claude, escalando las tensiones sobre propiedad intelectual en IA. Leer mas

💼 Los trabajos de ingeniería resisten mejor la ola de IA: Datos de SignalFire muestran que los ingenieros representan una mayor proporción de nuevas contrataciones, contrario a la narrativa de que la IA destruiría estos empleos. Leer mas

🎨 Figma integra código, animaciones y más IA: La nueva actualización añade capas de código, soporte para motion y shaders, y la capacidad de crear plugins personalizados usando IA. Leer mas

💡 Estrategia del día: Cómo gestionar el presupuesto de IA en tu equipo

📅 El mito: "Darle acceso ilimitado a herramientas de IA a mi equipo aumentará la productividad automáticamente."

💡 La realidad: Las empresas están descubriendo que los empleados agotan rápidamente los presupuestos de tokens de IA en tareas pequeñas y repetitivas. Lo que parecía una inversión inteligente se convierte en un gasto descontrolado cuando alguien usa Claude o GPT-4 para resumir cada email o escribir cada mensaje de Slack. Estamos pasando de la era del "tokenmaxxing" (usar IA para todo) a la era del racionamiento inteligente.

🚀 La propuesta: Implementa un sistema de gobernanza de IA que maximice el ROI sin frenar la innovación. No se trata de prohibir, sino de priorizar.

Tres pasos para implementarlo:

1. Audita el uso actual: Revisa los últimos 30 días de consumo de tokens/créditos de IA en tu organización. Identifica qué tareas consumen más recursos y cuáles realmente aportan valor medible (ahorro de tiempo, mejor calidad, nuevos insights).

2. Crea una matriz de priorización: Clasifica los casos de uso en tres categorías: Alto impacto (análisis complejos, generación de código, investigación profunda), Medio impacto (borradores de contenido, traducciones), Bajo impacto (tareas que podrían hacerse manualmente en menos de 2 minutos). Asigna presupuestos diferenciados.

3. Establece "créditos inteligentes": En lugar de acceso ilimitado o límites rígidos, da a cada persona un presupuesto mensual de tokens con la opción de solicitar más justificando el caso de uso. Esto crea conciencia de costos sin bloquear la productividad.

Prompt reutilizable para evaluar si vale la pena usar IA en una tarea:

"Analiza esta tarea: [describe la tarea]. Considera: 1) ¿Cuánto tiempo me tomaría hacerla manualmente? 2) ¿La calidad del resultado de IA será significativamente mejor que hacerlo yo? 3) ¿Es una tarea que repetiré frecuentemente? 4) ¿El costo estimado de tokens justifica el ahorro de tiempo? Dame una recomendación: usar IA, hacerlo manual, o crear una automatización."

🧠 El nombre "Jalapeño" para el chip de OpenAI sigue la tradición de nombrar procesadores con códigos internos picantes. Google usa "Capsicum" para algunos TPU, y los chips de Apple llevan nombres de lugares de California. ¿La razón? Los chips generan tanto calor que los nombres "calientes" se volvieron un inside joke de la industria que terminó siendo tradición.

Una pregunta para ti: Si tuvieras que elegir UNA tarea en tu trabajo para automatizar completamente con IA, ¿cuál sería?

1️⃣ Emails y comunicación

2️⃣ Análisis de datos y reportes

3️⃣ Investigación y síntesis de información

Respóndeme directamente a este email. Me encanta leer tus respuestas y saber cómo estás usando (o pensando usar) la IA en tu día a día.

Nos leemos mañana con más noticias del mundo tech 🚀

Reply

Avatar

or to participate

Seguir leyendo