inteligencia artificialwebgpuwebassemblyonnx

Cómo funciona la IA dentro del navegador (sin servidores ni nube)

Explicación a fondo de cómo la inteligencia artificial corre 100% en tu navegador: WebGPU, WebAssembly, ONNX, modelos de segmentación y por qué esto cambia las reglas.

22 de junio de 2026·9 min de lectura

Durante años, "usar IA" significó enviar tus datos a un servidor remoto, esperar a que una GPU en un centro de datos hiciera el cálculo y recibir la respuesta. Hoy algo ha cambiado de forma silenciosa pero radical: la IA puede correr entera dentro de tu navegador, en tu propio dispositivo, sin que nada salga de él. Este artículo explica cómo es posible y por qué importa más de lo que parece.

El problema que resuelve la IA en local

Pensemos en quitar el fondo de una foto. La forma tradicional: subes la imagen a un servidor, una red neuronal la procesa y te devuelve el recorte. Funciona, pero tiene tres costes ocultos:

  1. Privacidad: tu imagen —que puede ser un documento o algo personal— viaja por internet y se almacena, aunque sea un instante, en un sistema ajeno.
  2. Coste e infraestructura: alguien paga esos servidores con GPU, y por eso casi todas estas herramientas acaban siendo de pago, con límites o con anuncios.
  3. Latencia: subir y descargar lleva tiempo, sobre todo con archivos grandes.

La IA en local elimina los tres de golpe. Pero, ¿cómo cabe una red neuronal en una pestaña del navegador?

Las tres piezas que lo hacen posible

1. WebAssembly (WASM): código casi nativo en el navegador

JavaScript es flexible pero no fue diseñado para cálculo numérico intensivo. WebAssembly es un formato binario que el navegador ejecuta a velocidad casi nativa. Permite portar librerías escritas en C++ o Rust —como los motores de inferencia de IA— y correrlas en la web con un rendimiento impensable hace una década. Es lo que convierte el navegador en una plataforma de cómputo seria.

2. WebGPU: acceso a la tarjeta gráfica

Las redes neuronales son, en el fondo, montañas de multiplicaciones de matrices, y las GPU están hechas exactamente para eso. WebGPU es la API moderna que da al navegador acceso a la GPU del dispositivo para cómputo general (no solo gráficos). Con WebGPU, una inferencia que en CPU tardaría un minuto puede resolverse en segundos. Es el salto que hizo viable la IA pesada en el navegador.

Cuando WebGPU no está disponible (navegadores antiguos, algún móvil), se cae a WASM sobre CPU: más lento, pero funciona en todas partes.

3. ONNX y los runtimes de inferencia

Un modelo de IA entrenado se guarda en un formato estándar llamado ONNX (Open Neural Network Exchange). Un runtime como ONNX Runtime Web sabe leer ese archivo y ejecutarlo usando WebGPU o WASM. Librerías como Transformers.js envuelven todo esto en una API simple, de modo que cargar un modelo y ejecutarlo es casi tan fácil como llamar a una función.

Qué es realmente un "modelo" de IA

Un modelo de segmentación de imágenes (el que separa el sujeto del fondo) es una red neuronal: millones de números (los pesos) organizados en capas. Esos pesos se ajustaron durante el entrenamiento, alimentando la red con miles de imágenes etiquetadas hasta que aprendió a distinguir "sujeto" de "fondo" píxel a píxel.

Lo importante: el entrenamiento es lo caro y se hace una vez, en grandes centros de datos. Lo que corre en tu navegador es la inferencia: usar el modelo ya entrenado, que es mucho más ligero. Por eso cabe en tu dispositivo.

El reto del tamaño y la cuantización

Un modelo potente puede ocupar cientos de megas, demasiado para descargar cómodamente. Aquí entra la cuantización: reducir la precisión de los números del modelo (por ejemplo, de 32 bits a 8 bits) para que pese mucho menos y consuma menos memoria, a cambio de una pérdida mínima de calidad. Gracias a esto, modelos que antes solo corrían en servidores ahora caben en una pestaña.

La tendencia es clara y favorable: cada año salen modelos más pequeños y más capaces. SlimSAM, por ejemplo, es una versión del modelo Segment Anything de Meta 100 veces más pequeña que el original, manteniendo gran parte de la calidad.

Por qué esto cambia las reglas

La IA en local no es solo una curiosidad técnica; cambia el modelo de lo que una herramienta web puede ser:

  • Privacidad real: si el cálculo es local, tus datos nunca se suben. Puedes incluso desconectar internet tras cargar el modelo. Para documentos, fotos personales o material confidencial, esto es decisivo.
  • Gratis de verdad: sin servidores que pagar, una herramienta puede ser gratuita sin anuncios ni límites, porque el cómputo lo pone el usuario.
  • Sin dependencia: funciona aunque el servicio "cierre", porque vive en tu navegador.

Esta misma tecnología está detrás del quita-fondos con IA de esta web, pero el verdadero titular es más grande: el navegador se ha convertido en una plataforma de IA, y eso abre la puerta a OCR, mejora de imágenes, transcripción de audio y mucho más, todo local y privado.

Lo que la IA local todavía no puede hacer

Por honestidad: no todo cabe en el navegador. Los grandes modelos de lenguaje (chatbots tipo GPT) y la generación de imágenes ocupan gigas y exigen GPUs enormes; eso seguirá en la nube por ahora. La IA local brilla en tareas de visión (segmentar, detectar, mejorar) y en modelos especializados y compactos. Saber dónde está la frontera es parte de usarla bien.

Conclusión

Que una red neuronal corra dentro de tu navegador, en tu móvil o portátil, sin enviar nada a ningún sitio, habría sonado a ciencia ficción hace pocos años. Hoy es real gracias a WebAssembly, WebGPU y modelos cada vez más eficientes. Y lo mejor: el techo sigue subiendo. La próxima vez que una web "haga magia" con tu imagen sin pedirte que la subas, ya sabes lo que ocurre por debajo.

Si quieres verlo en acción, prueba el quita-fondos con IA local: la IA corre entera en tu navegador y tu imagen nunca sale de tu dispositivo.

Pruébalo sin código

Quitar Fondo de Imagen

Quita el fondo con IA, 100% en tu navegador.

Abrir Quitar Fondo de Imagen

Hecho por

Miguel Ángel Colorado Marin (MACM)

Full-Stack Developer · Guadalajara, España

Desarrollo aplicaciones web, herramientas digitales y proyectos completos — desde el diseño hasta el despliegue.

Contáctame