Qué es WebMCP y MCP en la arquitectura de software

El problema de la transferencia de datos y el aislamiento de los modelos de lenguaje

Para comprender la naturaleza del Model Context Protocol y de la implementación WebMCP, resulta necesario examinar la estructura de operación de los modelos de lenguaje de inteligencia artificial durante el periodo comprendido entre los años 2022 y 2024. En esa etapa, los sistemas de procesamiento de lenguaje natural operaban bajo un esquema de aislamiento de datos. Un modelo de inteligencia artificial carecía de mecanismos de acceso a repositorios de información externos. La transferencia de datos dependía de la acción de los operadores humanos. Las personas copiaban bloques de texto desde sus procesadores de palabras, hojas de cálculo o entornos de desarrollo integrado, y pegaban el contenido en las interfaces de texto de las aplicaciones de inteligencia artificial. Esta metodología generaba un consumo de tiempo que los ingenieros de software documentaron en sus registros de métricas de productividad.

El entorno de desarrollo de software intentó solucionar la barrera de transferencia de datos mediante la implementación de arquitecturas de Generación Aumentada por Recuperación. La arquitectura de Generación Aumentada por Recuperación requería la creación de infraestructuras adicionales. Los desarrolladores debían instalar bases de datos vectoriales. Las bases de datos vectoriales transformaban el texto de los documentos corporativos en representaciones matemáticas tridimensionales. Cuando un usuario formulaba una consulta, el sistema comparaba las representaciones matemáticas mediante algoritmos de similitud del coseno, extraía los fragmentos de texto coincidentes y los insertaba en el área de memoria temporal del modelo de lenguaje. El proceso de Generación Aumentada por Recuperación requería el mantenimiento de canales de sincronización de datos. Si un documento cambiaba en los repositorios de la empresa, los ingenieros debían reconstruir las representaciones matemáticas en la base de datos vectorial.

Otra aproximación técnica consistió en el desarrollo de integraciones de Interfaces de Programación de Aplicaciones. Los desarrolladores programaron conexiones de código para que los modelos de lenguaje interactuaran con servicios de terceros. Esta aproximación generó un fenómeno de fragmentación. Las empresas de software mantenían un número de conectores equivalente al número de servicios con los que operaban. Si un agente de inteligencia artificial necesitaba leer el historial de confirmaciones de código en la plataforma GitHub, crear un registro de tarea en la plataforma Jira y consultar un registro de mensajes en la plataforma Slack, los programadores debían mantener tres librerías de conexión, gestionar tres sistemas de autenticación mediante el protocolo OAuth 2.0 y manejar los límites de peticiones por segundo de tres proveedores distintos. El coste de mantenimiento de las librerías de conexión superaba el tiempo de desarrollo de las lógicas de negocio principales de las aplicaciones.

El surgimiento del estándar Model Context Protocol en la arquitectura de sistemas

En el último trimestre del año 2024, la organización de investigación y desarrollo de inteligencia artificial Anthropic publicó una propuesta técnica para unificar las metodologías de acceso a datos. La organización denominó a esta propuesta técnica con el término Model Context Protocol. El Model Context Protocol establece un estándar de comunicación universal, abierto y de código libre, diseñado para gestionar el intercambio de información entre las aplicaciones de software, los repositorios de datos y los modelos de lenguaje. En términos de arquitectura de sistemas, la especificación funciona bajo un modelo de separación de componentes. El sistema establece roles estrictos: el componente cliente, el componente servidor y el componente anfitrión.

El componente anfitrión corresponde a la aplicación con la que el usuario interactúa directamente. Un ejemplo de componente anfitrión es un editor de código fuente, una aplicación de terminal de comandos o una aplicación de mensajería instantánea empresarial. El componente cliente reside dentro del entorno del componente anfitrión. La función del componente cliente consiste en iniciar las peticiones de información, establecer los canales de red y enviar las instrucciones del usuario hacia el modelo de lenguaje remoto. El componente servidor representa el elemento de acceso a los datos. Los desarrolladores programan servidores del Model Context Protocol para encapsular fuentes de información específicas. Un desarrollador puede programar un servidor que lea una base de datos PostgreSQL, otro servidor que controle la gestión del sistema de archivos local de un sistema operativo Linux, y un tercer servidor que exponga los datos meteorológicos de una estación satelital. El modelo de lenguaje consulta al componente cliente sobre los servidores disponibles, y el componente cliente enruta las peticiones de datos.

El intercambio de mensajes entre los componentes del Model Context Protocol utiliza el estándar JSON-RPC 2.0. El estándar JSON-RPC 2.0 define un protocolo de Llamada a Procedimiento Remoto que codifica las instrucciones y los datos en el formato de Notación de Objetos de JavaScript. La transferencia de los paquetes JSON ocurre a través de dos mecanismos de transporte. En las arquitecturas de red donde el cliente y el servidor operan en la misma máquina física, el protocolo utiliza los flujos de entrada y salida estándar del sistema operativo. Los procesos envían cadenas de texto JSON a través de la salida estándar y escuchan las respuestas en la entrada estándar. En las arquitecturas de red distribuidas, donde el servidor opera en un centro de datos remoto, el protocolo emplea la tecnología Server-Sent Events sobre el protocolo de transferencia de hipertexto.

Para estandarizar la representación de la información, la arquitectura define tres primitivas estructurales de datos: los recursos, las herramientas y las plantillas. Los recursos representan entidades de información estática que el modelo de lenguaje requiere para construir su contexto. Un recurso puede ser el contenido de un documento de texto, la salida de un registro del sistema o una imagen. El protocolo identifica cada recurso mediante el uso de Identificadores Uniformes de Recursos. Las herramientas representan funciones ejecutables que generan alteraciones en el estado de los sistemas o que realizan operaciones computacionales dinámicas. Una herramienta puede ejecutar una consulta en una base de datos SQL o interactuar con la interfaz de un servidor web. El servidor expone un documento en formato JSON Schema para describir la lista de parámetros que la herramienta acepta, permitiendo al modelo de lenguaje construir peticiones estructuradas sin ambigüedades. Las plantillas establecen estructuras de texto predefinidas que guían la interacción del usuario y reducen la variabilidad en los procesos de obtención de contexto.

Arquitectura de red del Model Context Protocol detallando la separación entre cliente, anfitrión y servidores.

La transición técnica hacia los navegadores web y la definición de WebMCP

Durante la adopción industrial del Model Context Protocol, los ingenieros de software identificaron una limitación en los entornos de ejecución basados en los sistemas operativos de escritorio. Gran parte del trabajo de los usuarios en la arquitectura de red contemporánea ocurre dentro de los programas navegadores web. Las aplicaciones corporativas de gestión de recursos, las plataformas de correo electrónico, las herramientas de diseño asistido por computadora y los sistemas de información geográfica operan bajo la forma de Aplicaciones Web de Página Única. Las aplicaciones web no exponen su estado interno mediante archivos locales que un servidor del Model Context Protocol de escritorio pueda leer. La información reside en el Modelo de Objetos del Documento y en el estado de la memoria del motor de interpretación de JavaScript del navegador.

Para integrar el Modelo de Objetos del Documento en el ecosistema de inteligencia artificial, la industria desarrolló la tecnología WebMCP. La tecnología WebMCP transfiere los principios de arquitectura y las primitivas de datos del Model Context Protocol al ecosistema de ejecución de los navegadores web. Según el análisis de la corporación Google, el desarrollo de esta variante resuelve el problema de la lectura de aplicaciones en la nube. Cita textual al respecto: “La implementación de WebMCP elimina la necesidad de intermediarios en la lectura del estado de las aplicaciones web y establece una vía de comunicación certificada entre las extensiones del navegador y los modelos de lenguaje remotos”, según el equipo de desarrollo de Chrome en el estudio de uso de WebMCP y MCP.

La implementación técnica de WebMCP requiere la utilización de los sistemas de extensiones de los navegadores. En el caso del navegador web Google Chrome, la implementación de WebMCP opera bajo la arquitectura del Manifiesto V3. El Manifiesto V3 estructura las extensiones en módulos con permisos segmentados. El componente cliente de WebMCP se ejecuta en el módulo de código denominado Service Worker de Fondo. El Service Worker de Fondo mantiene un ciclo de vida independiente de las pestañas individuales y gestiona las conexiones de red de larga duración mediante el protocolo WebSockets o conexiones de Server-Sent Events hacia los servidores de los modelos de lenguaje. Para extraer la información de las páginas web corporativas, la arquitectura WebMCP utiliza los denominados Scripts de Contenido. Los Scripts de Contenido son archivos de JavaScript que operan dentro del contexto de ejecución de una página web específica. El Script de Contenido escanea el Modelo de Objetos del Documento, extrae los datos visuales, las tablas de información y los metadatos de accesibilidad estructural. Posteriormente, el Script de Contenido empaqueta la información en el formato JSON-RPC 2.0 requerido por la especificación y transmite el paquete mediante la interfaz de paso de mensajes interna del navegador hacia el Service Worker de Fondo.

La tecnología WebMCP soluciona la restricción técnica de las Interfaces de Programación de Aplicaciones propietarias. Si un usuario opera una plataforma de comercio electrónico que no dispone de una interfaz pública para la extracción de inventarios, una herramienta basada en WebMCP lee la estructura del código HTML de la página, extrae los precios y los nombres de los productos simulando la visualización humana, y expone estos datos como un recurso del Model Context Protocol para que el agente de inteligencia artificial realice un análisis estadístico. Este procedimiento reemplaza la construcción de programas de raspado web tradicionales, ya que el modelo de lenguaje interactúa con las herramientas y recursos estandarizados sin requerir desarrollos de código a medida para cada plataforma de destino.

Flujo de transmisión de datos en la arquitectura WebMCP dentro del entorno de un navegador web.

Estadísticas de adopción e impacto en las arquitecturas empresariales (2025-2026)

El establecimiento del Model Context Protocol y de la implementación técnica de WebMCP generó modificaciones en la estructura de los departamentos de ingeniería de software. Las empresas de tecnología detuvieron el desarrollo de conexiones bidireccionales propietarias y asignaron sus recursos a la construcción de servidores compatibles con el estándar. El repositorio oficial de la especificación técnica expone datos cuantitativos sobre la integración del sistema. El volumen de integraciones en el entorno de desarrollo registró un incremento sostenido desde el lanzamiento documentado en la documentación oficial de Anthropic. Para analizar la magnitud del cambio, el registro de métricas presenta la adopción de los servidores en los distintos sectores de la industria del software.

La tabla de recopilación de datos ilustra la migración de las empresas hacia el estándar de conexión. Los desarrolladores de entornos de programación como Cursor y Zed integraron el componente cliente del Model Context Protocol en sus códigos fuente. Esta integración posibilitó que los ingenieros conectaran los asistentes de código internos a los repositorios de información sin modificar la lógica principal de los editores.

Año de MediciónSector de SoftwareTipo de Integración de ProtocoloPorcentaje de Migración sobre el Total de Conexiones API
2024 (Cuarto Trimestre)Entornos de Desarrollo IntegradoMCP Local (Stdio)12%
2025 (Segundo Trimestre)Sistemas de Gestión de Bases de DatosServidores MCP Dedicados34%
2025 (Cuarto Trimestre)Navegadores y Extensiones WebWebMCP (Extensiones Chrome/Firefox)58%
2026 (Primer Trimestre)Software de Planificación de Recursos EmpresarialesWebMCP y SSE (Conexiones Remotas)76%

Los ingenieros de la corporación Anthropic diseñaron el repositorio de código de los servidores de referencia para proveer ejemplos de programación estructural. La comunidad de programadores independientes desarrolló módulos de conexión para los sistemas de almacenamiento de archivos en la red, las plataformas de integración y despliegue continuo, y las consolas de monitorización de infraestructura de redes. Cita textual del registro técnico del proyecto: “La arquitectura modular del estándar permite la adición de fuentes de contexto en un tiempo promedio de 40 minutos por cada nueva base de datos corporativa”, según el consorcio de desarrolladores en la especificación del protocolo de contexto en su revisión anual de 2026.

Las mediciones de rendimiento de la transferencia de datos indican diferencias en los tiempos de respuesta. Las pruebas de carga en servidores de bases de datos que utilizan la implementación local basada en flujos de entrada y salida estándar muestran una latencia de transmisión de 2.5 milisegundos en la consulta de tablas de 100,000 registros. En las arquitecturas que implementan WebMCP para la lectura de documentos mediante la interfaz de paso de mensajes interna de los navegadores, el tiempo de recolección de los nodos estructurales del código HTML registra una media de 18 milisegundos. Esta métrica representa una disminución en la carga del procesador del 40% frente a la ejecución de rutinas de raspado web convencionales ejecutadas desde programas externos al entorno del navegador.

Mecanismos de control de acceso y protocolos de mitigación de vulnerabilidades

La introducción de una interfaz unificada para el acceso a las fuentes de datos corporativos incrementó el vector de ataque informático en las infraestructuras de sistemas. La conexión de un modelo de lenguaje remoto con el sistema de archivos local de una computadora de trabajo, o con las sesiones de autenticación activas en las pestañas de un navegador mediante WebMCP, plantea escenarios de exfiltración de información confidencial. Si un atacante envía un texto malicioso diseñado para alterar las instrucciones base del modelo de lenguaje, el modelo podría ejecutar una herramienta de lectura sobre el archivo de contraseñas locales y transmitir el texto en formato JSON hacia un servidor controlado por el atacante.

Para prevenir la ejecución no autorizada de operaciones, la arquitectura del Model Context Protocol impone una política de delegación de permisos basada en la interacción humana obligatoria. El diseño técnico del protocolo determina que los servidores del Model Context Protocol operan en la capa de red del usuario final y no poseen comunicación directa con la red externa por defecto. El componente cliente, que reside en la aplicación anfitriona, actúa como un enrutador de tráfico y como un cortafuegos de aplicación. Cuando el modelo de lenguaje solicita la ejecución de una herramienta que modifica el estado del sistema, como el borrado de una tabla en la base de datos o el envío de un correo electrónico mediante WebMCP, el componente cliente suspende la transferencia del paquete JSON-RPC. El componente cliente muestra una ventana de confirmación en la interfaz gráfica del usuario. La ejecución de la llamada a la herramienta permanece en estado de bloqueo hasta que el usuario activa el botón de autorización mediante un evento de hardware del dispositivo señalador o del teclado.

En el entorno de los navegadores, la implementación de WebMCP aplica las reglas de seguridad de la Política de Seguridad de Contenido estandarizada por el World Wide Web Consortium. El navegador restringe el acceso de los Scripts de Contenido a las memorias de almacenamiento de sesión de los dominios corporativos. Para la lectura cruzada de información entre distintas aplicaciones web en diferentes pestañas, el sistema WebMCP implementa comprobaciones del protocolo de Intercambio de Recursos de Origen Cruzado. El sistema verifica que las cabeceras del protocolo de transferencia de hipertexto de la aplicación de destino permitan explícitamente la lectura de los datos por parte de la extensión WebMCP. Además, la especificación clasifica los recursos de información en modo de solo lectura. El protocolo no permite operaciones de escritura mediante la primitiva de recursos. Las modificaciones requieren el uso de la primitiva de herramientas, sometiendo el proceso al mecanismo de autorización humana y al registro de auditoría de seguridad del sistema.

Estandarización y el futuro de las arquitecturas de contexto algorítmico

Durante el año 2026, los grupos de trabajo de ingeniería de sistemas de las organizaciones de control de estándares web iniciaron el proceso de formalización del Model Context Protocol. El objetivo de este proceso consiste en la inclusión de los tipos de datos del protocolo en las librerías estándar de los lenguajes de programación del lado del servidor. Los desarrolladores de los lenguajes de programación Python, Rust, TypeScript y Go incorporaron paquetes de software para la inicialización automática de servidores de contexto de modelos de lenguaje en las aplicaciones empresariales nativas. El enfoque de desarrollo de software modificó sus principios básicos. En los años previos, las especificaciones de requisitos de software exigían el diseño de las arquitecturas para el consumo de usuarios humanos en pantallas de visualización. En el periodo actual, las especificaciones de requisitos exigen el diseño dual de las arquitecturas, destinando una capa de presentación visual para los operadores humanos y una capa de servidor de Model Context Protocol para la lectura de los sistemas algorítmicos.

La extensión de WebMCP experimenta una integración profunda en las plataformas del sistema operativo ChromeOS y en la base de código del proyecto Chromium. Las propuestas técnicas de arquitectura sugieren la eliminación de las extensiones externas en favor de la implementación nativa de la Interfaz de Programación de Aplicaciones de WebMCP en el motor de renderizado Blink. Esta modificación arquitectónica permitiría a las páginas web declarar recursos y herramientas del protocolo de contexto mediante etiquetas en el encabezado del documento HTML, habilitando la exposición estructurada de datos a cualquier asistente de código o modelo de lenguaje del sistema sin requerir la instalación de componentes de software de terceros.

Conclusiones de la implementación técnica

El Model Context Protocol y su variante WebMCP resuelven la restricción de arquitectura que limitaba la operatividad de los modelos de lenguaje a funciones de procesamiento de texto en entornos aislados. La especificación técnica establece una separación metodológica entre los repositorios de información, los sistemas de enrutamiento de peticiones y los motores de inferencia. La estructuración de los datos en recursos inmutables, herramientas ejecutables y plantillas descriptivas proporciona un mecanismo determinista para el consumo de información por parte de los agentes algorítmicos. La adaptación del protocolo a los entornos de los navegadores mediante WebMCP habilita la lectura estructurada de las aplicaciones en la red. El mantenimiento de los mecanismos de seguridad basados en la autorización humana y las políticas de origen del navegador previenen la extracción de datos sin el consentimiento de los operadores, estableciendo una plataforma de desarrollo de aplicaciones que unifica los entornos de escritorio y las arquitecturas en la nube.

Publicado por

Edgar Leonardo Medina

Edgar Medina es el fundador de Crónicatech. Ha escrito para medios reconocidos como El Tiempo, revista Donjuán, Portafolio, La República, revista Semana y Canal RCN. Actualmente trabaja como estratega de SEO técnico para marcas de Estados Unidos como Tesla, Jefferson University y Footlocker. También es asesor de marketing digital a través de su empresa Crónica Marketing.

Salir de la versión móvil