Prólogo para PictoNet

Pictonet SVG editor

Estoy iniciando un doctorado por proyecto en la Auckland University of Technology (AUT) con una duración aproximada de tres años, y en esta etapa temprana me he propuesto estructurar el trabajo de manera que simultáneamente sirva como base conceptual y operativa para lo que he denominado PictoNet. Concebido como una plataforma abierta de generación de pictogramas vectoriales (en formato SVG) orientada a la comunicación inclusiva pero no se limita al ámbito académico ni “asistivo”: mi intención es que evolucione hacia una iniciativa de bien público, un proyecto de naturaleza open source al que cualquier persona o institución pueda sumarse para contribuir, apropiarse y, ojalá, co-gobernar bajo principios de transparencia y colaboración.

Una y tres sillas

En un guiño a Joseph Kosuth, estas tres representaciones hablan de lo mismo: una silla. La diferencia está en que SVG sirve de puente entre imagen y texto, ofreciendo un texto-que-es-imagen puesto que es legible y visualizable. Trae una nueva “estética de la accesibilidad”.

En su dimensión académica, esta propuesta se enmarca en una investigación doctoral de tipo practice-based, es decir, una modalidad donde, a través del hacer diseño voy generando conocimiento. Incluye e implica la creación de prototipos, la implementación de la plataforma y la verificación de sus usos en entornos de Comunicación Aumentativa y Alternativa (CAA). Todo esto constituye el mismo núcleo de generación de conocimiento: la interacción humano-computador y la inteligencia artificial1 y la propuesta concreta del doctorado2. Algo que pueda instalarse, funcionar y evolucionar hacia un ecosistema que fomente nuevas formas de comunicación, sobre todo para aquellas personas que poseen necesidades complejas de habla o escritura.

No pretendo quedarme sólo en lo teórico sin implementar y hacer crecer las ideas, desde prototipos básicos a un servicio más complejo. Quiero apuntar a un sistema que pueda tener vida propia, ser parte del “bien común digital” sostenible en el tiempo, nutrido por una comunidad que la haga crecer y que, a la vez, produzca conocimiento aplicado útil localmente. Actualmente, mi plan de trabajo contempla la definición de los fundamentos y la motivación que impulsan PictoNet.

Por un lado, existe una necesidad social clara: la mayoría de los recursos o bibliotecas de pictogramas3 son acervos estáticos que no permiten adaptaciones culturales o lingüísticas fluidas, y no brindan posibilidades para refinar estilos gráficos ni ajustar la semántica a contextos muy específicos (por ejemplo, vocabularios científicos, institucionales, de índole terapéutica, etc.). Además, no vienen desde el diseño. En su mayoría han sido hechos por personas de otras profesiones que no lo piensan como un sistema gráfico armónico, como homogeneidad de trazos, niveles de abstración, geometría o grilla, por nombrar sólo algunos criterios gráficos escenciales para el diseño de una familia pictográfica. Estos sistemas requieren un alto nivel de sintetización4 lo que no asegura que sean accesibles cognitivamente. Para esto se requiere una validación posterior.

Quiero entender cómo funcionará la economía en un mercado de distintas IAs y aplicar una alternativa federada que permita ramificaciones y aplicaciones locales. Si el sentido que tiene es la traducción de palabras (o frases) a imágenes, aborda un problema fundamental de la comunicación, el de la espacialización. Las variaciones e interpretaciones son potencialmente infinitas. PictoNet se concibe bajo unos principios de diseño que abarcan la apertura del código y de los datos (open source), la “recursividad social” (implicando ciclos de aprendizaje y reentrenamiento continuo, donde la comunidad retroalimenta al sistema con cada mejora) y la especialización creciente mediante la creación de mini-modelos afinados que puedan cubrir ámbitos temáticos puntuales. Esto último abre la posibilidad de que existan submodelos especializados —por ejemplo, en vocabularios médicos, en terminología escolar para niños con autismo, en expresiones propias de un dialecto concreto— y que, una vez consolidados, puedan ofrecerse como servicios técnicos adaptados a nichos muy concretos5.

¿Será la nueva economía un mercado colaborativo de pequeños modelos de generación de pictogramas? Todos basados en el mismo núcleo abierto. Así es como funcionan la mayoría de los proyectos colaborativos actualmente.6 Esta parte todavía es muy incierta pero guardo cierta intuición de que mantener cierta soberanía digital sobre los aspectos que nos contituyen, es fundamental. Además constituye una forma de participación constructiva y menos frágil, más segura y ojalá menos sujeta a la cohersión o manipulación de una autoridad central hostil.

Qué hace

La plataforma en sí misma incluye un proceso de generación text-to-SVG : el usuario ingresa una frase o palabra, se ejecuta un análisis semántico que descompone el texto en sus elementos esenciales, y el sistema genera uno o varios archivos vectoriales con la representación pictográfica. Estos archivos pueden incorporar un metadato que describa las capas, los nodos y la lógica compositiva, lo cual facilita la trazabilidad y la posterior edición o personalización. El objetivo es que cada imagen vectorial sea manipulable, no sólo en su apariencia (grosor de línea, color, dimensiones) sino también en la posibilidad de animaciones básicas o adición de símbolos complementarios. La plataforma incluye un editor visual muy simple y, al mismo tiempo, un editor de código SVG que muestra el dibujo a la derecha, permitiendo un control fino de la estructura a usuarios más experimentados. La idea es que se fusione la sencillez para el usuario genérico con la potencia para desarrolladores o diseñadores interesados en afinar cada pictograma al detalle.

En relación con la gobernanza7, la propuesta es que el núcleo de PictoNet (su base de datos de pictogramas, los modelos de IA, el motor de generación y edición) sea de acceso libre y abierto, manteniendo licencias que permitan su auditoría y uso irrestricto siempre y cuando se respeten los criterios de acceso universal. Sin embargo, se abre la puerta a que aparezcan servicios de venta o de encargo de submodelos altamente especializados. En ese escenario, quienes contribuyeron al entrenamiento de dichos submodelos con su experiencia o con sus datos recibirían parte de la retribución en forma de créditos o tokens, reforzando así la idea de que la plataforma se sostenga en la economía de reputación y en un criterio de equidad para quienes aportan. De ese modo, PictoNet se ubica en un punto intermedio entre la gratuidad de la base común y la posibilidad de generar un rendimiento económico para grupos o individuos que ofrezcan mejoras o variaciones muy específicas. Esto no sólo busca la sostenibilidad del proyecto a largo plazo, sino también configurar un incentivo real para investigadores, profesionales y creativos que dediquen tiempo a entrenar y perfeccionar submodelos.

La factibilidad técnica descansa (en la ayuda de mis amigos ingenieros y mucho vibe coding) en la adopción de un stack que facilite la escalabilidad y la colaboración distribuida, incluyendo la ejecución del sistema como servicio Web, producción preliminar de datos para el entrenamiento y el uso de modelos preentrenados especializados en la generación de SVG. En términos de arquitectura, considero una serie de microservicios que se comuniquen entre sí para cubrir las distintas etapas de la generación de pictogramas, mientras que la base de datos (posiblemente MongoDB o similar) almacena tanto los archivos resultantes en SVG como la información de versionado, metadatos semánticos y el histórico de commits que describen cada contribución de la comunidad. Todo esto no está definido.

En la Figura 1 se representa de manera esquemática cómo la investigación de PictoNet avanza en varias capas: la primera ligada a los pictogramas como facilitadores de la autodeterminación de las personas con necesidades comunicativas; la segunda centrada en la implementación de un modelo generativo que permita la transformación de texto en imágenes vectoriales personalizables; la tercera enfocada en la conformación de una plataforma socio-técnica abierta al aporte colectivo. Esta aproximación progresiva, inspirada en marcos de práctica e iteración, se actualiza permanentemente según la retroalimentación que recibo tanto de usuarios finales como de especialistas.

Esquema de 3 capas

Figura 1. Expanding Inquiry in PictoNet. Representación de cómo se articulan los distintos niveles de alcance: desde la base semántica de los pictogramas hasta su integración en un ecosistema colaborativo de alcance global.




Nivel Enfoque Elementos
Nivel 1 – Autodeterminación y AAC pictográfica Examina cómo las herramientas de Comunicación Aumentativa y Alternativa (CAA), en particular los pictogramas, promueven la autodeterminación a través de la volición y la agencia causal. Los pictogramas como facilitadores de la toma de decisiones autónoma; la CAA como refuerzo de comportamientos con poder de agencia; perspectivas de profesionales sobre el rol de la CAA en la promoción de la autodeterminación; evaluación de cómo estas herramientas fortalecen la creencia de control-acción; modalidades de personalización y localización de pictogramas para distintos contextos culturales.
Nivel 2 – Metamodelo Generativo de Pictogramas e IA Centrado en el desarrollo de un meta-modelo y un marco computacional para la generación dinámica de pictogramas. Pipeline de modelo generativo (estructuración de datos, entrenamiento, ajuste fino); reglas de composición visual para la creación modular de pictogramas; editor basado en SVG que habilita interacción y corrección en tiempo real; la IA entendida como “material de diseño” para una representación pictográfica adaptativa.
Nivel 3 – Colaboración Abierta y Aprendizaje Federado Plantea un repositorio descentralizado y gestionado por la comunidad para un aprendizaje y enriquecimiento continuo. Modelos de aprendizaje federado que equilibren personalización y mejoras compartidas; gestión de repositorios y documentación para contribuciones estructuradas; adaptaciones locales (lanzamientos de modelos para distintos contextos culturales); mecanismos curatoriales que definan una gobernanza colaborativa en la estandarización de pictogramas.

Tabla 1. Enfoque de investigación en tres niveles donde se resume el enfoque general de la plataforma como proyecto de investigación, asociando cada nivel de trabajo con elementos clave, que van desde la generación de los pictogramas, hasta su implementación técnica y el tejido social que se requiere para garantizar una gobernanza responsable y un continuo perfeccionamiento de la herramienta.

Como toda iniciativa open source, PictoNet requiere de colaboradores y de simpatía en diversos frentes. Invito, en un llamado explícito a investigadores, desarrolladores, artistas y profesionales de la CAA, para que se sumen a la empresa de co-crear una generatriz de lenguaje, de vocación universal o aspiración universalista, pero con la posibilidad de periferia, de particularización8 permitiendo la generación y personalización local.

Tesis

El objetivo de esta investigación es que, al concluir el periodo doctoral, PictoNet se constituya en una plataforma que trascienda la contribución personal y aporte al campo de la comunicación inclusiva. La tesis fundamentará y validará el enfoque metodológico y conceptual que orienta el desarrollo de la plataforma, de modo que la iniciativa subsista de forma autónoma mediante la participación de una comunidad internacional dedicada a identificar y aplicar usos alternativos. Este espacio experimental integra la práctica docente, la investigación en diseño y el compromiso con una comunicación inclusiva. Se prevé que la interacción social inherente a PictoNet propicie un ciclo recursivo en el que cada aporte contribuya a la actualización del sistema, al registro de mejoras y al fortalecimiento de la trayectoria de quienes participan en el desarrollo de una herramienta orientada a la diversidad comunicativa.

Se facilitará el acceso a un repositorio que incluya documentación precisa, demostraciones operativas y un espacio colaborativo para orientar a los nuevos participantes. Asimismo, se plantea transformar PictoNet en un modelo cuantificable, considerando que su salida es breve (por ejemplo, en formato SVG) en relación con la capacidad de procesamiento de los modelos actuales de lenguaje. La posibilidad de integrar este modelo en hardware, como componente de sistemas más complejos, se presenta como un elemento central. Durante el primer año de MediaFranca (denominación que aparece en la interfaz y que corresponde al título oficial de la tesis), se desarrollarán escenarios de uso situados en actos comunicativos que abarquen diversos contextos, tales como la comunicación en la infancia, en colectivos con discapacidad y en personas neurodivergentes. Este planteamiento propone concebir la inteligencia artificial como material de diseño, facilitando su incorporación en sistemas que requieran modularidad y adaptabilidad.

El propósito fundamental de este trabajo es configurar a PictoNet como una plataforma operativa y accesible para una comunidad internacional, trascendiendo la contribución individual. El proyecto se orienta a generar escenarios de uso situados en actos comunicativos —por ejemplo, en interacciones dirigidas a la infancia, a personas con discapacidad y a individuos neurodivergentes— donde la inteligencia artificial se conciba como material de diseño para la comunicación inclusiva.

Dada su especialización y la brevedad de su salida (en formato SVG), es posible optimizar el modelo radicalmente. Esto permite explorar la viabilidad de integrar el sistema en hardware9, para operar como core engine para la comunicación dentro de sistemas de mayor sofisticación. Durante este 2025, se desarrollarán y evaluarán estos escenarios de uso, situando a PictoNet en contextos comunicativos concretos y facilitando su adaptación a distintas aplicaciones prácticas. Ahora debemos pasar a construirla.


  1. Generativa pero estadística, sin conocimiento real. Para un purista, un LLM es un subgrupo menor de la IA.
  2. De existir una agenda paralela, es PictoNet. El doctorado es un mal necesario, en el sentido más trascendente es un sub-producto. Tiendo a pensar que el hecho, la obra es lo que otorga sentido.
  3. Y con mayor intensidad el ámbito de la CAA. Creo que el repositorio extendido, mejor documentado y accesible de forma gratuita es ARASAAC diseñado e iniciado por Sergio Palao de Zaragoza.
  4. Se pueden revisar, a modo de caso emblemático, los juegos pictográficos para representar las disciplinas deportivas de cada olimpíada.
  5. Modelos compilables a nivel de hardware. Pictonet es un traductor mínimo, un core engine gráfico para la comunicación.
  6. Esto es un ejemplo del diseño de transición en la era del tecnofeudalismo.
  7. Que considera un modelo de negocio que permita la sostenibilidad de la iniciativa en el tiempo cubriendo los costos de operación y futuro desarrollo.
  8. En términos técnicos, una forma de trascender la hipótesis Sapir-Worf.
  9. Sistemas de visión, sistemas de proyección, CAA para agentes que proyectan, entre otros posibles usos y aplicaciones. Recordemos que la primera cámara fotográfica digital con función de reconocimiento de sonrisas y ojos abiertos apareció en el mercado alrededor de 2007-2008.