Estoy iniciando un doctorado por proyecto en la Auckland University of Technology (AUT) con una duración aproximada de tres años, y en esta etapa temprana me he propuesto estructurar el trabajo de manera que simultáneamente sirva como base conceptual y operativa para lo que he denominado PictoNet. Concebido como una plataforma abierta de generación de pictogramas vectoriales (en formato SVG) orientada a la comunicación inclusiva pero no se limita al ámbito académico ni “asistivo”: mi intención es que evolucione hacia una iniciativa de bien público, un proyecto de naturaleza open source al que cualquier persona o institución pueda sumarse para contribuir, apropiarse y, ojalá, co-gobernar bajo principios de transparencia y colaboración.
En su dimensión académica, esta propuesta se enmarca en una investigación doctoral de tipo practice-based, es decir, una modalidad donde la creación de prototipos, la implementación de la plataforma y la verificación de sus usos en entornos de Comunicación Aumentativa y Alternativa (CAA). Todo esto constituye el mismo núcleo de generación de conocimiento: la interacción humano-computador y la inteligencia artificial1 pueden fusionarse en un ecosistema que fomente nuevas formas de comunicación, sobre todo para aquellas personas que poseen necesidades complejas de habla o escritura.
No pretendo quedarme sólo en la lógica de laboratorio ni restringirme al protocolo de una investigación clásica: mi apuesta es que la plataforma sea un “común digital” sostenible en el tiempo, nutrido por una comunidad que la haga crecer y que, a la vez, produzca conocimiento aplicado. Actualmente, mi plan de trabajo contempla, en primer lugar, la definición de los fundamentos y la motivación que impulsan PictoNet.
Por un lado, existe una necesidad social evidente: la mayoría de los recursos o bibliotecas de pictogramas en el ámbito de la CAA son acervos estáticos que no permiten adaptaciones culturales o lingüísticas fluidas, y no brindan posibilidades para refinar estilos gráficos ni ajustar la semántica a contextos muy específicos (por ejemplo, vocabularios científicos, institucionales, de índole terapéutica, etc.).
Por otro lado, mi investigación doctoral está motivada por un interés eminentemente social, en la medida en que se plantea crear un espacio de co-construcción con especialistas, terapeutas, diseñadores, desarrolladores y con los propios usuarios. Esto se debe a que el fundamento mismo del lenguaje yace en lo social. Desde esta perspectiva, PictoNet aspira a resolver necesidades concretas cognocitivas de los pictogramas, pero también a articular un discurso sobre la importancia del diseño inclusivo2 y la apertura de las tecnologías como una forma de asegurarnos acceso futuro a sistemas cada vez más complejos.
Adicionalmente, estoy explorando la noción de “economía de la reputación”, donde las contribuciones al proyecto —sea corrigiendo un pictograma, creando un nuevo submodelo de IA o sugiriendo mejoras de interfaz— se compensan con créditos que otorgan reconocimiento3 privilegios para incidir y tener mayor capacidad de decisión dentro del nuevo modelo federado que pueda generar.
PictoNet se concibe bajo unos principios de diseño que abarcan la apertura del código y de los datos (open source), la “recursividad social” (implicando ciclos de aprendizaje y reentrenamiento continuo, donde la comunidad retroalimenta al sistema con cada mejora) y la especialización creciente mediante la creación de mini-modelos afinados que puedan cubrir ámbitos temáticos puntuales. Esto último abre la posibilidad de que existan submodelos especializados —por ejemplo, en vocabularios médicos, en terminología escolar para niños con autismo, en expresiones propias de un dialecto concreto— y que, una vez consolidados, puedan ofrecerse como servicios técnicos adaptados a nichos muy concretos4.
La nueva economía es la de un mercado colaborativo de pequeños modelos de generación de pictogramas, todos basados en el mismo núcleo abierto, pero con capas o extensiones finamente entrenadas que pueden contribuir a no, en su próxima generación, al modelo canónico PictoNet5.
La plataforma en sí misma incluye un proceso de generación text-to-SVG : el usuario ingresa una frase o palabra, se ejecuta un análisis semántico que descompone el texto en sus elementos esenciales, y el sistema genera uno o varios archivos vectoriales con la representación pictográfica. Estos archivos pueden incorporar un metadato que describa las capas, los nodos y la lógica compositiva, lo cual facilita la trazabilidad y la posterior edición o personalización. El objetivo es que cada imagen vectorial sea manipulable, no sólo en su apariencia (grosor de línea, color, dimensiones) sino también en la posibilidad de animaciones básicas o adición de símbolos complementarios. La plataforma incluye un editor visual muy simple y, al mismo tiempo, un editor de código SVG que muestra el dibujo a la derecha, permitiendo un control fino de la estructura a usuarios más experimentados. La idea es que se fusione la sencillez para el usuario genérico con la potencia para desarrolladores o diseñadores interesados en afinar cada pictograma al detalle.
En relación con la gobernanza y el modelo de negocio potencial, la propuesta es que el núcleo de PictoNet (su base de datos de pictogramas, los modelos de IA, el motor de generación y edición) sea de acceso libre y abierto, manteniendo licencias que permitan su auditoría y uso irrestricto siempre y cuando se respeten los criterios de acceso universal. Sin embargo, se abre la puerta a que aparezcan servicios de venta o de encargo de submodelos altamente especializados. En ese escenario, quienes contribuyeron al entrenamiento de dichos submodelos con su experiencia o con sus datos recibirían parte de la retribución en forma de créditos o tokens, reforzando así la idea de que la plataforma se sostenga en la economía de reputación y en un criterio de equidad para quienes aportan. De ese modo, PictoNet se ubica en un punto intermedio entre la gratuidad de la base común y la posibilidad de generar un rendimiento económico para grupos o individuos que ofrezcan mejoras o variaciones muy específicas. Esto no sólo busca la sostenibilidad del proyecto a largo plazo, sino también configurar un incentivo real para investigadores, profesionales y creativos que dediquen tiempo a entrenar y perfeccionar submodelos.
La factibilidad técnica descansa, de momento, en la adopción de un stack que facilite la escalabilidad y la colaboración distribuida, incluyendo contenedores (Docker) para la ejecución del sistema, repositorios de modelos en plataformas como Hugging Face, un backend modular (tal vez con FastAPI) y un frontend que privilegie la simplicidad y la capacidad de versionado. En términos de arquitectura, considero una serie de microservicios que se comuniquen entre sí para cubrir las distintas etapas de la generación de pictogramas, mientras que la base de datos (posiblemente MongoDB o similar) almacena tanto los archivos resultantes en SVG como la información de versionado, metadatos semánticos y el histórico de commits que describen cada contribución de la comunidad.
En la Figura 1 se representa de manera esquemática cómo la investigación de PictoNet avanza en varias capas: la primera ligada a los pictogramas como facilitadores de la autodeterminación de las personas con necesidades comunicativas; la segunda centrada en la implementación de un modelo generativo que permita la transformación de texto en imágenes vectoriales personalizables; la tercera enfocada en la conformación de una plataforma socio-técnica abierta al aporte colectivo. Esta aproximación progresiva, inspirada en marcos de práctica e iteración, se actualiza permanentemente según la retroalimentación que recibo tanto de usuarios finales como de especialistas.
Figura 1. Expanding Inquiry in PictoNet. Representación de cómo se articulan los distintos niveles de alcance: desde la base semántica de los pictogramas hasta su integración en un ecosistema colaborativo de alcance global.
En la Tabla 1 se resume el enfoque general de la plataforma como proyecto de investigación, asociando cada nivel de trabajo con elementos clave que van desde la generación de los pictogramas, hasta su implementación técnica y el tejido social que se requiere para garantizar una gobernanza responsable y un continuo perfeccionamiento de la herramienta.
Nivel | Enfoque | Elementos |
---|---|---|
Nivel 1 – Autodeterminación y AAC pictográfica | Examina cómo las herramientas de Comunicación Aumentativa y Alternativa (CAA), en particular los pictogramas, promueven la autodeterminación a través de la volición y la agencia causal. | Los pictogramas como facilitadores de la toma de decisiones autónoma; la CAA como refuerzo de comportamientos con poder de agencia; perspectivas de profesionales sobre el rol de la CAA en la promoción de la autodeterminación; evaluación de cómo estas herramientas fortalecen la creencia de control-acción; modalidades de personalización y localización de pictogramas para distintos contextos culturales. |
Nivel 2 – Metamodelo Generativo de Pictogramas e IA | Centrado en el desarrollo de un meta-modelo y un marco computacional para la generación dinámica de pictogramas. | Pipeline de modelo generativo (estructuración de datos, entrenamiento, ajuste fino); reglas de composición visual para la creación modular de pictogramas; editor basado en SVG que habilita interacción y corrección en tiempo real; la IA entendida como “material de diseño” para una representación pictográfica adaptativa. |
Nivel 3 – Colaboración Abierta y Aprendizaje Federado | Plantea un repositorio descentralizado y gestionado por la comunidad para un aprendizaje y enriquecimiento continuo. | Modelos de aprendizaje federado que equilibren personalización y mejoras compartidas; gestión de repositorios y documentación para contribuciones estructuradas; adaptaciones locales (lanzamientos de modelos para distintos contextos culturales); mecanismos curatoriales que definan una gobernanza colaborativa en la estandarización de pictogramas. |
Tabla 1. Enfoque de investigación en tres niveles.
Como toda iniciativa open source con ambición de crecimiento, PictoNet requiere de colaboradores y socios en diversos frentes. Por ello, hago un llamado explícito a investigadores, desarrolladores, artistas y profesionales de la CAA, para que se sumen a la aventura de co-crear un estándar abierto de pictogramas dinámicos y semánticos. Mi plan es conceder privilegios de commit a quienes demuestren un compromiso real y capacidad técnica o creativa, de manera que puedan incidir directamente en la toma de decisiones y en la hoja de ruta. Además, me gustaría fomentar la formación de equipos de trabajo que se dediquen a submodelos culturales o de nicho, dado que la fuerza de la plataforma radica en su capacidad de adaptarse y refinarse según contextos específicos.
La meta final es que PictoNet se convierta, al término de mi doctorado y con la experiencia acumulada, en una plataforma consolidada que trascienda mi propia investigación. Mi tesis servirá para fundamentar y validar la parte metodológica y conceptual de este proceso, pero aspiro a que la iniciativa subsista y evolucione autónomamente, con una comunidad internacional que descubra y potencie nuevos usos. A fin de cuentas, se trata de un espacio de experimentación donde convergen la práctica docente, la investigación en diseño y la voluntad de favorecer la comunicación inclusiva a escala global. Confío en que, a medida que avance en este periodo doctoral, la recursividad social de PictoNet generará un ciclo virtuoso donde cada aporte retroalimenta la plataforma, se registran las mejoras y se acrecienta la reputación de quienes construyen una herramienta de y para la diversidad comunicativa.
Así, mi visión a tres años contempla no sólo la defensa doctoral —respaldada por resultados tangibles en el desarrollo del prototipo y en la adopción de la plataforma por parte de algunos grupos piloto—, sino también la maduración de PictoNet como proyecto autónomo de código abierto. Quiero que la gente pueda acceder a un repositorio con documentación clara, demos funcionales y una comunidad activa que oriente a los nuevos participantes. Me entusiasma la posibilidad de una “red social virtuosa” basada en el intercambio horizontal, la transparencia de los algoritmos y la valoración de las contribuciones. En ese sentido, este punto de partida, todavía en una fase formativa, me ilusiona como semilla de algo más amplio: un bien común digital y colaborativo que trascienda fronteras y lenguas, y que en el proceso siembre la conciencia de que la inteligencia artificial debe estar al servicio de quienes más la requieren para expresarse y comunicarse con la sociedad.
- Generativa pero estadística, sin conocimiento real. Para un purista, un LLM es un subgrupo menor de la IA. ↩
- desde el ADN como principio creador ↩
- Mana, en Tereo Maorí. A esto me refiero con reputación, pero es más qie eso, es respeto, sentido de contribución y por lo tanto de gratitud. ↩
- Modelos compilables a nivel de hardware. Pictonet es un traductor mínimo, un core engine gráfico para la comunicación. ↩
- Esto es un ejemplo del diseño de transición en la era del tecnofeudalismo. ↩