El Guardián del Laberinto Adaptativo: Un reto de IA

in #tarea10 days ago (edited)

El Guardián del Laberinto Adaptativo: Un reto de IA

Autor: @ferjuarez
Fecha: 13/01/2026
Materia: Programación de Entornos Virtuales
Profesor: @frexus

Caso de estudio

He leído y analizado el caso publicado por el profesor:
[Enlace al caso de estudio] (https://steemit.com/educacion/@frexus/el-guardian-del-laberinto-adaptativo-un-reto-de-ia)

En esta ocasión se presenta un reto en el que se debe reflexionar un poco sobre el como funciona una IA y se plantea una situación hipotética con un avatar en una fábrica.


Reflexión personal

1. Elige tu "Cerebro" (Selección de Librería)
Si tuvieras que elegir una herramienta para dar vida a este avatar en el entorno virtual, ¿cuál elegirías y por qué?

Elegiría ML-Agents (Unity) porque considero que el avatar aunque requiere aprender de su entorno no necesita demasiado crear redes neuronales complejas.


2. El Mapa de Datos (Instalación e Integración)
Imagina que la librería de IA es un "GPS externo" que no puede ver el mundo físico. Tú debes enviarle los datos correctos para que tome decisiones.

Responde: ¿Qué información específica debe enviarle el entorno virtual a la IA en cada segundo para evitar colisiones?

Creo que en el aspecto físico el avatar necesita recibir su lugar exacto en el mapa que vaya armando en su memoria, cosas que hay en su rango de visión, personas que van pasando, entre otras.


3. El Sistema de Premios (Entrenamiento)
La IA moderna aprende mediante un sistema de Recompensas y Castigos (Reinforcement Learning). Como si estuvieras entrenando a una mascota digital, tú defines las reglas del éxito.

Define tu sistema de puntuación:

  1. Premio: ¿Cuántos puntos le otorgas al agente por recoger un paquete con éxito?

Dependiendo del tiempo que se haya tardado de 5 a 10 puntos.

  1. Castigo: ¿Cuántos puntos le restas por chocar contra un muro o un obstáculo?

Le restaría 3 puntos.

  1. El Dilema de la Inactividad: ¿Qué pasa si el agente decide quedarse quieto para evitar chocar y así no perder puntos? ¿Cómo lo castigarías o incentivarías para que se mantenga en movimiento?

Le quitaría 3 puntos por cada 5 min. que esté en inactividad.


Preguntas de Reflexión (Evaluación Diagnóstica)

A continuación, se presentan seis preguntas diseñadas para medir el nivel de abstracción y conocimientos previos.

  1. Diferenciación Conceptual: ¿Cuál es la diferencia fundamental entre un personaje programado mediante scripts de decisión lógica simple (ej. if-else) y uno que opera bajo un modelo de Inteligencia Artificial dentro de un entorno virtual?

Que uno hecho con programación simple sólo está preparado para escenarios determinados pero el hecho con inteligencia artificial puede responder a múltiples escenarios a medida que aprende.

  1. Percepción de Entorno: Para que la IA pueda tomar decisiones dentro del escenario virtual, ¿qué tipo de datos o "sensores digitales" creen que el avatar debe extraer del entorno (coordenadas, vectores de visión, detección de colisiones) y cómo se procesan estos datos?

No estoy muy segura de como funciona realmente pero tengo la idea de que tiene que comprender en que lugar del espacio dado está, dónde están los paquetes, cuantos quedan, dónde debe ponerlos, entre otras cosas.

  1. Selección e Integración de Herramientas: Al elegir una librería de IA (como ML-Agents o TensorFlow), ¿qué criterios técnicos consideran que son más importantes para garantizar que la integración con el motor sea estable y no afecte el rendimiento (FPS) de la simulación?

Que no deba procesar demasiados datos a la vez, de lo contrario afectará el rendimiento y disminuirá la productividad.

  1. Proceso de Aprendizaje: ¿Cómo se diferencia, desde su perspectiva, un entorno virtual diseñado para uso humano de uno diseñado específicamente para entrenar a una IA mediante el método de prueba y error?

El entorno para humanos sólo debe cumplir con requerimientos específicos, el hecho para entrar una IA a pesar de que debe cumplir requisitos también estará en constante cambio y mantenimiento, pues necesita ajustarse a las necesidades que se vayan presentando.

  1. Mantenimiento y Pruebas: Si tras instalar e integrar la librería, el avatar comienza a girar sobre su propio eje sin avanzar, ¿cuál sería su metodología lógica para identificar si el error está en la configuración de la librería, en la física del entorno virtual o en los datos de entrada?

Empezaría revisando que es lo aspecto controla el movimientos del avatar y descartaría lo que funcione correctamente hasta dar con el problema.

  1. Impacto de la Incertidumbre: En un entorno virtual, las decisiones rara vez son "blanco o negro". ¿Cómo creen que se podría programar a un avatar para que tome decisiones basadas en grados de verdad? (Ej. decidir si cruzar un obstáculo cuando la batería está "moderadamente baja" e intentar llegar al objetivo que está "algo lejos").

Dependiendo del tipo de situación que pueda catalogar el grado de riesgo que representa una situación como esa, por ejemplo, la batería completamente cargada puede representar 10 u, una batería baja puede representar 100 u, luego, una distancia larga puede ser 50 u y cruzar un obstáculo sería 40 u, al sumar todas las u el avatar puede darse cuenta que hay mucho riesgo de tomar esa decisión y elegir otro opción.


Conclusiones finales

Aprendizaje obtenido:

He comprendido un poco mejor como funciona una IA.

Dificultades enfrentadas:

Me costó poder responder las preguntas técnicas porque no tengo desconozco mucho del tema.


Backlinks y referencias


Este post forma parte de la actividad de aprendizaje correspondiente a la unidad 1.
Publicación realizada con fines educativos como parte del curso de [Programación de Entornos Virtuales].