A jam submission

The challenge of Goal Misgeneralization in AI: Causes and SolutionsView game page

Proyecto del grupo Pendiente

Play game

The challenge of Goal Misgeneralization in AI: Causes and Solutions's itch.io page

Results

Criteria	Rank	Score*	Raw Score
Significancia	#1	4.000	4.000
Claridad	#1	5.000	5.000
Overall	#2	3.750	3.750
Validez Técnica	#2	4.500	4.500
Novedad	#12	1.500	1.500

Ranked from 2 ratings. Score is adjusted from raw score by the median number of ratings per game in the jam.

Judge feedback

Judge feedback is anonymous.

- Los ejemplos de GM identificados son razonables - Los autores identifican las causas fundamentales del problema: proxies correlacionados con el objetivo real y falta de variedad en el entorno de entrenamiento - La primera propuesta (reproducir la distribución real durante el entrenamiento) es infactible en la mayoría de casos: los datos reales a menudo son escasos o resultan caros de obtener. Por ejemplo, en robótica uno de los desafíos clave es que hacer pruebas reales con robots es muy caro. - La tercera propuesta parece más apropiada para mitigar el problema de reward misspecification, en el que los humanos no son capaces de proporcionar una función de recompensa correcta. Sin embargo, puede ser útil en combinación con la segunda propuesta para automatizar la evaluación en enormes cantidades de entornos generados procedimentalmente - El sesgo inductivo es un aspecto fundamental del problema que los autores identifican correctamente en la cuarta propuesta. Me habría gustado ver una exploración más profunda de este aspecto. # Evaluación - Significancia: Los autores han realizado un trabajo considerable aclarando ejemplos de GM y las soluciones propuestas atacan directamente las raíces del problema 4/5 - Validez técnica: Aunque en general las propuestas son válidas y tienen una probabilidad alta de ayudar a resolver el problema, tienen algunas limitaciones 4/5 - Claridad: El artículo es comprensible y fácil de leer, explica claramente los problemas y las soluciones propuestas 5/5 - Novedad: Todas las propuestas de los autores se encuentran ya en la literatura sobre este problema. Aunque el artículo es un excelente resumen y recopilación, no he encontrado casi nada novedoso. 1/5

Nombre del equipo
PENDIENTE

Autores
Martín Cooper, Josefina Vivanco, Felipe Carlín, Juan Antonio Guzmán.

Estoy de acuerdo con liberar mi proyecto al dominio público (CC0)

Chile

Comments

No one has posted a comment yet

itch.io

Thinkathon de Seguridad en IA

The challenge of Goal Misgeneralization in AI: Causes and SolutionsView game page

Play game

Results

Judge feedback

Leave a comment

Comments