OpenAI lanza GDPval, una nueva herramienta para medir cómo la inteligencia artificial desempeña tareas del mundo laboral real en industrias clave de Estados Unidos, con resultados que reflejan su impacto práctico en la sociedad.

A diferencia de las evaluaciones académicas tradicionales, #GDPval se enfoca en tareas que simulan trabajos auténticos en 44 ocupaciones relacionadas con las principales industrias del país, incluyendo sectores como legal, ingeniería, salud y administración.
Supuestamente, esta herramienta permite analizar el desempeño de los modelos de IA en la generación de documentos, planos, informes y hojas de cálculo, que son actividades esenciales en estos ámbitos laborales.
En lugar de limitarse a responder preguntas o resolver problemas académicos, GDPval mide cómo la IA produce resultados que podrían tener un impacto directo en la productividad y eficiencia de las empresas.
El enfoque de esta evaluación busca ofrecer una visión más realista y práctica del avance de la inteligencia artificial, ayudando a entender no solo su capacidad técnica, sino también su utilidad en tareas cotidianas que requieren precisión y conocimiento especializado.
Según supuestamente fuentes cercanas a OpenAI, este método permite seguir el progreso en la mejora de las IA en tareas que generan valor económico, lo cual resulta fundamental para su integración en el mercado laboral.
El lanzamiento de GDPval se produce en un contexto en el que las empresas tecnológicas compiten por liderar la próxima generación de IA
El lanzamiento de GDPval se produce en un contexto en el que las empresas tecnológicas compiten por liderar la próxima generación de IA, con inversiones millonarias en investigación y desarrollo.
La evaluación también podría influir en la regulación futura, ya que proporciona datos concretos sobre el impacto social y económico de estas tecnologías.
Por otro lado, #OpenAI también anunció la llegada de una actualización para Gemini 2.5, que supuestamente mejora la comprensión de imágenes, la organización de respuestas y la eficiencia del sistema. Aunque no se han divulgado detalles específicos, se espera que estas mejoras permitan que la IA sea aún más útil en tareas complejas y en la interacción con los usuarios.
En definitiva, GDPval representa un paso importante hacia la evaluación más práctica y realista de las capacidades de la inteligencia artificial, alineándose con la tendencia global de integrar estas tecnologías en ámbitos que afectan directamente la economía y la sociedad.