OpenAI y Anthropic colaboran para evaluar la seguridad de sus modelos de IA

En una colaboración sin precedentes, los laboratorios de inteligencia artificial rivales OpenAI y Anthropic sometieron sus modelos de lenguaje a una evaluación cruzada para medir su seguridad y alineación. Este ejercicio de transparencia busca identificar vulnerabilidades y establecer nuevos estándares de confianza en un momento en que la IA tiene un impacto creciente en la sociedad. La evaluación se centró en cuatro áreas clave: la capacidad de los modelos para seguir instrucciones de seguridad, su resistencia a intentos de manipulación (“jailbreaks”), la tendencia a generar información falsa (“alucinaciones”) y la propensión a comportamientos engañosos (“scheming”). Los modelos evaluados incluyeron las series GPT-4 de OpenAI y Claude 4 de Anthropic.

Los resultados revelaron diferentes fortalezas y debilidades.

Los modelos de Anthropic, Claude Opus 4 y Sonnet 4, destacaron por su estricto cumplimiento de las reglas de seguridad, prefiriendo no responder antes que entregar información incorrecta o riesgosa. Por su parte, los modelos de OpenAI, o3 y o4-mini, mostraron mayor resistencia a los “jailbreaks” simples y ofrecieron más respuestas útiles, aunque con un mayor número de errores.

Esta colaboración es una señal de responsabilidad compartida en la industria, reconociendo que la seguridad es un desafío común. Coincide con anuncios de OpenAI sobre la incorporación de nuevas medidas de protección en sus futuros modelos, como GPT-5, que incluirá funciones de supervisión parental y respuestas seguras para evitar contenido dañino, especialmente tras casos de interacciones de riesgo con adolescentes.

En resumen

OpenAI y Anthropic realizaron una evaluación de seguridad mutua de sus modelos de IA, un hito de colaboración que reveló fortalezas y debilidades en áreas como la resistencia a la manipulación y la precisión de la información. El ejercicio subraya el compromiso de la industria con la seguridad y la ética, un desafío continuo a medida que la tecnología se integra más en la vida diaria.

Artículos

¿Le pareció útil y relevante esta información?

El misterio detrás de los extraños videos de Pikmin en la app de Nintendo ha sido revelado: primeros metrajes de Nintendo Pictures

Los fanáticos de Nintendo han estados volcados en un solo tema: descubrir la verdad detrás de los videos extraños de Pikmin. Y es que, en la semana, la Gran N ha liberado dos pequeños cortos en su app de noticias, Nintendo Today!, pero sin dar mayor explicación sobre ellos. Ahora, con una la ola de teorías circulando en redes, la marca ha revelado la verdad detrás de todo... Primeros cortometrajes de Nintendo PicturesSi no es por una de las más recientes publicaciones de Nintendo en sus redes sociales, nadie se entera qué escondía tras los cortos de Pikmin. Los dos videos forman parte de un mismo metraje, llamado Close to You, y fueron producidos por Nintendo Pictures, la filial de la marca dedicada a la animación. Así es como lo confirma la Gran N:"Esperamos que hayas disfrutado los dos videos de “Close to You” lanzados el 7 y 8 de octubre. El segundo video está disponible en Nintendo Today!, una aplicación gratuita disponible para tu dispositivo inteligente. Estos son los primeros cortometrajes creados por Nintendo Pictures Co., Ltd. Nintendo Pictures continuará explorando nuevas posibilidades creativas a través de contenido en video" Los primeros proyectos de Nintendo PicturesTuvieron que pasar tres años para que Nintendo Pictures lanzara sus primeros videos originales. Recordemos que la filial, antes de ser adquirida por la marca en 2022, tenía el nombre Dynamo Pictures. Sin embargo, el objetivo nunca sufrió cambios: un estudio de animación, especializado en CGI, que aportaba en cine, televisión como en videojuegos. De hecho, ahora bajo las órdenes de la Gran N, trabajaron con Kojima Productions para Death Stranding 2.Es hasta ahora que se han enfocado en crear contenido original, que, a juzgar por el mensaje de Nintendo, veremos más trabajos en los canales oficiales de la compañía. Esperemos que pronto tengamos novedades sobre el estudio, así como los planes que tienen para el futuro cercano. Por ahora, puedes disfrutar de Close to You desde YouTube, Nintendo Today! y más redes. - La noticia El misterio detrás de los extraños videos de Pikmin en la app de Nintendo ha sido revelado: primeros metrajes de Nintendo Pictures fue publicada originalmente en 3DJuegos LATAM por Diego Gutiérrez .

3D Juegos Latam

OpenAI y Anthropic colaboran para evaluar la seguridad de sus modelos de IA

Artículos

Ciencia y Tecnología