OpenAI lanza un centro para evaluar la seguridad de sus modelos de inteligencia artificial

OpenAI ha dado un paso decisivo en su compromiso con la seguridad y la transparencia al anunciar la creación del Safety Evaluations Hub, un nuevo centro dedicado a la evaluación del comportamiento y el rendimiento de sus modelos de inteligencia artificial.

Este organismo no solo se encargará de realizar análisis técnicos detallados, sino que también compartirá públicamente los resultados, con el objetivo de garantizar un uso responsable y seguro de la tecnología desarrollada por la compañía.

Evaluación rigurosa en cuatro áreas clave

El Safety Evaluations Hub tendrá como misión central examinar el desempeño de los modelos de OpenAI en cuatro ámbitos fundamentales: la generación de contenido dañino, la capacidad de sortear restricciones mediante técnicas de jailbreak, la aparición de alucinaciones (errores factuales en las respuestas) y el cumplimiento de las jerarquías de instrucciones.

De este modo, OpenAI busca fortalecer el control sobre los contenidos y la fiabilidad de las respuestas, minimizando los riesgos asociados al mal uso de sus modelos.

Prevención de usos indebidos y mejora continua

Una de las prioridades del centro será impedir que los modelos respondan a solicitudes que violen las políticas de uso de OpenAI. Asimismo, se trabajará para detectar intentos de manipulación que intenten eludir las protecciones integradas en el sistema.

Otra función destacada del Safety Evaluations Hub será la identificación y corrección de errores en las respuestas generadas por la IA, garantizando que las prioridades establecidas por la compañía se respeten en el tratamiento de las diferentes categorías de mensajes.

Tarjetas de sistema y evolución constante

Las evaluaciones incorporan las llamadas tarjetas de sistema, una herramienta clave que permite documentar las métricas de seguridad aplicadas en cada lanzamiento. Estas tarjetas no solo informan al público sobre el estado actual de los modelos, sino que también sirven como referencia interna para la toma de decisiones sobre nuevas implementaciones.

Desde OpenAI subrayan que el proceso de evaluación está en permanente desarrollo.

“A medida que los modelos se vuelven más capaces y adaptables, los métodos antiguos dejan de ser eficaces para mostrar diferencias significativas. Por ello, actualizamos periódicamente nuestros métodos de evaluación para considerar nuevas modalidades y riesgos emergentes”, explica la compañía en su sitio web oficial.

Con este nuevo centro, OpenAI reafirma su apuesta por una inteligencia artificial segura, transparente y alineada con los valores éticos que rigen el desarrollo tecnológico responsable. GuadaRed, periódico digital de la provincia de Guadalajara, te acerca lo último en innovación y tecnología, manteniéndote siempre informado sobre los avances que están marcando el futuro.

Jailbreaking: qué es, cómo funciona, ventajas, riesgos y si vale la pena en 2025

Apple vs. Google: la guerra por la supremacía en IA en 2025 sacude el mundo tech

7 Conceptos Erróneos sobre la Inteligencia Artificial Generativa y la Protección de Datos (Según la ICO)

WhatsApp incorpora IA de Meta sin comprometer la privacidad: así funciona el procesamiento privado

¿Qué es el secuestro de cookies de sesión y cómo protegerte de este ciberataque?

Cómo Actuar Cuando Tu Navegador Advierte que un Sitio Web No es Seguro: Guía Completa y Consejos de Ciberseguridad

✅ Comparte esta noticia en tus redes sociales y no te pierdas nada:
📘 Facebook | 🐦 Twitter | 📲 WhatsApp | ✉️ Email | 📢 LinkedIn | WEB

Tags: alucinaciones IA contenido dañino errores factuales evaluación de IA inteligencia artificial jailbreak modelos de inteligencia artificial OpenAI Safety Evaluations Hub seguridad en inteligencia artificial tarjetas de sistema

OpenAI presenta el Safety Evaluations Hub para reforzar la seguridad de sus modelos de inteligencia artificial

🚨 OpenAI lanza el Safety Evaluations Hub, un centro para evaluar la seguridad de sus modelos de #IA. Analizará contenido dañino, jailbreaks y errores en las respuestas. Transparencia y control para una IA más segura. 🔒🤖 #OpenAI #InteligenciaArtificial #GuadaRed

Día Mundial del Médico de Familia 2025 y la importancia de fortalecer la Atención Primaria

TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

RelacionadoNoticias

Castilla-La Mancha prepara a sus docentes para combatir las fake news y los riesgos digitales en Primaria

Illana acoge un encuentro de cazadores centrado en la conservación del lince ibérico

José Carlos Venegas protagoniza una nueva edición de “Tercio de Quites” y analiza su regreso a Las Ventas

TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

ELIGE POR CATEGORíAS

LO MÁS VISTO

El Castillo de Zafra, donde la historia de Guadalajara se encontró con Juego de Tronos

Ana Soledad Pascual: Atleta destacada y presidenta del Club Maratón Guadalajara, protagoniza el III Ciclo “Alcarreñas para la historia” en la Biblioteca de Dávalos

Calendario Laboral Castilla-La Mancha 2026: 12 Días Festivos Oficiales y Festivos Locales

Un pueblo de Guadalajara introduce nueve bisontes europeos para limpiar el monte y prevenir incendios forestales

I Ruta del Cocido con más de 25 restaurantes de la capital y la provincia

HOLA

Noticias Recientes

Categorias

Noticias Recientes

Castilla-La Mancha prepara a sus docentes para combatir las fake news y los riesgos digitales en Primaria

Illana acoge un encuentro de cazadores centrado en la conservación del lince ibérico

Bienvenid@ Amig@!!!

Recupera tu contraseña

OpenAI presenta el Safety Evaluations Hub para reforzar la seguridad de sus modelos de inteligencia artificial

🚨 OpenAI lanza el Safety Evaluations Hub, un centro para evaluar la seguridad de sus modelos de #IA. Analizará contenido dañino, jailbreaks y errores en las respuestas. Transparencia y control para una IA más segura. 🔒🤖 #OpenAI #InteligenciaArtificial #GuadaRed

OpenAI lanza un centro para evaluar la seguridad de sus modelos de inteligencia artificial

Evaluación rigurosa en cuatro áreas clave

Prevención de usos indebidos y mejora continua

Tarjetas de sistema y evolución constante

✅ Comparte esta noticia en tus redes sociales y no te pierdas nada:📘 Facebook | 🐦 Twitter | 📲 WhatsApp | ✉️ Email | 📢 LinkedIn | WEB

Día Mundial del Médico de Familia 2025 y la importancia de fortalecer la Atención Primaria

TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

RelacionadoNoticias

ELIGE POR CATEGORíAS

LO MÁS VISTO

HOLA

Noticias Recientes

Categorias

Noticias Recientes

Bienvenid@ Amig@!!!

Recupera tu contraseña

✅ Comparte esta noticia en tus redes sociales y no te pierdas nada:
📘 Facebook | 🐦 Twitter | 📲 WhatsApp | ✉️ Email | 📢 LinkedIn | WEB