lunes, 2 febrero, 2026
  • Bienvenidos a Guadared
  • Contacto
  • Publicidad
Guadared
  • Noticias
  • -> Eventos
    • Eventos Taurinos
  • Provincia
    • Alovera
    • Cabanillas
    • El Casar
    • Horche
    • Marchamalo
    • Molina de Aragón
    • Sacedón
    • Sigüenza
    • Trillo
    • Villanueva de la Torre
  • Empresa y Negocio
    • Neting
    • Negocios
    • Tecnología
    • Seguros
  • Deportes
  • Cultura
  • Lifestyle
    • Turismo
    • Gastronomía
    • Viajes
    • Salud
  • Medioambiente
  • Login
No Result
Ver todos los resultados
Guadared
No Result
Ver todos los resultados
Home Tecnología

OpenAI presenta el Safety Evaluations Hub para reforzar la seguridad de sus modelos de inteligencia artificial

🚨 OpenAI lanza el Safety Evaluations Hub, un centro para evaluar la seguridad de sus modelos de #IA. Analizará contenido dañino, jailbreaks y errores en las respuestas. Transparencia y control para una IA más segura. 🔒🤖 #OpenAI #InteligenciaArtificial #GuadaRed

Por Redacción
19 mayo, 2025 - Actualizado el 23 mayo, 2025
en Comunicación, Noticias, Tecnología
A A
OpenAI presenta el Safety Evaluations Hub para reforzar la seguridad de sus modelos de inteligencia artificial
WhatsappCompartir en FacebookCompartir en Twitter

OpenAI lanza un centro para evaluar la seguridad de sus modelos de inteligencia artificial

OpenAI ha dado un paso decisivo en su compromiso con la seguridad y la transparencia al anunciar la creación del Safety Evaluations Hub, un nuevo centro dedicado a la evaluación del comportamiento y el rendimiento de sus modelos de inteligencia artificial.

Este organismo no solo se encargará de realizar análisis técnicos detallados, sino que también compartirá públicamente los resultados, con el objetivo de garantizar un uso responsable y seguro de la tecnología desarrollada por la compañía.

Evaluación rigurosa en cuatro áreas clave

El Safety Evaluations Hub tendrá como misión central examinar el desempeño de los modelos de OpenAI en cuatro ámbitos fundamentales: la generación de contenido dañino, la capacidad de sortear restricciones mediante técnicas de jailbreak, la aparición de alucinaciones (errores factuales en las respuestas) y el cumplimiento de las jerarquías de instrucciones.

De este modo, OpenAI busca fortalecer el control sobre los contenidos y la fiabilidad de las respuestas, minimizando los riesgos asociados al mal uso de sus modelos.

Prevención de usos indebidos y mejora continua

Una de las prioridades del centro será impedir que los modelos respondan a solicitudes que violen las políticas de uso de OpenAI. Asimismo, se trabajará para detectar intentos de manipulación que intenten eludir las protecciones integradas en el sistema.

Otra función destacada del Safety Evaluations Hub será la identificación y corrección de errores en las respuestas generadas por la IA, garantizando que las prioridades establecidas por la compañía se respeten en el tratamiento de las diferentes categorías de mensajes.

Tarjetas de sistema y evolución constante

Las evaluaciones incorporan las llamadas tarjetas de sistema, una herramienta clave que permite documentar las métricas de seguridad aplicadas en cada lanzamiento. Estas tarjetas no solo informan al público sobre el estado actual de los modelos, sino que también sirven como referencia interna para la toma de decisiones sobre nuevas implementaciones.

Desde OpenAI subrayan que el proceso de evaluación está en permanente desarrollo.

“A medida que los modelos se vuelven más capaces y adaptables, los métodos antiguos dejan de ser eficaces para mostrar diferencias significativas. Por ello, actualizamos periódicamente nuestros métodos de evaluación para considerar nuevas modalidades y riesgos emergentes”, explica la compañía en su sitio web oficial.

Con este nuevo centro, OpenAI reafirma su apuesta por una inteligencia artificial segura, transparente y alineada con los valores éticos que rigen el desarrollo tecnológico responsable. GuadaRed, periódico digital de la provincia de Guadalajara, te acerca lo último en innovación y tecnología, manteniéndote siempre informado sobre los avances que están marcando el futuro.

Jailbreaking: qué es, cómo funciona, ventajas, riesgos y si vale la pena en 2025

Apple vs. Google: la guerra por la supremacía en IA en 2025 sacude el mundo tech

7 Conceptos Erróneos sobre la Inteligencia Artificial Generativa y la Protección de Datos (Según la ICO)

WhatsApp incorpora IA de Meta sin comprometer la privacidad: así funciona el procesamiento privado

¿Qué es el secuestro de cookies de sesión y cómo protegerte de este ciberataque?

Cómo Actuar Cuando Tu Navegador Advierte que un Sitio Web No es Seguro: Guía Completa y Consejos de Ciberseguridad

GuadaRed

✅ Comparte esta noticia en tus redes sociales y no te pierdas nada:
📘 Facebook | 🐦 Twitter | 📲 WhatsApp | ✉️ Email | 📢 LinkedIn | WEB
Tags: alucinaciones IAcontenido dañinoerrores factualesevaluación de IAinteligencia artificialjailbreakmodelos de inteligencia artificialOpenAISafety Evaluations Hubseguridad en inteligencia artificialtarjetas de sistema
EnviarCompartir13Tweet8
Noticia Anterior

Día Mundial del Médico de Familia 2025 y la importancia de fortalecer la Atención Primaria

Siguiente Noticia

TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

RelacionadoNoticias

Castilla-La Mancha prepara a sus docentes para combatir las fake news y los riesgos digitales en Primaria
Tecnología

Castilla-La Mancha prepara a sus docentes para combatir las fake news y los riesgos digitales en Primaria

1 febrero, 2026
2.3k
Illana acoge un encuentro de cazadores centrado en la conservación del lince ibérico
Caza

Illana acoge un encuentro de cazadores centrado en la conservación del lince ibérico

1 febrero, 2026
3.2k
José Carlos Venegas protagoniza una nueva edición de “Tercio de Quites” y analiza su regreso a Las Ventas
Tercio de Quites

José Carlos Venegas protagoniza una nueva edición de “Tercio de Quites” y analiza su regreso a Las Ventas

1 febrero, 2026
4.5k
Siguiente Noticia
TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

ELIGE POR CATEGORíAS

DECORA CON MADERA DECORA CON MADERA DECORA CON MADERA

LO MÁS VISTO

  • El Castillo de Zafra, donde la historia de Guadalajara se encontró con Juego de Tronos

    El Castillo de Zafra, donde la historia de Guadalajara se encontró con Juego de Tronos

    435 Compartido
    Compartir 174 Tweet 109
  • Ana Soledad Pascual: Atleta destacada y presidenta del Club Maratón Guadalajara, protagoniza el III Ciclo “Alcarreñas para la historia” en la Biblioteca de Dávalos

    135 Compartido
    Compartir 54 Tweet 34
  • Calendario Laboral Castilla-La Mancha 2026: 12 Días Festivos Oficiales y Festivos Locales

    425 Compartido
    Compartir 170 Tweet 106
  • Un pueblo de Guadalajara introduce nueve bisontes europeos para limpiar el monte y prevenir incendios forestales

    301 Compartido
    Compartir 120 Tweet 75
  • I Ruta del Cocido con más de 25 restaurantes de la capital y la provincia

    362 Compartido
    Compartir 145 Tweet 91

HOLA

Guadared

¡Únete a nosotros en este nuevo camino hacia la difusión de la información y la visibilidad empresarial!
Guadared el nuevo concepto de la comunicación.
redaccion@guadared.com

Noticias Recientes

  • Castilla-La Mancha prepara a sus docentes para combatir las fake news y los riesgos digitales en Primaria
  • Illana acoge un encuentro de cazadores centrado en la conservación del lince ibérico
  • José Carlos Venegas protagoniza una nueva edición de “Tercio de Quites” y analiza su regreso a Las Ventas

Categorias

Noticias Recientes

Castilla-La Mancha prepara a sus docentes para combatir las fake news y los riesgos digitales en Primaria

Castilla-La Mancha prepara a sus docentes para combatir las fake news y los riesgos digitales en Primaria

1 febrero, 2026
Illana acoge un encuentro de cazadores centrado en la conservación del lince ibérico

Illana acoge un encuentro de cazadores centrado en la conservación del lince ibérico

1 febrero, 2026
  • Bienvenidos a Guadared
  • Contacto
  • Publicidad

© 2023 GUADARED®

Bienvenid@ Amig@!!!

Inicie sesión en su cuenta a continuación

¿Olvidaste tu contraseña?

Recupera tu contraseña

Ingrese su nombre de usuario o dirección de correo electrónico para restablecer su contraseña.

Acceder
No Result
Ver todos los resultados
  • Home
  • Eventos
    • Eventos Taurinos
  • Noticias
    • Empresa y Negocio
    • Cultura
    • Deportes
  • Lifestyle
  • Opinion

© 2023 GUADARED®