viernes, 5 diciembre, 2025
  • Bienvenidos a Guadared
  • Contacto
Guadared
  • Noticias
  • -> Eventos
    • Eventos Taurinos
  • Provincia
    • Alovera
    • Cabanillas
    • El Casar
    • Horche
    • Marchamalo
    • Molina de Aragón
    • Sacedón
    • Sigüenza
    • Trillo
    • Villanueva de la Torre
  • Empresa y Negocio
    • Neting
    • Negocios
    • Tecnología
    • Seguros
  • Deportes
  • Cultura
  • Lifestyle
    • Turismo
    • Gastronomía
    • Viajes
    • Salud
  • Medioambiente
  • Login
No Result
Ver todos los resultados
Guadared
No Result
Ver todos los resultados
Home Tecnología

OpenAI presenta el Safety Evaluations Hub para reforzar la seguridad de sus modelos de inteligencia artificial

🚨 OpenAI lanza el Safety Evaluations Hub, un centro para evaluar la seguridad de sus modelos de #IA. Analizará contenido dañino, jailbreaks y errores en las respuestas. Transparencia y control para una IA más segura. 🔒🤖 #OpenAI #InteligenciaArtificial #GuadaRed

Por Redacción
19 mayo, 2025 - Actualizado el 23 mayo, 2025
en Comunicación, Noticias, Tecnología
A A
OpenAI presenta el Safety Evaluations Hub para reforzar la seguridad de sus modelos de inteligencia artificial
WhatsappCompartir en FacebookCompartir en Twitter

OpenAI lanza un centro para evaluar la seguridad de sus modelos de inteligencia artificial

OpenAI ha dado un paso decisivo en su compromiso con la seguridad y la transparencia al anunciar la creación del Safety Evaluations Hub, un nuevo centro dedicado a la evaluación del comportamiento y el rendimiento de sus modelos de inteligencia artificial.

Este organismo no solo se encargará de realizar análisis técnicos detallados, sino que también compartirá públicamente los resultados, con el objetivo de garantizar un uso responsable y seguro de la tecnología desarrollada por la compañía.

Evaluación rigurosa en cuatro áreas clave

El Safety Evaluations Hub tendrá como misión central examinar el desempeño de los modelos de OpenAI en cuatro ámbitos fundamentales: la generación de contenido dañino, la capacidad de sortear restricciones mediante técnicas de jailbreak, la aparición de alucinaciones (errores factuales en las respuestas) y el cumplimiento de las jerarquías de instrucciones.

De este modo, OpenAI busca fortalecer el control sobre los contenidos y la fiabilidad de las respuestas, minimizando los riesgos asociados al mal uso de sus modelos.

Prevención de usos indebidos y mejora continua

Una de las prioridades del centro será impedir que los modelos respondan a solicitudes que violen las políticas de uso de OpenAI. Asimismo, se trabajará para detectar intentos de manipulación que intenten eludir las protecciones integradas en el sistema.

Otra función destacada del Safety Evaluations Hub será la identificación y corrección de errores en las respuestas generadas por la IA, garantizando que las prioridades establecidas por la compañía se respeten en el tratamiento de las diferentes categorías de mensajes.

CESTAS SOLIDARIAS NIPACE CESTAS SOLIDARIAS NIPACE CESTAS SOLIDARIAS NIPACE

Tarjetas de sistema y evolución constante

Las evaluaciones incorporan las llamadas tarjetas de sistema, una herramienta clave que permite documentar las métricas de seguridad aplicadas en cada lanzamiento. Estas tarjetas no solo informan al público sobre el estado actual de los modelos, sino que también sirven como referencia interna para la toma de decisiones sobre nuevas implementaciones.

Desde OpenAI subrayan que el proceso de evaluación está en permanente desarrollo.

“A medida que los modelos se vuelven más capaces y adaptables, los métodos antiguos dejan de ser eficaces para mostrar diferencias significativas. Por ello, actualizamos periódicamente nuestros métodos de evaluación para considerar nuevas modalidades y riesgos emergentes”, explica la compañía en su sitio web oficial.

Con este nuevo centro, OpenAI reafirma su apuesta por una inteligencia artificial segura, transparente y alineada con los valores éticos que rigen el desarrollo tecnológico responsable. GuadaRed, periódico digital de la provincia de Guadalajara, te acerca lo último en innovación y tecnología, manteniéndote siempre informado sobre los avances que están marcando el futuro.

Jailbreaking: qué es, cómo funciona, ventajas, riesgos y si vale la pena en 2025

Apple vs. Google: la guerra por la supremacía en IA en 2025 sacude el mundo tech

7 Conceptos Erróneos sobre la Inteligencia Artificial Generativa y la Protección de Datos (Según la ICO)

WhatsApp incorpora IA de Meta sin comprometer la privacidad: así funciona el procesamiento privado

¿Qué es el secuestro de cookies de sesión y cómo protegerte de este ciberataque?

Cómo Actuar Cuando Tu Navegador Advierte que un Sitio Web No es Seguro: Guía Completa y Consejos de Ciberseguridad

GuadaRed

✅ Comparte esta noticia en tus redes sociales y no te pierdas nada:
📘 Facebook | 🐦 Twitter | 📲 WhatsApp | ✉️ Email | 📢 LinkedIn | WEB
Tags: alucinaciones IAcontenido dañinoerrores factualesevaluación de IAinteligencia artificialjailbreakmodelos de inteligencia artificialOpenAISafety Evaluations Hubseguridad en inteligencia artificialtarjetas de sistema
EnviarCompartir13Tweet8
Noticia Anterior

Día Mundial del Médico de Familia 2025 y la importancia de fortalecer la Atención Primaria

Siguiente Noticia

TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

RelacionadoNoticias

Primeros Auxilios Digitales: Qué Hacer Tras un Ciberataque
Branded Content

Primeros Auxilios Digitales: Cómo Actuar Ante un Ciberataque y Proteger tu Empresa

5 diciembre, 2025
8.9k
Sanicentro BM Guadalajara estrena equipación azul para partido clave contra Bada Huesca en Liga ASOBAL
BM Guadalajara

Sanicentro BM Guadalajara estrena equipación azul para partido clave contra Bada Huesca en Liga ASOBAL

4 diciembre, 2025 - Actualizado el 5 diciembre, 2025
5.5k
Concierto Benéfico "Spin Gospel" en Guadalajara a Favor de Manos Unidas para Construir una Maternidad en Zambia
Concierto

Concierto Benéfico “Spin Gospel” en Guadalajara a Favor de Manos Unidas para Construir una Maternidad en Zambia

4 diciembre, 2025
5.9k
Siguiente Noticia
TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

TOC TOC en El Casar: comedia sobre salud mental, humor y teatro local

ELIGE POR CATEGORíAS

CESTAS NAVIDAD SOLIDARIAS
DECORA CON MADERA DECORA CON MADERA DECORA CON MADERA

LO MÁS VISTO

  • Calendario Laboral Castilla-La Mancha 2026: 12 Días Festivos Oficiales y Festivos Locales

    Calendario Laboral Castilla-La Mancha 2026: 12 Días Festivos Oficiales y Festivos Locales

    355 Compartido
    Compartir 142 Tweet 89
  • ATICA y Juriscaza logran una sentencia histórica en defensa de los cazadores de la Sierra Norte

    163 Compartido
    Compartir 65 Tweet 41
  • Programa de Navidad 2025 en Espinosa de Henares: Actividades, Tradiciones y Magia

    312 Compartido
    Compartir 125 Tweet 78
  • La RFEF corrige una actuación “sin garantías” de la Federación Castellano-Manchega y obliga a mantener la fecha original del Marchamalo–Pedroñeras

    551 Compartido
    Compartir 220 Tweet 138
  • Programa de Navidad 2025 en Guadalajara

    262 Compartido
    Compartir 105 Tweet 66

HOLA

Guadared

¡Únete a nosotros en este nuevo camino hacia la difusión de la información y la visibilidad empresarial!
Guadared el nuevo concepto de la comunicación.
redaccion@guadared.com

Noticias Recientes

  • Primeros Auxilios Digitales: Cómo Actuar Ante un Ciberataque y Proteger tu Empresa
  • Sanicentro BM Guadalajara estrena equipación azul para partido clave contra Bada Huesca en Liga ASOBAL
  • Concierto Benéfico “Spin Gospel” en Guadalajara a Favor de Manos Unidas para Construir una Maternidad en Zambia

Categorias

Noticias Recientes

Primeros Auxilios Digitales: Qué Hacer Tras un Ciberataque

Primeros Auxilios Digitales: Cómo Actuar Ante un Ciberataque y Proteger tu Empresa

5 diciembre, 2025
Sanicentro BM Guadalajara estrena equipación azul para partido clave contra Bada Huesca en Liga ASOBAL

Sanicentro BM Guadalajara estrena equipación azul para partido clave contra Bada Huesca en Liga ASOBAL

4 diciembre, 2025 - Actualizado el 5 diciembre, 2025
  • Bienvenidos a Guadared
  • Contacto

© 2023 GUADARED®

Bienvenid@ Amig@!!!

Inicie sesión en su cuenta a continuación

¿Olvidaste tu contraseña?

Recupera tu contraseña

Ingrese su nombre de usuario o dirección de correo electrónico para restablecer su contraseña.

Acceder
No Result
Ver todos los resultados
  • Home
  • Eventos
    • Eventos Taurinos
  • Noticias
    • Empresa y Negocio
    • Cultura
    • Deportes
  • Lifestyle
  • Opinion

© 2023 GUADARED®