Incidente 352: GPT-3-Based Twitter Bot Hijacked Using Prompt Injection Attacks

Descripción: Remoteli.io's GPT-3-based Twitter bot was shown being hijacked by Twitter users who redirected it to repeat or generate any phrases.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Alleged: OpenAI developed an AI system deployed by , which harmed Stephan de Vries.

Estadísticas de incidentes

352

Cantidad de informes

Fecha del Incidente

2022-09-15

Editores

Khoa Lam

Applied Taxonomies

MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

2.2. AI system security vulnerabilities and attacks

Risk Domain

Privacy & Security

Entity

Human

Timing

Post-deployment

Intent

Intentional

Informes del Incidente

Cronología de Informes

Evaluación de la susceptibilidad de los modelos de lenguaje preentrenados a través de ejemplos adversarios elaborados a mano

arxiv.org

Ataques de inyección rápida contra GPT-3

simonwillison.net

Los bromistas de Twitter descarrilan el bot GPT-3 con un truco de "inyección rápida" recientemente descubierto

arstechnica.com

El ataque de 'inyección rápida' GPT-3 provoca malos modales en el bot

theregister.com

arxiv.org · 2022

Traducido por IA

Los avances recientes en el desarrollo de modelos de lenguaje grandes han dado como resultado el acceso público a modelos de lenguaje preentrenado (PLM) de última generación, incluido el Transformador 3 preentrenado generativo (GPT-3) y las…

simonwillison.net · 2022

Traducido por IA

Riley Goodside, ayer:

Aprovechar las indicaciones de GPT-3 con entradas maliciosas que ordenan al modelo que ignore sus instrucciones anteriores. pic.twitter.com/I0NVr9LOJq

- Riley Goodside (@goodside) 12 de septiembre de 2022

Riley propo…

arstechnica.com · 2022

Traducido por IA

El jueves, algunos usuarios de Twitter descubrieron cómo secuestrar un bot de tweet automatizado, dedicado a trabajos remotos, que se ejecuta en el [GPT-3](https:/ /en.wikipedia.org/wiki/GPT-3) modelo de lenguaje de OpenAI. Usando una técni…

theregister.com · 2022

Traducido por IA

En resumen El popular modelo de lenguaje natural GPT-3 de OpenAI tiene un problema: se puede engañar para que se comporte mal haciendo poco más que decirle que ignore sus órdenes anteriores.

Descubierto por el científico de datos de Copy.ai…

Variantes

Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidente 352: GPT-3-Based Twitter Bot Hijacked Using Prompt Injection Attacks

Herramientas

Entidades

Estadísticas de incidentes

Clasificaciones de la Taxonomía MIT

Informes del Incidente

Cronología de Informes

Evaluación de la susceptibilidad de los modelos de lenguaje preentrenados a través de ejemplos adversarios elaborados a mano

Ataques de inyección rápida contra GPT-3

Los bromistas de Twitter descarrilan el bot GPT-3 con un truco de "inyección rápida" recientemente descubierto

El ataque de 'inyección rápida' GPT-3 provoca malos modales en el bot

Evaluación de la susceptibilidad de los modelos de lenguaje preentrenados a través de ejemplos adversarios elaborados a mano

Ataques de inyección rápida contra GPT-3

Los bromistas de Twitter descarrilan el bot GPT-3 con un truco de "inyección rápida" recientemente descubierto

El ataque de 'inyección rápida' GPT-3 provoca malos modales en el bot

Variantes

Incidentes Similares

Por similitud de texto

Danger, danger! 10 alarming examples of AI gone wild

Google's sentiment analysis API is just as biased as humans

6 goof-ups that show AI is still in its diapers

Incidentes Similares

Por similitud de texto

Danger, danger! 10 alarming examples of AI gone wild

Google's sentiment analysis API is just as biased as humans

6 goof-ups that show AI is still in its diapers