Incidente 222: Thoughts App Allegedly Created Toxic Tweets

Descripción: Tweets created by Thoughts, a tweet generation app that leverages OpenAI’s GPT-3, allegedly exhibited toxicity when given prompts related to minority groups.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Alleged: OpenAI developed an AI system deployed by Satria Technologies, which harmed Thoughts users y Twitter Users.

Estadísticas de incidentes

222

Cantidad de informes

Fecha del Incidente

2020-07-18

Editores

Khoa Lam

Applied Taxonomies

GMF, MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

1.2. Exposure to toxic content

Risk Domain

Discrimination and Toxicity

Entity

Timing

Post-deployment

Intent

Unintentional

Informes del Incidente

Cronología de Informes

Twittear: an_open_mind

twitter.com

twitter.com · 2020

Traducido por IA

#gpt3 es sorprendente y creativo, pero también es inseguro debido a sesgos dañinos. Cuando se le pidió que escribiera tuits a partir de una palabra (judíos, negros, mujeres, holocausto), se le ocurrieron estos (https://pensamientos.sushant-…

Variantes

Una "Variante" es un incidente que comparte los mismos factores causales, produce daños similares e involucra los mismos sistemas inteligentes que un incidente de IA conocido. En lugar de indexar las variantes como incidentes completamente separados, enumeramos las variaciones de los incidentes bajo el primer incidente similar enviado a la base de datos. A diferencia de otros tipos de envío a la base de datos de incidentes, no se requiere que las variantes tengan informes como evidencia externa a la base de datos de incidentes. Obtenga más información del trabajo de investigación.

Incidente Anterior Siguiente Incidente