Статья Anthropic «Небольшое количество образцов может отравить LLM любого размера» объясняет, что внедрение около 250 тщательно составленных документов в обучающий корпус заставляет модель развить спящее поведение, которое может быть активировано определенным триггером.
Их вывод заключается в том, что небольшое, фиксированное количество вредоносных образцовможет внедрить бэкдор вбольшие языковые модели (LLM), независимо от их размера.
Интересна моделями и описанием (с примерами) различный инструментов, которые на сайте регулярно используются - кредитные деривативы, включая кредитные дефолтные свопы (CDS) и облигации, обеспеченные долговыми обязательствами (CDO) и т.п.
Адъюнкт-профессора США сталкиваются с низкой зарплатой и удлинённым рабочим днём, не получают страховок и полноценных зарплат. Некоторые из них, опасаясь оказаться на улице, прибегают к отчаянным мерам