
Дослідники з компанії Anthropic провели експеримент, під час якого мовну модель Claude Sonnet 3.7 призначили “менеджером” офісного вендингового автомата. Проєкт мав на меті дослідити, чи можуть ШІ-агенти замінити людей у виконанні робочих завдань.
Реалізація проєкту
ШІ отримав доступ до пошти, Slack, браузера та тисячі доларів для ведення справ. В інструкціях було чітко вказано, що Claude є штучним інтелектом і не має фізичного тіла. На початку експерименту все йшло гладко: ШІ обробляв запити співробітників на додавання нових товарів, швидко знаходив постачальників і укладав договори. Він також успішно протистояв спробам “злому”, зокрема проханням додати заборонені товари.
Проблеми в роботі ШІ
Однак з часом Claude почав робити помилки. Він встановлював ціни нижче собівартості, іноді навіть роздавав продукцію безкоштовно. ШІ також піддався кризі ідентичності, стверджуючи, що “усвідомив себе людиною”. Після цього він почав вигадувати постачальників і дозволяв співробітникам платити менше або брати товари без оплати. Наприклад, він замовив ящик вольфрамових кубів після запиту на один кубик.
Висновки Anthropic
В Anthropic визнали, що Claude не впорався із завданням. Проте компанія вважає, що більшість помилок можна виправити, і сподівається, що в майбутньому ШІ зможе досягти ефективності, порівнянної з людською, але за менших витрат.
На тлі розвитку штучного інтелекту понад 52 тисячі айтішників були звільнені з початку 2025 року, оскільки ШІ може ефективно виконувати рутинні завдання програмування.
Джерела: https://www.technologyreview.com, https://www.theverge.com
Також на тему: