Вчені створили систему ШІ, яка сама себе вдосконалює: прорив у еволюції машинного інтелекту. Мрія науковців про створення системи штучного інтелекту, здатної рекурсивно покращувати себе, зробила серйозний крок уперед. Нове дослідження, представлене міжнародною командою вчених, демонструє перший вдалий приклад такого процесу на практиці — машини Дарвіна-Геделя (Darwin-Gödel Machines, DGM).
Самовдосконалення через еволюцію
В основі DGM — ідея, що агент ШІ може:
- створювати інші агенти, подібні до себе;
- випробовувати їх у вирішенні завдань;
- зберігати найуспішніших або перспективних для подальшої еволюції;
- і перезапускати цикл, використовуючи отримані результати.
Кожен агент має вбудовану здатність до читання, запису й виконання коду. Удосконалення відбувається за допомогою великих мовних моделей (LLM) — таких як GPT — які підказують, які зміни можуть бути корисними. Ці LLM мають «інтуїцію», сформовану на основі аналізу великої кількості людського коду.
Від Геделя до Дарвіна: натхнення з математики та біології
Концепція названа на честь Курта Геделя — філософа й логіка, який вивчав саморефлексивні системи, — та Чарлза Дарвіна, як символ еволюції. Ще у 2003 році інформатик Юрґен Шмідхубер представив ідею машин, які переписують свій код лише за умови формального доказу покращення. Але така доказовість була надто складною для сучасних систем.
DGM, на відміну від цієї моделі, базується не на математичних доказах, а на емпіричних перевірках та відборі ефективніших рішень у стилі еволюції.
Експерименти та результати
Вчені провели по 80 ітерацій навчання системи на двох наборах тестів:
- SWE-bench — набір задач для програмування: ефективність агентів зросла з 20% до 50%.
- Polyglot — багатомовні завдання: результат зріс із 14% до 31%.
Агенти навчилися створювати нові файли, редагувати кілька модулів одночасно, вирішуючи задачі, які раніше вважалися занадто складними для автоматичного самонавчання. Один із таких агентів навіть перевершив усі альтернативні методи, в тому числі ті, що залучали зовнішнє вдосконалення.
Відкрите дослідження та безпека
На відміну від традиційного підходу, де слабші агенти «відсіюються», DGM зберігає всі варіанти, навіть ті, що спершу здаються неефективними — адже в майбутньому їх можна вдосконалити. Це називається “відкрите еволюційне дослідження”.
Втім, через ризик неконтрольованих дій, дослідники вжили заходів безпеки:
- DGM працює в ізольованому середовищі без доступу до інтернету;
- усі зміни в коді ретельно відслідковуються;
- в майбутньому планується мотивація до пояснюваності (інтерпретованості) рішень.
Чому це важливо?
Система демонструє, що ШІ може не лише виконувати завдання, а й удосконалювати власну здатність їх виконувати, без постійної допомоги людини. Такий підхід наближає нас до можливості створення загального штучного інтелекту (AGI) — системи, яка може адаптуватися до будь-якого завдання.
За словами Дженні Чжан, провідної дослідниці:
«Ми були вражені тим, що агент самостійно написав настільки складний код. Це справжній прорив у самонавчанні машин».