Вчені з Google DeepMind і Університету Торонто представили алгоритм DreamerV3, здатний за 9 днів стати експертом у Minecraft, самостійно навчившись добувати алмази без підказок. Ця розробка - крок до створення універсального штучного інтелекту, який освоює завдання будь-якого рівня складності, від управління роботами до аналізу даних, використовуючи єдиний набір правил.

DreamerV3 працює через "внутрішній симулятор" - нейромережу, яка передбачає наслідки дій, як шахіст прораховує ходи. Уявивши віртуальний сценарій, алгоритм оцінює його цінність другою мережею ("критиком") і вибирає оптимальне рішення третьою ("актором"). Наприклад, щоб знайти алмаз у Minecraft, система послідовно вчиться добувати дерево, створити кирку, досліджувати печери - без зовнішніх вказівок, лише через пробудження інтересу до мети.
Ключова перевага DreamerV3 - стабільність. На відміну від класичних алгоритмів на кшталт PPO, що вимагають тонкого налаштування під кожну задачу, він зберігає одні й ті самі параметри для всіх 150 тестових сценаріїв, від аркадних ігор до управління роботами. Це досягнуто за рахунок балансування даних: система автоматично коригує масштаб нагород, уникаючи перекосів у навчанні. Наприклад, у середовищах, де нагороди рідкісні (як алмази в Minecraft), алгоритм посилює "цікавість", досліджуючи більше варіантів.
Проривом став результат у Minecraft: DreamerV3 першим зібрав алмази "з нуля", подолавши 12 етапів - від рубки дерев до пошуку рідкісних мінералів. Це демонструє здатність до довгострокового планування в непередбачуваних умовах, що важливо для реальних роботів, які працюють у мінливому середовищі.
Вчені бачать майбутнє технології в об'єднанні навчання з відео з інтернету - наприклад, робот-помічник міг би освоювати навички, спостерігаючи за людьми. Уже зараз DreamerV3 масштабується: що більше обчислювальних ресурсів, то вища ефективність. Це відкриває шлях до систем, які не просто виконують завдання, але адаптуються до нових викликів - від розумних фабрик до автономних автомобілів, здатних "мислити" на крок уперед.