Midjourney и другие нейросети обработки изображений - страница 798

 
fxsaber #:
мысли не было, что шахматная программа, не обученная на человеческих партиях, только знающая правила и прокрутившая кучу игр сама с собой вынесет в одну калитку все прошлые достижения, и человеческие и программные.

Не знал о таком крутом результате. Озвученное говорит о том, что не было никакого обучения. Только правила игры и победила спец. обученные программы.

 

Тоже проверил доступные под рукой чаты на логику

«Алиса в Стране ИИ-чудес»


ChatGPT:



You.com:



Mistral:



Deepseek:



Победа Мистраль и Дипсик.

[Удален]  
fxsaber #:


Ну и в комментариях дали ссылку на интересную статью.


Попросил улучшить зубы

стало

в принципе нормально, но есть нюанс

[Удален]  
fxsaber #:

Не знал о таком крутом результате. Озвученное говорит о том, что не было никакого обучения. Только правила игры и победила спец. обученные программы.

Было обучение. Давно уже все кому не лень высказались, что это обычная комбинаторика.
 
Maxim Dmitrievsky #:
Было обучение 

Не увидел в сообщении этого.

[Удален]  
fxsaber #:

Не увидел в сообщении этого.

"прокрутившая кучу игр сама с собой "

после каждой партии происходит дообучение.

[Удален]  
Aleksey Nikolayev #:

Более корректная проверка возможностей ИИ в математике.

Вкратце: проверка на реальном ООС даёт результат 2%

Обычные тестерные граали :) которые пропихиваются как ИИ

 
Maxim Dmitrievsky #:

"прокрутившая кучу игр сама с собой "

после каждой партии происходит дообучение.

Дали только аксиомы по математике... Теперь решает уравнения. Ну пусть и это будет называться обучением.

[Удален]  
fxsaber #:

Дали только аксиомы по математике... Теперь решает уравнения. Ну пусть и это будет называться обучением.

Нужно просто представлять как происходит обучение с подкреплением. Сеть прокручивает миллионы вариантов и результаты сравниваются с правильными ответами. Чем ближе ответ к правильному, тем больше вознаграждение (вес в общем массиве результатов). Модель пытается увеличить вознаграждение, то есть отбирает лучшие свои же результаты. Сравнимо с оптимизацией. 
 
Если говорить про совмещение ИИ и математики, то полезным может быть например кодинг под Coq со специально обученной моделью ИИ, например.