Интересно, что основное занятие создателей Дипсика - создание МО для трейдинга - Общее обсуждение

Aleksey Nikolayev 2025.01.28 05:54 #8481

Интересно что основное занятие создателей Дипсика - создание МО для трейдинга.

Vitaliy Kuznetsov 2025.01.28 07:10 #8482

Andrey Dik #:

Как считаешь, каким образом китайцам удалось получить более продвинутые модели при том, что ничего нового в архитектурах нейронок они не создали? (не боятся и не стесняются выкладывать исходники).

Некоторые говорили в этой ветке, что дальнейший рост производительности и качества LLM невозможны без экспоненциального роста затрат электроэнергии и мощности железа, однако видим, что китайцы не только смогли повысить качество, но при этом их модели меньше по размеру, чем у глобальных игроков в сфере ИИ.

Я думаю, что они просто своевременно используют все доступные инструменты.

В OpenSource сегменте есть полно исходников, чтобы уменьшать нагрузку и увеличивать производительность.

Китай всегда славился быстрым развёртыванием технологий. Просто отлажен процесс человеческого труда. И людей там много.

К тому же, наши разрабы тоже немало проводят исследований и делятся на OpenSource площадках.

Предположу, что есть кооперативная работа в этом направлении. Ну и конечно, что-то новое в архитектуры они всё таки привносят.

Но, тут важно. В целом не переплюнут уровень o3, но он ещё не вышел в массы.

[Архив!] FOREX - Тенденции, Интересное и Юмор Что такое обучение?

[Удален] 2025.01.28 07:19 #8483

Aleksey Nikolayev #:
Интересно что основное занятие создателей Дипсика - создание МО для трейдинга.

откуда инфа?

Vitaliy Kuznetsov 2025.01.28 07:26 #8484

DeepSeek (深度求索) — это китайский стартап, основанный тремя сотрудниками Чжэцзянского университета из Ханчжоу. Проект был создан в 2023 году

Трамп: "Выпуск DeepSeek — ИИ от китайской компании, должен стать тревожным сигналом для наших отраслей, о том, что нам нужно предельно сосредоточиться на конкуренции с целью победы"

Альтман:

Встроить чат в редактор Обсуждение статьи "Разработка торговой Automated Trading Championship 2009

fxsaber 2025.01.28 07:35 #8485

Открытые исходники модели - что это значит для индустрии ИИ? Вроде, там основная фишка - это способы обучения и набор данных для обучения.

fxsaber 2025.01.28 07:36 #8486

Vitaliy Kuznetsov #:

Альтман:

Корифей индустрии использует слово "впечатляющая". Это же какая-то должна быть объективная оценка.

Vitaliy Kuznetsov 2025.01.28 07:46 #8487

fxsaber #:
Открытые исходники модели - что это значит для индустрии ИИ? Вроде, там основная фишка - это способы обучения и набор данных для обучения.

Это значит, что любая компания может развернуть у себя DeepSeek и прикрутить к своему сервису, сайту и т.д.

А у кого есть большие деньги, может включиться в гонку ИИ.

Иными слова, самый передовой OpenSource ИИ - это минимальная планка, от которой будут появляться следующие ИИ.

Все конкуренты в кратчайшие сроки дойдут до этой планки (ведь исходники есть), чтобы двинуться дальше.

Поскольку для обучения требуется примерно 2 месяца, то в марте будет новая мощная волна догоняющих и перегоняющих.

Самообучающийся кросс MA! За что могут удалить запреты ???

[Удален] 2025.01.28 07:49 #8488

Aleksey Nikolayev #:
Могла сработать более продуманная технология обучения. Как вариант - использование китайцев вместо индусов)

Это постобучение. До этого еще нужно обучать сырую модель. Косты естественно растут.

Пока что пытаются хорошо "запомнить" обучающую выборку, потому что она изначально не размечена. Вместо индусов решили использовать RL :)

Вместо того чтобы делать постобучение на всех данных, они сделали его на части данных, снизив расходы. В итоге шо получилось, то получилось, как написано в их бумаге.

Библиотеки: BestInterval Помощь по кодированию... Как Машинное обучение в трейдинге:

fxsaber 2025.01.28 08:12 #8489

Vitaliy Kuznetsov #:

Это значит, что любая компания может развернуть у себя DeepSeek и прикрутить к своему сервису, сайту и т.д.

Это всегда можно было сделать через API.

Aleksey Nikolayev 2025.01.28 08:16 #8490

Maxim Dmitrievsky #:

откуда инфа?

Из википедии)

Midjourney и другие нейросети обработки изображений - страница 849