И тут Китай понесло: представлена нейросеть Qwen 2.5-Max, превосходящая DeepSeek V3 по 11 показателями

Аватар пользователя Granderator

Китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. Изначально это не только многофункциональный чат-бот, но и генератор фото и видео.

Согласно проведенным компанией тестам, Qwen 2.5-Max превосходит китайский чат-бот DeepSeek V3 и чат-бот Llama-3.1-405B (принадлежит Meta, признанной в России экстремистской и запрещенной) по 11 показателям.

«Наша модель продемонстрировала значительные преимущества в большинстве тестов», — заверил разработчик.

Компания стремится улучшать мышление и логические рассуждения в больших языковых моделях через «инновационное» обучение с подкреплением, что обещает позволить ИИ-моделям превзойти человеческий интеллект, говорится в заявлении команды чат-бота.

«Qwen 2.5-Max превосходит... почти по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — говорится в объявлении облачного подразделения Alibaba, опубликованном в официальном аккаунте WeChat, со ссылкой на самые передовые модели искусственного интеллекта с открытым исходным кодом OpenAI и Meta*.

Выпуск 10 января искусственного интеллекта DeepSeek на базе модели DeepSeek-V3, а также выпуск 20 января его модели R1 потрясли Кремниевую долину и привели к падению акций технологических компаний, поскольку низкие затраты китайского стартапа на разработку и эксплуатацию заставили инвесторов усомниться в необходимости больших расходов ведущих компаний в области искусственного интеллекта в США.

Однако успех DeepSeek также привел к тому, что внутренние конкуренты в Китае начали активно совершенствовать свои собственные модели искусственного интеллекта.

Через два дня после выпуска DeepSeek-R1 владелец TikTok ByteDance выпустил обновление своей флагманской модели ИИ, которая, по его словам, превзошла поддерживаемую Microsoft модель OpenAI o1 в AIME — эталонном тесте, который измеряет, насколько хорошо модели ИИ понимают и реагируют на сложные инструкции.

Это перекликается с заявлением DeepSeek о том, что ее модель R1 успешно конкурирует с GPT-4o1 от OpenAI по нескольким показателям производительности.

DeepSeek, которая попала на первые строчки мировых СМИ в начале недели, сообщила о запуске новейшей ИИ-модели Janus-Pro-7B. После запуска Janus-Pro-7B и успеха чат-бота DeepSeek компания Nvidia подешевела на 600 млрд долларов. Совокупная стоимость частных компаний США упала более чем на $1 трлн за один день.

DeepSeek заявила, что ее популярное приложение подверглось кибератаке в понедельник, 27 января, что заставило китайскую компанию временно ограничить регистрации. Обвал акций технологических компаний потянул за собой курс криптовалют. Как мы уже сообщали, приложение DeepSeek заняло первое место в рейтинге лучших бесплатных приложений Apple App Store, а также стало одним из самых скачиваемых в Google Play.

От команды Qwen2.5-Max:

Прямое сравнения производительности моделей инструкций, которые могут служить для приложений нисходящего потока, таких как чат и кодирование. Представляем результаты производительности Qwen2.5-Max вместе с ведущими современными моделями, включая DeepSeek V3, GPT-4o и Claude-3.5-Sonnet.

Qwen2.5-max-instruct.jpg

Qwen2.5-Max превосходит DeepSeek V3 в таких бенчмарках, как Arena-Hard, LiveBench, LiveCodeBench и GPQA-Diamond, а также демонстрирует конкурентоспособные результаты в других оценках, включая MMLU-Pro.

При сравнении базовых моделей мы не можем получить доступ к фирменным моделям, таким как GPT-4o и Claude-3.5-Sonnet. Поэтому мы оцениваем Qwen2.5-Max против DeepSeek V3, ведущей модели MoE с открытым весом, Llama-3.1-405B, крупнейшей плотной модели с открытым весом, и Qwen2.5-72B, которая также входит в число лучших плотных моделей с открытым весом. Результаты этого сравнения представлены ниже.

Qwen2.5-Max.jpeg

Наши базовые модели продемонстрировали значительные преимущества в большинстве тестов, и мы с оптимизмом ожидаем, что усовершенствования в методах постобучения выведут следующую версию Qwen2.5-Max на новый уровень.

Теперь Qwen2.5-Max доступен в Qwen Chat, и вы можете напрямую общаться с моделью, или играть с артефактами, искать и т. д.

Авторство: 
Копия чужих материалов

Комментарии

Аватар пользователя Алый
Алый(12 лет 2 месяца)

Я давно смотрю на ИИ, в перспективе писательском. И вот сейчас есть много чего такого, что уже и используется так. А моё сверх Я сдерживает меня от этого - человеческий разум лучше. Просто пока сдерживающие факторы стоят.

Комментарий администрации:  
*** Будущий телепат в полном объеме (с) - https://aftershock.news/?q=comment/12979932#comment-12979932 ***
Аватар пользователя Skygoo
Skygoo(11 лет 4 месяца)

Серьезных произведений на нем не напишешь, но жвачку, типа 90% контента на АвторТудей, запросто.

Ну или скажем пресс-релизы, эссе, сочинения для школы и небольшие сюжеты, сценарии.

Аватар пользователя feodor89
feodor89(7 лет 10 месяцев)

Писатель тоже может проверять. Первичная редактура например. Или стилизация диалогов второстепенных персонажей

Аватар пользователя Muller
Muller(14 лет 6 дней)

А самый главный бот в это время шортил NVidia...

Аватар пользователя Vovan220
Vovan220(7 лет 3 месяца)

Спорные заявления. Qwen2.5-Max медленнее deepseek'а и у последнего очень хорошая аргументация вывода, и он более точен.

Аватар пользователя Ernst
Ernst(10 лет 8 месяцев)

Тут хайпануть нужно, пока хайп не разобрали.

Аватар пользователя Granderator
Granderator(8 лет 2 месяца)

Ну... графики тестов приведены в статье

Аватар пользователя Пфальцграф
Пфальцграф(1 год 5 месяцев)

Читал, что сравнение Qwen с Deepseek V3 (это ранняя, тестовая версия) некорректно, надо с версией R1 (рабочая версия) сравнивать. R1 пошустрее

Плюс ко всему, Qwen не имеет Opensource

Но сейчас не могу найти, где читал...

Аватар пользователя Vladyan
Vladyan(10 лет 8 месяцев)

smile10.gif

Скрытый комментарий e.tvorogov (c обсуждением)
Аватар пользователя e.tvorogov
e.tvorogov(10 лет 4 дня)

Сколько же нюансов зарыто в этом шедевре.

Аватар пользователя Vladyan
Vladyan(10 лет 8 месяцев)

Ага!

Аватар пользователя Lock_enough
Lock_enough(8 лет 3 месяца)

На наши деньги это "Алиса" позвонила "Марусе" )))

Аватар пользователя Skygoo
Skygoo(11 лет 4 месяца)

И в итоге оба раскусили друг друга.

Аватар пользователя Vladyan
Vladyan(10 лет 8 месяцев)

Да.

Идея была явлена лет 35 назад однако

Аватар пользователя Тех Алекс
Тех Алекс(10 лет 6 месяцев)

И чо теперь перестанут называть лазерным уровнем товары сложнее бинокля? Вчерась еще называли.

Аватар пользователя калибровщик
калибровщик(10 лет 3 недели)

Недавно, увидев хайп по поводу ДипСик, полез проверять. И обнаружил, что уже давно на него подписан с Гугла. Так же, как и на Qwen Chat. Вторую неделю сравниваю на одних и тех же задачах. Навскидку: Qwen Chat всяко мультимодальнее. Лучше шарит по тырнету. Промпты просто бесконечной длины, можно повесть в промпт запихнуть. Рисует и клепает консистентные видосы, чего ДипСик не может в упор.

А так же всё бесплатно.

Аватар пользователя otherone
otherone(3 года 6 месяцев)

Хм.. мне говорит "Prompt cannot exceed 10000 characters."

smile37.gif

А дипсик пережевывает...

Аватар пользователя калибровщик

Хм.. мне говорит "Prompt cannot exceed 10000 characters."

Хех. А вам всё мало? В ДримАИ максимально 350 знаков в промпте. А было ваще 140. Мораль: Приучаемся к лаконичностиsmile3.gif

Аватар пользователя otherone
otherone(3 года 6 месяцев)

Дык это данные были в хмл. Хотел спросить что он думает по этому поводу.

А он сломалсо smile44.gif

Дипсик тоже самое съел, проанализировал и даже СРРшный класс под них придумал! smile9.gif

Аватар пользователя Coyote
Coyote(4 года 8 месяцев)

Не пробовали, случайно hailuo . ai? Можете что-нибудь сказать о нем в сравнении с остальными? Заранее спасибо!

Аватар пользователя калибровщик

Не пробовали, случайно hailuo . ai? Можете что-​нибудь сказать о нем в сравнении с остальными?

Это то, что раньше называлось МиниМакс? Не только пробовал, но и юзал его в хвост и в гриву, пока он был бесплатным. Даже приложил т.сказать руку к тому, что он стал платным. Как только тиснул о нём статью на АШ, набижали тысячи. В МиниМахе образовалась очередь в сотни рыл. Через день он подвис. А через 2 дня стал платным.

Только сейчас увидел его с новым тырфейсом (хотя слышал об этом). Появился простенький ЖПТ и Аудиогенерация. В видео добавилась новая модель T2V-01-Director  с контролем камеры. Но остались те же 100 кредов в день на бесплатном тарифе. Их хватит на 3 ролика по 5 сек. Не особо разгонишься. А аудио еще не пробовал (на вид не сложнее Суно)

Мои пробы в еще бесплатном hailuo.ai можно глянуть здесь

Аватар пользователя Coyote
Coyote(4 года 8 месяцев)

У него бесплатный чат. На днях с коллегой попробовали IT вопросы ему позадавать и он справился лучше deepseek-а и chatgpt o1. Сразу дал оптимальный код.

Аватар пользователя калибровщик

У него бесплатный чат.

Его ЖПТ я проверил мельком прям щас. Мне он не показался. Там есть сравнения с другими ЖПТ. По их тестам он дышит в затылок ЧадуЖПТ-4о. КвенЧат и ДипСик навскидку мощнее.

Но я проверяю не на кодинге, т.к. не шарю в этом. А на своих замороченных текстах.

Аватар пользователя Coyote
Coyote(4 года 8 месяцев)

Меня как раз и интересовало что-нибудь непрограммическое. Спасибо!

Аватар пользователя Де Пердье
Де Пердье(12 лет 3 месяца)

 Консистентные видосы ? Может контекстные ?smile7.gif
---------------------------------------------------------------------------
 - Какой консистенции ваш видос ?
- Да так , консистенция киселя , или творожка со сметаной  ;=) 

Аватар пользователя калибровщик

Консистентные видосы ? Может контекстные?

Консистентные, это когда без всяких Лор и дообучения ,с одной только фотки он сделает видос с твоим лицом, как живой.

Аватар пользователя Де Пердье
Де Пердье(12 лет 3 месяца)

Извиняюсь . В Яндексе я ничего такого не нашёл .

Аватар пользователя калибровщик
калибровщик(10 лет 3 недели)

Извиняюсь . В Яндексе я ничего такого не нашёл

Яндех не поспевает за терминологией. Вотъ: Встречаем долгожданную функцию «консистентный персонаж».

Одно из определений термина «консистентность» в словаре Cambridge English Dictionary описывает его как качество всегда вести себя или действовать одинаково, или всегда происходить аналогичным образом, также известное как «быть одинаковым».

Аватар пользователя Grisha
Grisha(13 лет 10 месяцев)

А где, ТБМ, Яндекс?

Аватар пользователя sergiy
sergiy(2 года 9 месяцев)

Вас ждет, без вас никак.

Аватар пользователя Grisha
Grisha(13 лет 10 месяцев)

Меня туда никак, HR зарубят по возрасту

Аватар пользователя калибровщик

А где, ТБМ, Яндекс?

У Яндеха шикарные озвучка и нейроперевод, пересказы и саммари. Шедеврум неплох. А еще кокойто YandexART появился. Надо попробовать.

А его ЖПТ никудышный.

Аватар пользователя baltictea
baltictea(5 лет 4 месяца)

Без продвинутых чипов Нвидии никуда. Надо им подсказать - Нвидиа из Сингапура 15% выручки получает, хорошо, говорят, H100 там расходятся.

Аватар пользователя АлександрK
АлександрK(2 года 4 месяца)

В КНР ещё и с гиперзвуком неплохие прогнозы 

Аватар пользователя Vladyan
Vladyan(10 лет 8 месяцев)

....И вы говорите!

Аватар пользователя АлександрK
АлександрK(2 года 4 месяца)

Тут не разговор пенсов на лавке. Натурные испытания и сдвиг запуска тестового экземпляра влево

Аватар пользователя Vladyan
Vladyan(10 лет 8 месяцев)

Как на Тайвань полетят - там и посмотрим. А пока...

Аватар пользователя Barry
Barry(8 лет 14 часов)

Больше всего интересует цыфирь обвала на NASDAQ!!!

Стульчик на котором сидит Трамп уже с подпиленными ножками...

Ждём обрушения!smile42.gif

Аватар пользователя Skygoo
Skygoo(11 лет 4 месяца)

ФРС накачает резаной и всего делов

Аватар пользователя Спящий медведь

ФРС напрямую закачает ликвидность в рынок?
Не подскажете примерчик из истории?

Аватар пользователя Skygoo
Skygoo(11 лет 4 месяца)

Ликвидность закачивают не в рынок, закачивают в крупные компании, под минимальные проценты (в т.ч. нулевые), чтобы они скупали собственные акции и акции "соседей".

Аватар пользователя Piton
Piton(4 года 11 месяцев)

Тестил на днях, одни извинения от интеллекта. "Я только учусь". 

Комментарий администрации:  
*** отключен (деза, маты) ***
Аватар пользователя sergiy
sergiy(2 года 9 месяцев)

На Питоне?

Аватар пользователя Пеннигер
Пеннигер(13 лет 12 месяцев)

Мастера и Маргариту в Цветочном городе пересказывает ну практически как ДипСик но как-то более готично.

В один из тех солнечных дней, когда на улицах Цветочного города было особенно шумно и весело, потому что все малыши играли в свои любимые игры, а Незнайка и его друзья собирались отправиться на прогулку к реке Синей, случилось нечто очень странное. На главной площади города появился незнакомый коротышка в чёрном костюме и с высоким цилиндром на голове. Он был совсем не похож на местных жителей — ни одной пуговицы на его одежде не было видно, а лицо было таким серьёзным, что даже Пончик перестал хихикать. Этот загадочный гость, которого никто раньше здесь не встречал, начал задавать странные вопросы про то, есть ли в городе такие дома, где живут исключительно коротышки, которые пишут книги или занимаются наукой. А когда кто-то из малышей ответил, что таких домов тут нет, незнакомец только усмехнулся и сказал: "А вот и зря, ведь настоящие приключения начинаются именно там, где их никто не ждёт!"

зы а 12 стульев так даже лучше, Бульбу только приплел.

Однажды утром в Цветочном городе наступило необычное оживление. Все малыши собрались возле дома доктора Пилюлькина, потому что там должно было произойти нечто важное. Дело в том, что накануне вечером Незнайка услышал от Бульбы, который только что вернулся из соседнего города, удивительную историю.

— Представьте себе, — говорил Бульба, размахивая руками, — в одном старом доме нашли целый сундук с золотыми монетами! Но самое интересное, что эти монеты были спрятаны внутри старых стульев. Всего их было двенадцать, и каждый из них был украшен красивыми резными узорами.

Незнайка, который всегда любил приключения, сразу же загорелся идеей найти эти стулья. Он собрал всех своих друзей — Пончика, Торопыжку, Растеряйку и даже Знайку, который обычно предпочитал заниматься наукой, а не бегать за сокровищами.

— Ну что, ребята, — сказал Незнайка, — если мы найдём хотя бы один из этих стульев, то сможем купить для нашего города огромный телескоп, чтобы наблюдать за звёздами!

Все малыши загорелись этой идеей и решили немедленно отправиться на поиски. Они вооружились картами, которые нарисовал Знайка, и начали обходить все старые дома в Цветочном городе. Каждый из них надеялся стать тем самым счастливчиком, который найдёт заветный стул с золотыми монетами.

Аватар пользователя калибровщик

Мастера и Маргариту в Цветочном городе

Жесть! Я такое смешение стилей только в Миджорни пробовал. Надо затестировать

Аватар пользователя vambr
vambr(13 лет 1 месяц)

Пример промпта можно?

Аватар пользователя Пеннигер
Пеннигер(13 лет 12 месяцев)

Точного не помню,  но очень короткий, типа перескажи первый абзац как если бы он был написан Носовым про коротышек

Аватар пользователя uzopb
uzopb(14 лет 2 недели)

"Купить"?

Дай Бог памяти!, коротышки Носова не пользовали деньги.

Аватар пользователя Пеннигер
Пеннигер(13 лет 12 месяцев)

Здесь наверное безналичный денежный контур smile3.gif

Аватар пользователя Пильятьски
Пильятьски(3 года 2 недели)

пиндосята ещё на трюль просели?

Страницы