DeepSeek пусна ъпдейт на модела си R1

Китайският стартъп за изкуствен интелект DeepSeek пусна актуализация на своя модел за разсъждение R1, засилвайки конкуренцията с американските компании като OpenAI, информира Ройтерс.

DeepSeek пусна R1-0528 на платформата за разработчици Hugging Face, но все още няма официално публично съобщение. Компанията не е публикувала и описание на модела или сравнения.

LiveCodeBench – бенчмарк, разработен от изследователи от Калифорнийския университет в Бъркли, Масачузетския технологичен институт и Корнел – обаче класира актуализирания модел за разсъждение R1 на DeepSeek малко зад моделите за разсъждение o4 mini и o3 на OpenAI по отношение на генериране на код и пред Grok 3 mini на xAI и Qwen 3 на Alibaba.

Bloomberg съобщава, че представител на DeepSeek е казал на група в WeChat, че е са завършили „незначителна пробна надстройка“ и че потребителите могат да започнат да я тестват.

По-рано тази година DeepSeek опроверга твърденията, че американският контрол върху износа възпрепятства напредъка на Китай в областта на изкуствения интелект, след като стартъпът пусна модели с изкуствен интелект, които бяха наравно или по-добри от водещите в индустрията модели в Съединените щати, но значително по-евтини.

Стартирането на R1 през януари доведе до рязък спад на технологичните акции извън Китай и оспори мнението, че мащабирането на изкуствения интелект изисква огромна изчислителна мощност и инвестиции. След пускането на R1 китайски технологични гиганти като Alibaba и Tencent пуснаха модели, за които се твърди, че превъзхождат тези на DeepSeek.

Gemini на Google въведе намалени нива на достъп, докато OpenAI намали цените и пусна модела o3 Mini, който разчита на по-малко изчислителна мощност.

Все още се очаква компанията да пусне R2, наследник на R1. Според информация на Ройтерс, съобщена през март, пускането на R2 първоначално е било планирано за май.

Подобни публикации

Sing up

Login