Кинеската технолошка компанија Alibaba претстави нова верзија на својот модел за вештачка интелигенција (ВИ) Qwen 2.5, за кој тврди дека го надминал високо ценетиот DeepSeek-V3, пишува БГНЕС.
Необичното време на објавувањето на Qwen 2.5-Max, во првиот ден од Кинеската Нова година, кога повеќето Кинези не се на работа и го поминуваат времето со своите семејства, ја покажува зголемената конкуренција што во изминатите три недели брзиот подем на кинескиот стартап за ВИ DeepSeek ја создаде не само за странските ривали, туку и за внатрешната конкуренција.
„Qwen 2.5-Max целосно го надминува GPT-4o, DeepSeek-V3 и Llama-3.1-405B“, соопшти одделот за облачни услуги на Alibaba, повикувајќи се на најнапредните модели за ВИ со отворен код на OpenAI и Meta.
Лансирањето на 10-ти јануари на помошникот за вештачка интелигенција на DeepSeek, придвижуван од моделот DeepSeek-V3, како и објавувањето на моделот R1 на 20 јануари, ја шокираше Силиконската долина и доведе до пад на технолошките акции. Наводно ниските развојни и оперативни трошоци на кинескиот стартап ги наведоа инвеститорите да се сомневаат во огромните планови за трошење на водечките американски фирми за вештачка интелигенција.
Успехот на DeepSeek, сепак, доведе и до натпревар меѓу неговите локални конкуренти за модернизација на сопствените модели за ВИ.
Два дена по објавувањето на DeepSeek-R1, сопственикот на TikTok, ByteDance, претстави ажурирана верзија на својот водечки модел за ВИ. Се тврди дека тој го надминал OpenAI o1, поддржан од Microsoft, во AIME – компаративен тест кој мери колку добро моделите за ВИ ги разбираат и реагираат на сложени инструкции.
Ова го повторува тврдењето на DeepSeek дека нејзиниот модел R1 му конкурира на OpenAI o1 според неколку критериуми за перформанси.