Новиот технолошки скок во Кина ги шокираше водечките американски истражувачи за вештачка интелигенција, бидејќи „ChatGPT“ неочекувано доби кинески ривал „DeepSeek“, до скоро анонимната компанија, објави јазичен модел кој, според прелиминарните тестирања, е подобар или на исто ниво со најдобрите американски четботови. Главната предност на моделот „DeepSeek-R1“ е цената, триесети дел од она што го бара ChatGPT. Како стартапот од Хангџоу, и покрај санкциите за увоз на американски чипови, ја потресе Силиконската долина?
Додека првиот човек на калифорнискиот технолошки гигант „OpenAI“ Сем Алтман беше зафатен со инаугурацијата на новиот претседател Доналд Трамп, од Кина дојде удар во борбата меѓу САД и Кина за глобална превласт на полето на вештачката интелигенција.
Првиот човек на „OpenAI“ Сем Алтман во Белата куќа со Доналд Трамп
„DeepSee“k, стартап со седиште во Хангџоу, објави голем јазичен модел на вештачка интелигенција наречен „DeepSeek-R1“, кој ги воодушевува научниците како пристапна алтернатива на најновите четботови, како што е моделот „o1“ на „ChatGPT“.
Признанието доаѓа и од конкуренцијата. Извршниот директор на „ Microsoft“, Сатја Надела, верува дека новиот модел на „DeepSeek“ е импресивен и во однос на ефикасниот отворен код кој го направиле, и во однос на времето на заклучување и исклучителната компјутерска ефикасност.
„DeepSeek-R1“ според досегашните тестирања е подобар или на ниво на најдобрите американски четботови.
Нов метод – моделот „расудува“ пред да одговори и можете да му ги „читате“ мислите
„DeepSeek-R1“, како и „o1“ на „OpenAI“, користи нов метод што го прави поспособен од претходните јазични модели во решавањето научни проблеми. Имено, R1 „расудува“ пред да генерира одговор, а корисникот може да го набљудува процесот на „размислување“ во рамките на интерфејсот.
Одговорот се генерира чекор по чекор, во процес што е аналоген на човековото размислување.
Како и моделот o1, и R1 користи „синџир на расудување“ за да ја подобри способноста на јазичните модели да решаваат посложени задачи, вклучувајќи понекогаш и правење чекор назад и проценување на својот пристап.
Неочекувани резултати од тестирањето
Прелиминарните тестови покажуваат дека перформансите на „DeepSeek-R1“ на одредени задачи по хемија, математика и програмирање се на исто ниво со моделот „o1“, кој исто така ги воодушеви истражувачите кога „OpenAI“ го претстави во септември.
„Ова е неверојатно и сосема неочекувано“, напиша на Икс Елвис Саравија, истражувач на вештачка интелигенција и коосновач на британската консултантска фирма „DAIR.AI“.
Тешко е да се каже дали тестовите навистина ја покажуваат способноста на моделот да расудува или само да ги поминува тестовите.
Но, бидејќи „DeepSeek-R1“ е модел со отворен код (open source), неговиот „синџир на размислување“ е достапен за истражувачите, а научниците го тестираат и можат да го проучуваат неговиот алгоритам.
Објавен под лиценцата MИT, моделот може слободно да се користи, но се уште не се смета за целосно отворен бидејќи податоците за неговата обука не се достапни.
резултати од тестирањето
Цена – триести дел од она што го наплаќа „OpenAI“
„DeepSeek“ не откри колку пари биле потребни за тестирање на моделот R1, но на корисниците им наплаќа една триесеттина од цената на o1.
„Експеримент што чини повеќе од 300 фунти (околу 370 долари) со ‘о1’, чини помалку од 10 долари со R1“, вели Марио Крен од германскиот Институт „Макс Планк“.
„Всушност, можете да креирате модели на расудување за многу, многу помалку пари. Не ви требаат огромни суми за однапред да го тренирате моделот. Така, мислам дека правилата на играта се менуваат“, објаснува Али Годси, коосновач и извршен директор на „Databricks“.
Инаку, „DeepSeek“ тврди дека неговиот претходен модел V3, кој беше претставен во декември, бил завршен за само два месеци и помалку од шест милиони долари, додека „Google“ и „OpenAI“ потрошиле години и стотици милиони долари за слична технологија.
Основачот на „DeepSeek“ со кинескиот премиер на денот на инаугурацијата на Трамп
Според пишувањата на медиумите во Кина, „DeepSeek“ е создаден од кинескиот хеџ фонд „High Flyer Quant“, кој управува со имот од околу осум милијарди долари.
И покрај ненадејниот пробив на технолошката сцена, малку се знае за компанијата, како и за нејзиниот основач, Лианг Венфенг (40).
Лианг Венфенг стана новото лице на ИТ индустријата во Кина на симпозиумот со кој претседаваше премиерот Ли Џианг во Пекинг на 20 јануари.
Излегување од анонимност со претходниот модел
Компанијата излезе од релативна анонимност минатиот месец, кога го претстави моделот наречен V3, кој ги надмина своите главни ривали и покрај тоа што беше развиен со ограничен буџет.
Експертите проценуваат дека изнајмувањето на хардверот потребен за тренинг чинело околу шест милиони долари, наспроти повеќе од 60 милиони за моделот „Llama 3.1 405B“ на Мета, кој користел 11 пати повеќе ресурси за обработка на податоци.
Сето ова е постигнато и покрај строгите ограничувања за набавка на чипови, кои американската влада и ги наметна на Кина.
Како компанијата ги пребродила американските санкции за чипови
Дел од интересот за „DeepSeek“ произлегува од фактот дека успеа да го изгради R1 и покрај американските санкции, кои ги ограничуваат кинеските фирми да пристапат до најдобрите компјутерски чипови дизајнирани за обработка на вештачка интелигенција, како што се графичките процесори H100 на NVIDIA.
Ограничената компјутерска моќ ја принуди фирмата на иновација во алгоритми, вели Венда Ли, истражувач за вештачка интелигенција на Универзитетот во Единбург.
Користеле хардвер што го имале на располагање, но го искористиле многу поефикасно.
На Кина и е ограничен пристапот до најнапредните американски чипови
Закана за американската доминација во ВИ, поранешниот директор на „Google“ се предомисли
Два дена по откривањето на „DeepSeek-R1“, претседателот Доналд Трамп најави инвестиција од 500 милијарди долари во инфраструктура за вештачка интелигенција.
Меѓутоа, напредокот на Кина во развојот на вештачката интелигенција покажува дека водството што некогаш го имаа САД значително се намали.
На почетокот на 2024 година, поранешниот извршен директор на „Google“, Ерик Шмит, процени дека Кина е две до три години зад САД во развојот на вештачката интелигенција.
Но сега Шмит има поинаков став. „Порано мислев дека сме неколку години пред Кина, но Кина постигна извонреден напредок во последните шест месеци. Факт е дека неколку кинески програми, една од нив е, на пример, „DeepSeek“, изгледа дека го достигнаа нашето ниво“, рече Шмит.
Кога „OpenAI“ го впретставие „ChatGPT“ во ноември 2022 година, беше без конкуренција.
Сега компанијата се соочува не само со жестока домашна конкуренција од Gemini на Google, Anthropic на Claude и Llama на Мета, туку и со кинески модели.
Кинескиот „DeepSeek“ претставува тектонска промена во глобалната конкуренција во областа на вештачката интелигенција.
Неговиот успех ја нагласува важноста на ефикасноста и иновативноста, како и растечкото влијание на модел со отворен код.