Kineski startap za razvoj vještačke inteligencije DeepSeek predstavio je novu verziju svog naprednog modela V3.1, koji donosi osjetna poboljšanja u brzini, fleksibilnosti i kapacitetu obrade podataka.
Prema tvrdnjama kompanije, model je sada u stanju da obrađuje informacije brže nego prethodna verzija R1-0528, dok je kontekstualni prozor proširen na čak 128.000 tokena, što odgovara tekstu od oko 300 stranica. To omogućava duže i koherentnije interakcije, sa preciznijim formulisanjem odgovora i zadržavanjem kontinuiteta u konverzaciji.
Model je razvijen na arhitekturi sa čak 685 milijardi parametara, od kojih je aktivno 37 milijardi po tokenu zahvaljujući konceptu Mixture-of-Experts. Ovaj pristup omogućava efikasniji rad i niže troškove u odnosu na zatvorene sisteme poput GPT-4o ili Claude 3.5 Sonnet. Pored toga, V3.1 integriše hibridne mehanizme rezonovanja i pretraživanja, pa se bolje snalazi u dinamičnim i kompleksnim scenarijima.
Prve procjene pokazuju da je DeepSeek V3.1 posebno snažan u kodiranju i matematičkom rezonovanju, gdje rezultati na testovima pokazuju da model u pojedinim slučajevima parira ili čak nadmašuje komercijalne konkurente. Značajan je i podatak da je cijena obrade složenih zadataka višestruko niža u poređenju sa konkurentskim rješenjima – korisnici navode da ih obrada jednog složenog zadatka košta oko 1 USD, dok kod drugih modela cifra može doseći i 70 USD.
Manjkavosti i ograničenja
Iako predstavlja korak naprijed, nova verzija ipak ima ozbiljna ograničenja. Uprkos velikom kontekstualnom prozoru, model i dalje pokazuje slabosti kod složenih logičkih izazova i zahtijeva vješto promptovanje kako bi davao optimalne rezultate.
Osim toga, riječ je o izuzetno resursno zahtjevnom sistemu: 685 milijardi parametara čini ga praktično nedostupnim za hobi korisnike i traži snažnu infrastrukturu ili cloud hosting, što ga ograničava uglavnom na veće kompanije i institucije.
Posebno osjetljivo pitanje odnosi se na cenzuru i kontrolu sadržaja. Kao i kod drugih kineskih AI rješenja, DeepSeek V3.1 je usklađen sa politikama vlasti, što znači da se određene političke i istorijske teme filtriraju ili ograničavaju, čime se postavlja pitanje transparentnosti i slobode izraza.
Dodatno, stručnjaci upozoravaju na varijabilne rezultate u benchmark testovima zbog različitih uslova evaluacije, što otežava pouzdano poređenje sa drugim vodećim modelima.
DeepSeek V3.1 nesumnjivo predstavlja važan tehnološki iskorak u domenu otvorenih AI sistema, nudeći napredne funkcionalnosti, veću brzinu i znatno povoljniju cijenu obrade zadataka. Ipak, njegova ograničenja, od resursne zahtjevnosti do politički osjetljive cenzure, podsjećamo da je pred ovakvim modelima još dug put do potpunog balansiranja moći i slobode u upotrebi vještačke inteligencije.
ETOportal