Početna Vesti Claude 3 chatbot tvrdi da nadmašuje ChatGPT i Gemini

Vesti

Claude 3 chatbot tvrdi da nadmašuje ChatGPT i Gemini

Najnovija verzija Claude AI obećava brže rezultate, veću tačnost i pojednostavljeno korišćenje, i sada će analizirati učitane slike, dokumente i druge datoteke.

Ivan Nikolicmart 7, 20244 Minuta Čitanja

Anthropic.com najavljuje Claude 3 porodicu, koja postavlja nove standarde u industriji u širokom rasponu kognitivnih zadataka. Familija uključuje tri najsavremenija modela u uzlaznom redosledu mogućnosti: Claude 3 Haiku, Claude 3 Sonnet i Claude 3 Opus. Svaki sledeći model nudi sve moćnije performanse, dopuštajući korisnicima odabir optimalne ravnoteže inteligencije, brzine i cene za njihovu specifičnu primenu.

Opus i Sonnet sada su dostupni za korištenje u claude.ai i Claude API koji je sada općenito dostupan u 159 zemalja (Srbija je na listi, ali nismo uspeli da pokrenemo Claude). Haiku će uskoro biti dostupan.

Claude 3 familija

Novi standard za inteligenciju

Opus, najinteligentniji model, nadmašuje svoje konkurente na većini uobičajenih referentnih vrednosti za AI sisteme, uključujući stručno znanje na dodiplomski nivou (MMLU), stručno rasuđivanje na diplomskom nivou (GPQA), osnovnu matematiku (GSM8K) i više. Pokazuje gotovo ljudske nivoe razumevanja i preciznosti u složenim zadacima, prednjačeći na granici opšte inteligencije.

Svi modeli Claude 3 pokazuju povećane mogućnosti u analizi i predviđanju, kreiranju nijansiranog sadržaja, generisanju koda i razgovoru na jezicima koji nisu engleski poput španskog, japanskog i francuskog.

Dole je poređenje modela Claude 3 s konkurentnim modelima na više referentnih vrednosti:

Gotovo trenutni rezultati

Modeli Claude 3 mogu pokrenuti razgovore uživo s klijentima, automatski dovršavati i ekstraktovati podatake iz zadataka gde odgovori moraju biti trenutni i u stvarnom vremenu.

Haiku je najbrži i najisplatljviji model na tržištu za svoju kategoriju inteligencije. Može pročitati istraživački rad bogat informacijama i podacima o arXiv-u (~10k tokena) s dijagramima i grafikonima za manje od tri sekunde. Nakon lansiranja, očekujemo još bolje performanse.

Za veliku većinu radnih opterećenja, Sonnet je 2x brži od Claude 2 i Claude 2.1 s višim nivoima inteligencije. Izvrsno se snalazi u zadacima koji zahtevaju brze odgovore, poput pronalaženja znanja ili automatizacije prodaje. Opus pruža slične brzine kao i Claude 2 i 2.1, ali s puno višim nivoima inteligencije.

Snažne sposobnosti vida

Modeli Claude 3 imaju sofisticirane mogućnosti vida na nivou ostalih vodećih modela. Mogu obraditi širok raspon vizualnih formata, uključujući fotografije, dijagrame, grafikone i tehničke dijagrame. Novi modalitet je dostupan poslovnim korisnicima, od kojih neki imaju do 50% svojih baza znanja kodiranih u različitim formatima kao što su PDF, dijagrami toka ili slajdovi prezentacije.

Manje odbijanja

Prethodni Claude modeli često su nepotrebno odbijali da pruže odgovor, što je upućivalo na nedostatak razumevanja konteksta. Ostvaren je značajan napredak u ovom području: znatno je manja verovatnoća da će Opus, Sonnet i Haiku odbiti da odgovore na promptove koji se graniče sa zaštitnim linijama sistema nego prethodne generacije modela. Kao što je prikazano u nastavku, modeli Claude 3 pokazuju nijansiranije razumevanje zahteva, prepoznaju stvarnu štetu i puno ređe odbijaju da odgovore na bezopasne upite.

Poboljšana tačnost

Biznisi svih veličina oslanjaju se na Claude modele kako bi pomagali svojim klijentima, zbog čega je neophodno da rezultati modela održe visoku tačnost. Da bi se to procenilo, korišćen je veliki skup složenih, činjeničnih pitanja koja ciljaju na poznate slabosti u trenutnim modelima. Odgovore kategorizujemo u tačne odgovore, netačne odgovore (ili halucinacije) i priznanja nesigurnosti, gde model kaže da ne zna odgovor umesto da pruži netačne informacije. U poređenju sa Claude 2.1, Opus pokazuje dvostruko poboljšanje tačnosti (ili tačnih odgovora) na ova izazovna pitanja otvorenog tipa, dok takođe pokazuje smanjene nivoe netačnih odgovora.

Uz stvaranje verodostojnijih odgovora, uskoro ćemo imati citate u Claude 3 modelima kako bi mogli ukazati na precizne rečenice u referentnom materijalu kako bi potvrdili svoje odgovore.

Dug kontekst i skoro savršeno prisećanje

Porodica modela Claude 3 će u početku ponuditi kontekstni prozor od 200K po lansiranju. Međutim, sva tri modela su u stanju da prihvate unose koji prelaze 1 milion tokena i to će verovatno biti dostupno odabranim klijentima kojima je potrebna poboljšana procesorska snaga.

Da bi efikasno obrađivali dugačke kontekstne upite, modeli zahtevaju snažne mogućnosti prisećanja. Evaluacija „Igla u plastu sena“ (NIAH) meri sposobnost modela da tačno prizove informacije iz ogromne baze podataka. Povećana je robusnost ovog benčmarka korišćenjem jednog od 30 nasumičnih parova igla/pitanje po upitu i testiranjem na raznovrsnoj bazi dokumenata. Claude 3 Opus ne samo da je postigao skoro savršeno prisećanje, prevazilazeći 99% tačnosti, već je u nekim slučajevima čak identifikovao ograničenja same evaluacije prepoznajući da je rečenicu „igla“ izgleda veštački ubačena u originalni tekst od strane čoveka

Jednostavniji za korišćenje

Modeli Claude 3 bolji su u praćenju složenih multi-instrukcija. Veoma su vešti u pridržavanju smernica za stil pisanja brenda i predviđene odgovore, i u razvijanju iskustava usmerenih na kupce kojima korisnici mogu verovati. Osim toga, modeli Claude 3 bolji su u stvaranju popularnog strukturnog izlaza u formatima kao što je JSON—što olakšava davanje instrukcija Claude-u za slučajeve upotrebe kao što su klasifikacija prirodnog jezika i analiza osećaja.

Detalji modela

Claude 3 Opus je najinteligentniji model, s najboljim performansama na tržištu u vrlo složenim zadacima. Može upravljati otvorenim promptovima i neviđenim scenarijima sa izvanrednom tečnošću i razumevanjem poput čoveka. Opus nam pokazuje krajnje limite onoga što je moguće sa generativnom veštačkom inteligencijom.

Claude 3 Sonnet postiže idealnu ravnotežu između inteligencije i brzine—posebno za poslovna opterećenja. Pruža snažne performanse po nižoj ceni i projektovan je za visoku izdržljivost u velikim implementacijama AI.

Claude 3 Haiku je najbrži, najkompaktniji model za gotovo trenutni odziv. Odgovara na jednostavne upite i zahteve brzinom bez premca. Korisnici će imati besprekorna AI iskustva koja oponašaju ljudske interakcije.

Dostupnost modela

Opus i Sonnet dostupni su za korištenje danas u Anthropic-ovom API-ju, koji je sada generalno dostupan, omogućavajući programerima da se prijave i odmah počnu da koriste ove modele. Haiku će uskoro biti dostupan. Sonnet je besplatan na claude.ai, s Opusom dostupnim pretplatnicima za Claude Pro.

Sonnet je takođe dostupan danas putem Amazon Bedrock-a i u privatnom pregledu na Google Cloud-ovom Vertex AI Model-u Gardenu—s Opusom i Haikuom uskoro u oba.

Pametnije, brže, sigurnije

Inteligencija modela nije blizu svojih granica i Anthropic planira česta ažuriranja familije modela Claude 3 tokom sledećih nekoliko meseci. Takođe planiraju da izdaju niz funkcija za poboljšanje mogućnosti modela, posebno za poslovne slučajeve korišćenja i velike primene. Ove nove funkcije će sadržati Tool Use (poznato kao pozivanje funkcija), interaktivno kodiranje (poznato i kao REPL) i naprednije agentske sposobnosti.

Izvorwww.anthropic.com

Prethodni Post ChatGPT na srpskom jeziku

Ostavite Komentar

Ostavite odgovor Odustani od odgovora

Slični Članci

Vesti

Grok xAI – Novi Rival ChatGPT u Eri Real-Time Inteligencije

Grok: Pionirski AI koji premošćuje jaz između informacija u realnom vremenu i...

NapisaoIvan Nikolicnovembar 6, 2023

Top Insights