Anthropic teigia, kad jo naujausias modelis yra geriausias savo klasėje
„OpenAI“ konkurentas „Anthropic“ išleidžia galingą naują generatyvų AI modelį, pavadintą „Claude 3.5 Sonnet“. Tačiau tai labiau laipsniškas žingsnis nei didžiulis šuolis į priekį.
„Claude 3.5 Sonnet“ gali analizuoti tekstą ir vaizdus, taip pat generuoti tekstą, o tai kol kas geriausiai veikiantis „Anthropic“ modelis – bent jau popieriuje. Pagal kelis skaitymo, kodavimo, matematikos ir regėjimo dirbtinio intelekto etalonus „Claude 3.5 Sonnet“ pranoksta modelį, kurį jis keičia, „Claude 3 Sonnet“, ir pranoksta ankstesnį „Anthropic“ flagmaną „Claude 3 Opus“.
Etalonai nebūtinai yra pats naudingiausias dirbtinio intelekto pažangos matas, iš dalies todėl, kad daugelis iš jų tikrina ezoterinius atvejus, kurie nėra taikomi paprastam žmogui, pavyzdžiui, atsako į sveikatos patikrinimo klausimus. Bet už ką verta, Claude 3.5 Sonnetas vos vos geriausiai konkuruoja su pirmaujančiais modeliais, įskaitant neseniai išleistą OpenAI GPT-4o, pagal kai kuriuos etalonus, kuriuos Anthropic išbandė.
Kartu su naujuoju modeliu Anthropic išleidžia tai, ką ji vadina artefaktais – darbo sritį, kurioje vartotojai gali redaguoti ir pridėti prie turinio, pvz., kodo ir dokumentų, sukurto naudojant Anthropic modelius. Anthropic teigia, kad šiuo metu peržiūra įgis naujų funkcijų, pvz., būdų bendradarbiauti su didesnėmis komandomis ir saugoti žinių bazes.
Sutelkite dėmesį į efektyvumą
„Claude 3.5 Sonnet“ yra šiek tiek našesnis nei „Claude 3 Opus“, o „Anthropic“ teigia, kad modelis geriau supranta niuansuotas ir sudėtingas instrukcijas, be tokių sąvokų kaip humoras. (Tačiau AI yra žinoma nejuokinga.) Bet galbūt dar svarbiau kūrėjams, kuriant programas su Claude, kurioms reikia greitų atsakymų (pvz., klientų aptarnavimo pokalbių robotai), 3.5 Sonnet yra greitesnis. „Anthropic“ tvirtina, kad tai maždaug dvigubai greitesnis nei „3 Opus“.
„Anthropic“ teigimu, vizija – nuotraukų analizavimas – yra viena iš sričių, kur „Claude 3.5 Sonnet“ gerokai patobulinta, palyginti su 3 „Opus“. 3.5 Sonetas gali tiksliau interpretuoti diagramas ir grafikus ir perrašyti tekstą iš „netobulų“ vaizdų, pvz., nuotraukų su iškraipymais ir vaizdiniais artefaktais.
Michaelas Gerstenhaberis, „Anthropic“ produktų vadovas, teigia, kad patobulinimai yra architektūrinių patobulinimų ir naujų mokymo duomenų, įskaitant dirbtinio intelekto sugeneruotus duomenis, rezultatas. Kokie konkrečiai duomenys? Gerstenhaberis neatskleidė, bet jis reiškė, kad Claude 3.5 Sonnetas didžiąją dalį savo jėgos semiasi iš šių treniruočių rinkinių.
„Kas svarbu [businesses] yra tai, ar AI padeda jiems patenkinti verslo poreikius, o ne tai, ar AI yra konkurencinga pagal etaloną, ar ne“, – „TechCrunch“ sakė Gerstenhaberis. „Ir iš šios perspektyvos manau, kad „Claude 3.5 Sonnet“ bus žingsniu priekyje už viską, ką turime, ir pralenks bet ką kitą šioje pramonės šakoje.
Treniruočių duomenų slaptumas gali būti dėl konkurencijos priežasčių. Tačiau tai taip pat galėtų būti apsaugoti Anthropic nuo teisinių iššūkių, ypač su sąžiningu naudojimu susijusių iššūkių. Teismai dar turi nuspręsti, ar pardavėjai, tokie kaip Anthropic ir jo konkurentai, tokie kaip OpenAI, Google, Amazon ir pan., turi teisę mokytis apie viešuosius duomenis, įskaitant autorių teisių saugomus duomenis, neatlyginant ar neįskaitant tų duomenų kūrėjų.
Taigi, mes žinome tik tai, kad „Claude 3.5 Sonnet“ buvo išmokytas naudoti daug teksto ir vaizdų, kaip ir ankstesni Anthropic modeliai, taip pat žmonių bandytojų atsiliepimai, bandant „suderinti“ modelį su naudotojų ketinimais, tikėkimės, kad jis neišsiskverbtų nuodingų ar kitaip. probleminis tekstas.
Ką dar žinome? Na, Claude 3.5 Sonnet konteksto langas – teksto kiekis, kurį modelis gali išanalizuoti prieš generuodamas naują tekstą – yra 200 000 žetonų, tiek pat, kiek 3 soneto. Žetonai yra suskirstyti neapdorotų duomenų bitai, pavyzdžiui, žodyje „fantastic“ esantys skiemenys „fan“, „tas“ ir „tic“; 200 000 žetonų prilygsta maždaug 150 000 žodžių.
Ir mes žinome, kad Claude 3.5 Sonnetas yra prieinamas šiandien. Nemokami Anthropic žiniatinklio kliento ir Claude iOS programos naudotojai gali ją pasiekti nemokamai; „Anthropic“ mokamų planų „Claude Pro“ ir „Claude Team“ prenumeratoriai gauna 5 kartus didesnius tarifų limitus. 3.5 Sonnet taip pat veikia Anthropic API ir valdomose platformose, pvz., Amazon Bedrock ir Google Cloud Vertex AI.
„Claude 3.5 Sonnet iš tikrųjų yra žingsnis pokytis intelekto srityje, neprarandant greičio, ir jis paruošia mus būsimiems leidimams visoje Claude modelių šeimoje“, – sakė Gerstenhaber.
„Claude 3.5 Sonnet“ taip pat valdo artefaktus, kurie „Claude“ žiniatinklio kliento programoje atidaro specialų langą, kai vartotojas paprašo modelio generuoti turinį, pvz., kodo fragmentus, tekstinius dokumentus ar svetainės dizainą. Gerstenhaber paaiškina: „Artefaktai yra modelio išvestis, kuri perkelia sukurtą turinį į šalį ir leidžia jums, kaip vartotojui, kartoti tą turinį. Tarkime, kad norite sugeneruoti kodą – artefaktas bus įdėtas į vartotojo sąsają, tada galėsite pasikalbėti su Claude'u ir kartoti dokumentą, kad jį patobulintumėte, kad galėtumėte paleisti kodą.
Didesnis vaizdas
Taigi, kokia Claude 3.5 Sonneto reikšmė platesniame antropinio ir AI ekosistemos kontekste?
„Claude 3.5 Sonnet“ rodo, kad laipsniška pažanga yra tai, ko šiuo metu galime tikėtis modelio srityje, o tai neleidžia pasiekti didelio mokslinių tyrimų proveržio. Per pastaruosius kelis mėnesius buvo išleisti pavyzdiniai „Google“ („Gemini 1.5 Pro“) ir „OpenAI“ (GPT-4o) leidimai, kurių etalonas ir kokybinis našumas šiek tiek keičiasi. Tačiau ilgą laiką nebuvo šuolio, kad būtų galima suderinti šuolį nuo GPT-3 iki GPT-4, dėl šiandieninių modelių architektūrų nelankstumo ir didžiulio skaičiavimo, kurio jiems reikia treniruotis.
Kai generatyvaus dirbtinio intelekto pardavėjai atkreipia dėmesį į duomenų tvarkymą ir licencijavimą, o ne į perspektyvias naujas keičiamo dydžio architektūras, yra požymių, kad investuotojai nerimauja dėl ilgesnio, nei tikėtasi, generatyvaus DI IG. Anthropic yra šiek tiek užkrėstas nuo šio spaudimo, nes yra pavydėtinoje „Amazon“ (ir kiek mažiau „Google“) draudimo nuo OpenAI padėtyje. Tačiau bendrovės pajamos, kurios iki 2024 m. pabaigos sieks šiek tiek mažiau nei 1 mlrd.
Nepaisant augančios klientų bazės, apimančios buitinius prekių ženklus, tokius kaip Bridgewater, Brave, Slack ir DuckDuckGo, Anthropic vis dar neturi tam tikros įmonės. Iškalbinga tai, kad „PwC“ neseniai bendradarbiavo su „OpenAI“, o ne „Anthropic“, perparduodant generatyvius AI pasiūlymus įmonei.
Taigi Anthropic laikosi strateginio ir gerai išvystyto požiūrio į priekį, investuodama kūrimo laiką į tokius produktus kaip Claude 3.5 Sonnet, kad būtų užtikrintas šiek tiek geresnis našumas prekių kainomis. 3.5 Sonneto kaina tokia pati kaip ir 3 sonetų: 3 USD už milijoną žetonų, įvestų į modelį, ir 15 USD už milijoną modelio sugeneruotų žetonų.
Gerstenhaberis apie tai kalbėjo mūsų pokalbyje. „Kai kuriate taikomąją programą, galutinis vartotojas neturėtų žinoti, kuris modelis naudojamas arba kaip inžinierius optimizavo savo patirtį, – sakė jis, – bet inžinierius gali turėti įrankius, leidžiančius optimizuoti šią patirtį. kartu su vektoriais, kuriuos reikia optimizuoti, o kaina tikrai yra viena iš jų.
Claude 3.5 Sonnetas nesprendžia haliucinacijų problemos. Beveik neabejotinai daro klaidų. Tačiau tai gali būti pakankamai patrauklu, kad kūrėjai ir įmonės pereitų prie Anthropic platformos. Galų gale, tai yra svarbiausia Anthropic.
Siekdama to paties tikslo, Anthropic padvigubino įrankių, pavyzdžiui, eksperimentinio valdymo AI, skaičių, leidžiantį kūrėjams valdyti vidines modelių funkcijas; integracijos, leidžiančios modeliams atlikti veiksmus programose; ir pastatyti įrankiai viršuje savo modelių, tokių kaip anksčiau minėta artefaktų patirtis. Ji taip pat pasamdė „Instagram“ įkūrėją kaip produkto vadovą. Be to, ji išplėtė savo produktų prieinamumą, neseniai atveždama Claude į Europą ir įsteigdama biurus Londone ir Dubline.
Panašu, kad antropinis mąstymas atėjo į idėją, kad ekosistemos kūrimas aplink modelius, o ne tik modelius atskirai, yra raktas į klientų išlaikymą, nes modelių galimybių atotrūkis mažėja.
Vis dėlto Gerstenhaberis tvirtino, kad didesni ir geresni modeliai, tokie kaip Claude 3.5 Opus, yra netoli horizonto su tokiomis funkcijomis kaip paieška internete ir galimybė atsiminti nuostatas.
„Dar nemačiau, kad gilus mokymasis atsitrenktų į sieną, ir paliksiu tyrėjams spėlioti apie sieną, bet manau, kad dar anksti daryti išvadas, ypač jei žiūrite į tempą. naujovių“, – sakė jis. „Yra labai sparti plėtra ir labai sparčios naujovės, ir aš neturiu pagrindo manyti, kad tai sulėtės.
Pamatysime.