Gemini 1.5: Model umělé inteligence nové generace od Googlu je téměř připraven

Sotva dva měsíce po spuštění Gemini, velký jazykový model, jak Google doufá, jej vynese na vrchol odvětví AI, společnost již oznamuje jeho nástupce. Google dnes spouští Gemini 1.5 a zpřístupňuje jej vývojářům a podnikovým uživatelům před úplným zavedením pro spotřebitele, které bude brzy. Společnost dala jasně najevo, že na Gemini jako na obchodní nástroj, osobního asistenta a vše mezi tím, a že tento plán tvrdě prosazuje.

V Gemini 1.5 je spousta vylepšení: Gemini 1.5 Pro, univerzální model v systému Google, je zjevně srovnatelný s high-end Gemini Ultra, který společnost uvedla teprve nedávno, a porazil Gemini 1.0 Pro o 87 procent. srovnávacích testů. Byl vytvořen pomocí stále běžnější techniky známé jako „Mixture of Experts“ nebo MoE, což znamená, že spustí pouze část celkového modelu, když odešlete dotaz, místo aby celou věc zpracovával celou dobu. (Zde je dobré vysvětlení na toto téma.) Tento přístup by měl urychlit používání modelu a zefektivnit jeho běh pro Google.

Ale je tu jedna nová věc v Gemini 1.5, ze které je celá společnost, počínaje generálním ředitelem Sundarem Pichaiem, obzvláště nadšená: Gemini 1.5 má obrovské kontextové okno, což znamená, že dokáže zpracovat mnohem větší dotazy a podívat se na mnohem více informací najednou. Toto okno je neuvěřitelných 1 milion tokenů ve srovnání se 128 000 pro OpenAI GPT-4 a 32 000 pro aktuální Gemini Pro. Tokeny jsou choulostivá metrika (zde je dobrý rozpis), takže Pichai to zjednodušuje: „Je to asi 10 nebo 11 hodin videa, desítky tisíc řádků kódu.“ Kontextové okno znamená, že se můžete robota AI zeptat na veškerý obsah najednou.

(Pichai také říká, že výzkumníci Google testují kontextové okno s 10 miliony tokenů – to je celá řada Hra o trůny všechno najednou.)

Když mi to vysvětluje, Pichai nedbale poznamená, že se vejdeš celý Pán prstenů trilogii do toho kontextového okna. Zdá se mi to příliš konkrétní, tak se ho ptám: to už se stalo, ne? Někdo v Googlu jen kontroluje, jestli Gemini nezaznamená nějaké chyby v kontinuitě, snaží se pochopit komplikovanou linii Středozemě a zjišťuje, jestli snad umělá inteligence konečně dá smysl Tomu Bombadilovi. “Jsem si jistý, že se to stalo,” říká Pichai se smíchem, “nebo se to stane – jeden z těch dvou.”

Pichai si také myslí, že větší kontextové okno bude pro podniky nesmírně užitečné. „To umožňuje případy použití, kdy můžete v okamžiku dotazu přidat mnoho osobních souvislostí a informací,“ říká. “Přemýšlejte o tom, protože jsme dramaticky rozšířili okno dotazů.” Představuje si, že by filmaři mohli nahrát celý svůj film a zeptat se Gemini, co by na to mohli říct recenzenti; vidí společnosti, které používají Blížence k prohlížení masy finančních záznamů. „Vnímám to jako jeden z největších průlomů, které jsme udělali,“ říká.

Gemini 1.5 bude prozatím k dispozici pouze firemním uživatelům a vývojářům prostřednictvím Vertex AI a AI Studio společnosti Google. Nakonec nahradí Gemini 1.0 a standardní verze Gemini Pro – ta dostupná všem na gemini.google.com a v aplikacích společnosti – bude 1,5 Pro s kontextovým oknem se 128 000 tokeny. Abyste se dostali k milionu, budete si muset připlatit. Google také testuje bezpečnostní a etické hranice modelu, zejména pokud jde o nově větší kontextové okno.

Google je v krkolomném závodě o vytvoření nejlepšího nástroje umělé inteligence právě teď, když se podniky po celém světě snaží přijít na svou vlastní strategii umělé inteligence – a zda podepsat své vývojářské smlouvy s OpenAI, Googlem nebo někým jiným. Zrovna tento týden OpenAI oznámilo „paměť“ pro ChatGPT a zdá se, že se připravuje na posun do vyhledávání na webu. Zatím se zdá, že Gemini je působivý, zejména pro ty, kteří již v ekosystému Google jsou, ale na všech stranách zbývá ještě spousta práce.

Nakonec, Pichai mi říká, že všechny tyto 1.0 a 1.5 a Pro a Ultra a firemní bitvy nebudou uživatelům ve skutečnosti záležet. “Lidé budou jen konzumovat zážitky,” říká. “Je to jako používat smartphone, aniž byste vždy věnovali pozornost procesoru pod ním.” Ale v tuto chvíli jsme podle něj stále ve fázi, kdy každý zná čip uvnitř svého telefonu, protože na něm záleží. „Základní technologie se tak rychle posouvá,“ říká. “Lidem je to jedno.”

Leave a Reply

Your email address will not be published. Required fields are marked *