Google I/O 2023: Přínosy umělé inteligence pro všechny
Dobré ráno všem. Vítejte na Google I/O.
AI má za sebou rušný rok a máme si tedy dnes o čem povídat – tak pojďme na to!
Po sedmi letech, kdy se naše firma soustředila na umělou inteligenci, se nacházíme v bodě zlomu. Nyní máme příležitost učinit AI ještě užitečnější pro lidi, podniky, komunity, zkrátka pro všechny.
Umělá inteligence nám již delší dobu pomáhá přinášet mnohem užitečnější produkty. Generativní AI představuje další důležitý krok. Odvážně a zodpovědně měníme podobu všech našich klíčových produktů, včetně Vyhledávání.
Umělá inteligence v našich produktech
"Pomoz mi psát" v aplikaci Gmail
Na úvod několik příkladů, jak generativní AI pomáhá rozvíjet naše produkty, počínaje službou Gmail. V roce 2017 jsme spustili službu Smart Reply, krátké odpovědi, které jste si mohli vybrat jedním kliknutím. V dalším kroku jsme spustili funkci Smart Compose, která během psaní předkládá různá doporučení. Funkce Smart Compose následně vedla k dalším vyspělejším funkcím psaní s využitím AI, které byly použity jen za poslední rok ve Workspace více než 180miliardkrát. A nyní, s mnohem výkonnějším generativním modelem, podnikáme v Gmailu další krok s funkcí "Pomoz mi psát".
Řekněme, že jste dostali e-mail o zrušení vašeho letu. Letecká společnost vám nabízí poukaz, ale vy přitom chcete vrátit peníze v plné výši. Mohli byste odpovědět právě s využitím funkce "Pomoz mi psát".
Stačí zadat, co si přejete napsat – e-mail s žádostí o vrácení celé částky –, stisknout tlačítko “vytvořit” a zobrazí se kompletní návrh textu. Jak vidíte, pohodlně se do něj přetáhly údaje o letu z předchozího e-mailu. A docela se podobá tomu, co byste mohli chtít poslat. Možná ale text budete chtít ještě upřesnit. V tomto případě by podrobnější e-mail mohl pomoci zvýšit šanci na vrácení celé částky. Funkci "Pomoz mi psát" začneme zavádět v rámci aktualizací Workspace . A stejně jako u funkce Smart Compose uvidíte, že se bude v průběhu času postupně dále zlepšovat.
Nové podrobné zobrazení tras v Mapách
Dalším příkladem jsou Mapy. Již od prvních dnů Street View spojila umělá inteligence dohromady miliardy panoramatických snímků, aby lidé mohli prozkoumávat svět od monitoru svého počítače, mobilu nebo tabletu. Na loňské konferenci I/O jsme představili funkci Immersive View, která využívá AI k vytvoření vysoce věrného digitálního modelu daného místa, takže si jej lidé mohou prohlédnout ještě před jeho návštěvou.
Nyní stejnou technologii rozšiřujeme o to, co umí Mapy nejlépe: pomáhají vám dostat se na místo, kam potřebujete. Mapy Google poskytují každý den pokyny pro překonání 20 miliard kilometrů. Jen si představte, kolik je to výletů a cest! A teď si představte si, že byste si celou svoji připravenou trasu mohli prohlédnout předem. S funkcí Immersive View pro trasy je to nyní možné, ať už se pohybujete pěšky, na kole nebo autem.
Řekněme, že jsem v New Yorku a chci se projet na kole. Mapy mi nabídly několik možností poblíž místa, kde se nacházím. Líbí se mi ta kolem pobřeží, tak ji vyberme. Vypadá malebně a chci si ji nejdříve prohlédnout. Klepněte na možnost Immersive View a zobrazte si trasu. Je to úplně nový způsob, jak se předem podívat na vybranou cestu. Mohu si ji přiblížit, a nabídne se mi tak z ptačí perspektivy neuvěřitelný pohled na moji budoucí jízdu.
K dispozici jsou i další informace. Můžete se informovat o aktuální kvalitě ovzduší, o dopravě a počasí a můžete se i podívat, jak se budou měnit.
Službu Immersive View pro trasy začneme zavádět v létě a do konce roku bude spuštěna v 15 městech včetně například Londýna, New Yorku, Tokia a San Francisca.
Nový zážitek díky nástroji Magic Editor v aplikaci Fotky
Dalším produktem, který díky AI zaznamenal velký pokrok, jsou Fotky Google. Aplikaci jsme představili na konferenci I/O již v roce 2015 a byl to jeden z našich prvních produktů založených na AI. Průlomy ve strojovém učení umožnily vyhledávat ve fotografiích například lidi, západy slunce nebo vodopády.
Kromě vyhledávání vám chceme pomoci fotky také vylepšovat. Každý měsíc je ve Fotkách Google upraveno 1,7 miliardy snímků. Pokroky v oblasti AI nám k tomu poskytují stále výkonnější nástroje. Například funkce Magic Eraser, která byla jako první představena v zařízeních Pixel, využívá AI k odstranění nežádoucích rušivých prvků. A ještě letos vám kombinace sémantického porozumění a generativní AI umožní dělat ještě více, a to s pomocí nového nástroje Magic Editor.
Tady je příklad: Je to skvělá fotografie, ale jako rodič pravděpodobně chcete, aby v centru všeho dění bylo vaše dítě. A na téhle fotce to navíc vypadá, jako by balónky byly oříznuté. Můžete změnit polohu oslavence. Magic Editor automaticky doplní části lavičky a balónků, které na původním snímku chyběly. A jako poslední úpravu můžete změnit oblohu. Tím se upraví i osvětlení zbytku snímku, aby fotka byla konzistentní. Je to skutečné kouzlo. Nástroj Magic Editor v aplikaci Fotky Google budek dispozici ještě letos.
Užitečnější AI pro všechny
Od Gmailu přes Fotky až po Mapy – to je jen několik příkladů, jak vám AI pomůže v okamžicích, na kterých vám záleží. Pro maximální využití potenciálu AI v produktech, které znáte a máte rádi, toho ale můžeme udělat ještě mnohem víc.
Dnes máme 15 produktů, z nichž každý slouží více než půl miliardě lidí a organizací. Přičemž šest z těchto produktů využívají více než dvě miliardy uživatelů. To nám dává mnoho příležitostí k naplnění našeho poslání – uspořádat informace z celého světa tak, aby byly všeobecně dostupné a užitečné.
Toto nadčasové poslání se s každým dalším rokem stává více aktuální. Učinit umělou inteligenci užitečnější pro všechny představuje při pohledu do budoucna nejvýznamnější způsob, jak naše poslání posunout dál. Snažíme se o to těmito čtyřmi způsoby:
● Zaprvé tím, že zdokonalíte své znalosti a prohloubíte své chápání světa.
● Zadruhé, zvýšením kreativity a produktivity, abyste mohli vyjádřit své myšlenky a vše dotáhnout.
● Zatřetí tím, že vývojářům a firmám umožníme vytvářet vlastní přelomové produkty a služby.
● A konečně, odpovědným vytvářením a nasazováním AI, aby z ní měli všichni stejný prospěch.
PaLM 2 + Gemini
Jsme nadšeni z příležitostí, které nás čekají. Zda budou mít všichni užitek z rozvoje umělé inteligence, závisí na neustálém zdokonalování našich základních modelů. Chci se proto podělit o to, jak k nim přistupujeme.
Loni jsme hovořili o PaLM, který přinesl řadu vylepšení napříč našimi produkty. Dnes představujeme náš nejnovější model PaLM: PaLM 2.
PaLM 2 je postaven na našem základním výzkumu a vychází z naší nejnovější infrastruktury. Je velmi schopný v širokém spektru úloh a snadno se nasazuje. Dnes oznamujeme více než 25 produktů a funkcí, které PaLM 2 pohání.
Modely PaLM 2 nabízí vynikající základní schopnosti v široké škále velikostí. Láskyplně jsme je pojmenovali Gecko, Otter, Bison a Unicorn. Gecko je tak lehký, že může pracovat na mobilních zařízeních... dostatečně rychlý pro skvělé interaktivní aplikace v zařízení, a to i v režimu offline. Modely PaLM 2 jsou silnější v logice a zdůvodňování díky širokému základu v oblasti vědeckých a matematických témat. Je také vycvičen na vícejazyčném textu – zahrnuje více než 100 jazyků – takže rozumí a generuje rozmanité výsledky.
V kombinaci s výkonnými možnostmi kódování pomůže PaLM 2 i vývojářům po celém světě. Podívejme se na příklad. Řekněme, že pracujete s kolegou v Soulu a ladíte kód. Můžete ho požádat o opravu chyby a pomoci svému kolegovi tím, že do kódu přidáte komentáře v korejštině. Systém rozpozná, že kód je rekurzivní, a pak navrhne opravu. Vysvětlí důvody opravy, a jak vidíte, přidá korejské komentáře, jak jste žádali.
Přestože je PaLM 2 velmi schopný, skutečně zazáří, když je vyladěn na specifické znalosti pro danou oblast. Nedávno jsme vydali nástroj Sec-PaLM, upravený pro použití v oblasti bezpečnosti. Využívá umělou inteligenci k lepšímu odhalování škodlivých skriptů a pomůže bezpečnostním expertům pochopit a řešit hrozby.
Dalším příkladem je Med-PaLM 2, který je upraven na lékařské znalosti. Tímto jemným vyladěním bylo dosaženo devítinásobného snížení nepřesného zdůvodňování ve srovnání s modelem, čímž se přiblížil výkonu odborníků-lékařů, kteří odpovídali na stejnou sadu otázek. Ve skutečnosti byl Med-PaLM 2 prvním jazykovým modelem, který dosáhl výkonu na úrovni "experta" v otázkách typu odborné licenční zkoušky a v současné době představuje špičku v této oblasti.
Pracujeme také na doplnění funkcí systému Med-PaLM 2, aby mohl syntetizovat informace z lékařských snímků, jako jsou běžné snímky a mamografy. Můžete si jej představit jako spolupracovníka, který s využitím AI pomáhá radiologům interpretovat snímky a sdělovat výsledky. To jsou některé příklady využití PaLM 2 ve specializovaných oblastech. Nemůžeme se dočkat, až se bude používat v dalších. A proto s potěšením oznamuji, že PaLM 2 je nyní k dispozici v preview verzi.
PaLM 2 je nejnovějším krokem v naší desetileté cestě k tomu, aby se AI zodpovědnými způsoby dostala k miliardám lidí. Vychází z pokroku, kterého dosáhly naše dva špičkové výzkumné týmy, Brain Team a DeepMind.
Když se ohlédneme za rozhodujícími průlomy v oblasti AI v posledním desetiletí, zjistíme, že tyto týmy se podílely na značném počtu z nich: AlphaGo, Transformers, sekvenční modely atd. To vše pomohlo připravit půdu pro přelomové období, ve kterém se dnes nacházíme.
Nedávno jsme tyto dva týmy spojili do jednoho celku, Google DeepMind, který se zaměřuje na vytváření schopnějších systémů s využitím výpočetních zdrojů společnosti Google, a to bezpečně a zodpovědně.
Patří sem i Gemini, naše základna pro modely nové generace, která je stále ve fázi výcviku. Model Gemini byl od základu vytvořen tak, aby byl multimodální, vysoce efektivní v integraci nástrojů a rozhraní API a vytvořen tak, aby umožňoval další inovace, například v oblasti paměti a plánování. Ačkoli je stále ještě v rané fázi, již nyní jsme v porovnání s předchozími modely svědky působivých multimodálních schopností.
Po vyladění a důkladném otestování bezpečnosti bude Gemini k dispozici v různých velikostech a výkonech, stejně jako PaLM 2.
Zodpovědný přístup k AI: Nástroje pro identifikaci generovaného obsahu
S investicemi do výkonnějších modelů investujeme také do AI, která je založená na zodpovědném přístupu. Jde o nástroje pro identifikaci synteticky vytvořeného obsahu, kdykoli se s ním setkáte.
Dvě důležité metody jsou vodoznak a metadata. Vodoznaky vkládají informace přímo do obsahu způsobem, který je zachová i při drobných úpravách obrázků. Pokračujeme ve vytváření našich modelů tak, aby od začátku zahrnovaly vodoznak a další techniky.
Když se podíváte na tento syntetický obraz, je působivé, jak reálně vypadá, takže si asi dokážete představit, jak důležité tyto metody budou v budoucnu. Metadata umožňují tvůrcům přidat k souborům další kontext, takže vám poskytnou více informací, kdykoli se s obrázkem setkáte. Zajistíme, aby každý náš obrázek vytvořený AI tato metadata obsahoval. Přečtěte si více o našem zodpovědném přístupu.
Aktualizace aplikace Bard + Workspace
Jak se modely zdokonalují a umí toho více, je čím dál důležitější zpřístupnit je lidem, aby je mohli začít používat.
To je příležitost, kterou nabízí Bard, náš experiment s konverzační AI. Bard se rychle rozvíjí. Nyní podporuje širokou škálu programovacích schopností a je mnohem chytřejší v argumentaci a matematických výzvách. A ode dneška už plně běží na PaLM 2. Přečtěte si více o nejnovějších aktualizacích Barda.
Nové funkce přinášíme také do služby Google Workspace. Kromě funkce "Pomoz mi psát" v Dokumentech a Gmailu poskytuje Duet AI v Google Workspace nástroje pro generování obrázků z textových popisů v Prezentacích a Meet a jiných nástrojích. Přečtěte si další informace o nejnovějších aktualizacích Workspace.
Představujeme Labs
Jak se AI neustále rychle zdokonaluje, rozšiřujeme nabídku užitečných funkcí našim uživatelům. A počínaje dneškem vám nabízíme nový způsob, jak si vyzkoušet některé z funkcí ve službě Workspace a dalších produktech. Jmenuje se Labs. Já sice říkám nový, ale Google používá Labs jako nástroj pro zpřístupnění novinek a získání zpětné vazby od uživatelů už poměrně dlouho. Registrovat se můžete ještě dnes večer.
Vedle nových uživatelských zkušeností v rámci Workspace, které jste právě viděli, si budete moci vyzkoušet i nové funkce v našem základním produktu, Vyhledávání Google. Důvodem, proč jsme před mnoha lety začali investovat do AI, je právě to, že jsme viděli příležitosti pro zlepšení Vyhledávání. S každým dalším objevem se snažíme učinit jej užitečnější a intuitivnější.
Zlepšení v porozumění jazyku nám umožňuje klást otázky přirozeněji, a dostat se tak k nejužitečnějšímu obsahu na webu. Pokroky v počítačovém vidění pomohly zavést nové způsoby vizuálního vyhledávání. Když vám dnes schází slova, kterými byste popsali to, co hledáte, můžete si pomocí Google Lens vyhledat cokoli, co vidíte. Pomocí aplikace Lens lidé každý měsíc provedou více než 12 miliard vizuálních vyhledávání, což představuje čtyřnásobný nárůst za pouhé dva roky. Lens ve spojení s multimodalitou nás dovedl k multisearch (kombinovanému vyhledávání), který umožňuje vyhledávat pomocí kombinace obrázku i textu.
Když se podíváme do budoucna, hluboké porozumění informacím v kombinaci s jedinečnými schopnostmi generativní AI může opět vést k transformaci fungování Vyhledávání Google, nastolit zcela nové otázky, na které může Vyhledávání odpovědět, a vytvořit užitečnější uživatelskou zkušenost, která vás propojí s bohatstvím webu.
Použití generativní AI ve vyhledávání je samozřejmě teprve v počátcích. Lidé na celém světě se v kritických okamžicích spoléhají na Vyhledávání Google. Víme tedy, jak důležité je, abychom tyto funkce správně nastavili a nadále si udrželi důvěru našich uživatelů. To je vždy náš cíl.
Proto přistupujeme k inovacím zodpovědně a snažíme se o nejvyšší kvalitu informací, jak tomu je od samého počátku. Proto vám tuto zkušenost jako první přinášíme v prostředí Labs.
Usnadnění inovací ostatním
Zatím jsme se s vámi podělili o to, jak může AI pomoci zvýšit kreativitu, produktivitu a znalosti. Jak vidíte, AI není jen mocným prostředkem, ale představuje také velký posun platformy. Každá firma a organizace přemýšlí o tom, jak se transformovat. Proto se soustředíme na to, abychom ostatním usnadnili a umožnili inovace pomocí AI.
To znamená poskytovat nejmodernější výpočetní infrastrukturu – včetně nejmodernějších procesorů TPU a GPU – a rozšiřovat přístup k nejnovějším základním modelům společnosti Google, které byly důkladně testovány v našich vlastních produktech. Pracujeme také na poskytování prvotřídních nástrojů, aby zákazníci mohli trénovat, ladit a spouštět své vlastní modely – s bezpečností, zabezpečením a ochranou osobních údajů na podnikové úrovni. Přečtěte si další informace o těchto záměrech v textu od generálního ředitele Google Cloud Thomase Kuriana.
Pokrok se systémem Android
Jak jste dnes slyšeli, náš odvážný a zodpovědný přístup k AI pomůže rozvíjet kreativitu a potenciál lidí. Chceme také zajistit, aby se tato možnost dostala k co největšímu počtu lidí. Snažíme se o to prostřednictvím našich platforem, jako je Android, a dnes jsme mluvili i o tom, jak pokroky v oblasti AI mohou váš telefon ještě více personalizovat, včetně funkcí jako je Magic Compose, Cinematic Wallpapers a Generative AI Wallpapers.
Představujeme nová zařízení Pixel do kapsy i do domácnosti
Představujeme také Pixel 7a, Pixel Fold a Pixel Tablet, které tvoří kompletní ekosystém zařízení, která jsou poháněna AI a navržena společností Google. Pixel 7a je k dispozici ke koupi ode dneška a předobjednávky na Pixel Fold a Pixel Tablet právě začínají.
Budoucnost vytváříme společně
Závěrem mi dovolte se zamyslet nad velkými technologickými změnami, kterých jsme všichni součástí. Posun v oblasti AI je tak velký, jak jen může být, a proto je důležité, aby byla AI užitečná skutečně pro všechny.
Přistupujeme k tomu odvážně a s radostí. A děláme to zodpovědně, způsobem, který podtrhuje naše hluboké odhodlání udělat to správně.
Žádná společnost toto nezvládne sama. Naše komunita vývojářů bude klíčem k otevření obrovských příležitostí, které leží před námi. Těšíme se na spolupráci a budování. Takže jménem nás všech ve společnosti Google: Děkujeme vám a užijte si zbytek I/O.
Záznam z Google I/O najdete zde.