Gemini dla organizacji na całym świecie

13 Gru, 2023

Thomas Kurian

Tekst Gemini dla organizacji na całym świecie

Przez cały 2023 rok udostępnialiśmy naszym klientom oraz szerszej społeczności programistów i użytkowników kolejne innowacje w dziedzinie sztucznej inteligencji, w tym AI Hypercomputer do trenowania i obsługi modeli generatywnej AI, wsparcie dla generatywnej AI w usłudze Vertex, czyli naszej platformie AI dla firm, Duet AI w Google Workspace oraz Duet AI for Google Cloud. Wprowadziliśmy też szereg nowych funkcji w naszej infrastrukturze zoptymalizowanej pod kątem AI, osiągając zauważalne postępy w zakresie GPU, TPU, oprogramowania ML i kompilatorów, zarządzania obciążeniami i innych działań, a także wiele innowacji w Vertex AI oraz całkowicie nowy zestaw możliwości zapewnianych przez agenty Duet AI w usługach Google Workspace i Google Cloud Platform.

Już teraz obserwujemy ogromny wzrost zainteresowania wśród programistów i użytkowników. Na przykład między II a III kwartałem tego roku liczba aktywnych projektów opartych na generatywnej AI na platformie Vertex AI wzrosła ponad 7-krotnie. Wiodące marki, takie jak Forbes, Formuła E i Spotify, używają Vertex AI do tworzenia własnych agentów, a firmy Anthropic, AI21 Labs i Cohere trenują własne modele. Zakres i kreatywność aplikacji, które opracowują nasi klienci, zapiera dech w piersiach. Fox Sports przygotowuje bardziej angażujące treści, Priceline buduje cyfrowego pomocnika podróży, Six Flags tworzy cyfrowego konsjerża, a Estée Lauder opracowuje cyfrowego menedżera marki.

Dzisiaj wprowadzamy szereg ważnych usprawnień w całym naszym stosie AI opartym na Gemini – najbardziej zaawansowanym i uniwersalnym modelu stworzonym przez nas dotychczas. Gemini od początku powstawał z założeniem multimodalności, co oznacza, że potrafi generalizować oraz bezproblemowo rozumieć i wykorzystywać różne typy informacji, w tym tekst, kod, dźwięki, obrazy i wideo, tak samo jak ludzie widzą, słyszą, odczytują i omawiają różne rodzaje informacji jednocześnie.

Jednolity stos AI w Google Cloud

Od dzisiaj Gemini jest częścią pionowo zintegrowanego i zoptymalizowanego stosu technologii AI, który składa się z kilku ważnych elementów zaprojektowanych tak, aby ze sobą współdziałały:

Wysoce skalowalna infrastruktura AI: Google Cloud oferuje wiodącą, zoptymalizowaną pod kątem AI infrastrukturę dla firm (tę samą, której używa Google) do trenowania i obsługi modeli. Oferujemy tę infrastrukturę jako usługę w naszych regionach chmurowych z możliwością uruchomienia w centrach danych z Google Distributed Cloud i na urządzeniach brzegowych. Cały nasz stos infrastruktury AI został zbudowany z uwzględnieniem współprojektowania na poziomie systemowym, aby zwiększyć wydajność i produktywność podczas trenowania, dostrajania i obsługi AI.
Modele klasy światowej: Dostarczamy modele AI o różnych umiejętnościach. Pod koniec 2022 roku uruchomiliśmy nasz językowy model Pathways (PaLM), niedługo po nim PaLM 2, a teraz Gemini Pro. Wprowadziliśmy również modele wyspecjalizowane w konkretnych dziedzinach, takie jak Med-PaLM i Sec-PaLM.
Vertex AI – wiodąca platforma komercyjna AI dla programistów: Aby pomóc programistom w budowaniu agentów i integrowaniu generatywnej AI w aplikacjach, ulepszyliśmy Vertex AI – naszą platformę do rozwoju AI. Vertex AI pomaga klientom odkrywać, dostosowywać, wzbogacać i wdrażać agenty stworzone na podstawie API Gemini oraz 130 wyselekcjonowanych modeli AI typu open-source i pochodzących od firm zewnętrznych, które spełniają rygorystyczne standardy bezpieczeństwa i jakości Google dla przedsiębiorstw. Vertex AI korzysta z wbudowanych ustawień ochrony prywatności i zarządzania danymi Google Cloud, a także oferuje narzędzia umożliwiające programistom odpowiedzialne i bezpieczne korzystanie z modeli. Dodatkowo Vertex AI obejmuje Search and Conversation, czyli narzędzia niewymagające pisania dużej ilości kodu służące do tworzenia zaawansowanych, działających w wielu kanałach agentów umożliwiających wyszukiwanie i konwersację.
Duet AI – współpraca z AI w Workspace i Google Cloud: Duet AI to nasz oparty na AI pomocnik, który ułatwia użytkownikom korzystanie z Google Workspace i Google Cloud. Na przykład Duet AI w Google Workspace pomaga użytkownikom pisać, tworzyć obrazy, analizować arkusze kalkulacyjne, tworzyć i streszczać e-maile oraz wiadomości na czacie i podsumowywać spotkania. Duet AI w Google Cloud ułatwia takie czynności jak kodowanie, wdrażanie, skalowanie i monitorowanie aplikacji, a także identyfikowanie zagrożeń w zakresie cyberbezpieczeństwa i szybsze radzenie sobie z nimi.

Dzisiaj z przyjemnością ogłaszamy nowości w każdym z tych obszarów:

Wzmocnienie naszej światowej klasy infrastruktury

W miarę jak modele generatywnej AI stają się coraz bardziej rozbudowane i złożone, rosną również ich wymagania w zakresie trenowania, dostrajania i wnioskowania. W rezultacie wykładniczo rośnie też zapotrzebowanie na wysokowydajną, łatwo skalowalną i opłacalną infrastrukturę AI do trenowania i obsługi modeli.

Dotyczy to nie tylko naszych klientów, ale także Google. Akceleratory TPU od dawna stanowią podstawę do trenowania i obsługi produktów opartych na AI, takich jak YouTube, Gmail, Mapy Google, Google Play i Android. Model Gemini również został wytrenowany na TPU i jest przez nie obsługiwany.

W zeszłym tygodniu zaprezentowaliśmy Cloud TPU v5p, nasz najmocniejszy, najbardziej skalowalny i najelastyczniejszy akcelerator AI. TPU v5p jest 4 razy bardziej skalowalny niż TPU v4 pod względem dostępnych FLOPs na pod. Wcześniej w tym roku ogłosiliśmy szersze udostępnienie Cloud TPU v5e. W porównaniu z poprzednią generacją TPU v4 jego wydajność w zakresie wnioskowania zmierzona za pomocą standardowych testów branżowych jest 2,7-krotnie wyższa na każdego wydanego dolara, co oznacza jest to nasze najbardziej wydajne kosztowo TPU dotychczas.

Zaprezentowaliśmy również AI Hypercomputer – przełomową architekturę superkomputera, która oferuje zintegrowany system obejmujący zoptymalizowany pod kątem wydajności sprzęt, otwarte oprogramowanie, wiodące platformy ML i elastyczne modele cenowe. AI Hypercomputer zapewnia szeroką gamę opcji akceleratorów, w tym wiele klas TPU piątej generacji i GPU marki NVIDIA.

Dostarczanie najnowszych przełomowych modeli

Gemini to również nasz najbardziej elastyczny model do tej pory – zdolny do efektywnego działania w różnorodnych środowiskach, od centrów danych po urządzenia mobilne. Gemini Ultra to nasz największy i najbardziej zaawansowany model do wysoce złożonych zadań, Gemini Pro najlepiej nadaje się do skalowania w szerokim zakresie zadań, a Gemini Nano to najbardziej wydajny model do wykonywania zadań bezpośrednio na urządzeniach. Jego zaawansowane możliwości w znacznym stopniu wspomogą programistów i przedsiębiorstwa w wykorzystywaniu AI do tworzenia i skalowania własnych rozwiązań.

Dzisiaj wprowadziliśmy również ulepszoną wersję modelu Imagen 2, czyli najbardziej zaawansowanej technologii zamiany tekstu na obraz. Najnowsza wersja zapewnia większy realizm fotograficzny, renderowanie tekstu i możliwości generowania logotypów, dzięki czemu można łatwo tworzyć obrazy z nakładkami tekstowymi i logo.

Jeśli chodzi o nasze osiągnięcia w dziedzinie modeli wyspecjalizowanych w konkretnej dziedzinie, takich jak Med-PaLM, z przyjemnością ogłaszamy MedLM, naszą platformę modeli medycznych. Jest ona dostępna dla wybranych klientów w Vertex AI i oferuje moc modeli podstawowych Google dostrojonych na podstawie wiedzy medycznej.

Ulepszanie platformy Vertex AI za pomocą Gemini

Dzisiaj ogłaszamy, że Gemini Pro jest teraz dostępne w wersji przedpremierowej na platformie Vertex AI. Model ten umożliwia programistom tworzenie nowych i zróżnicowanych agentów, które mogą przetwarzać informacje obejmujące tekst, kod, dźwięk, obrazy i wideo. Vertex AI pomaga wdrażać agenty do produkcji, automatycznie oceniać jakość i wiarygodność ich odpowiedzi, a także monitorować je i nimi zarządzać.

Vertex AI oferuje wszechstronne wsparcie dla Gemini i umożliwia odkrywanie, dostosowywanie, wzbogacanie i wdrażanie agentów bazujących na API Gemini oraz zarządzanie nimi, w tym:

Wiele sposobów dostosowywania agentów opartych na Gemini przy użyciu własnych danych, w tym poprzez tworzenie promptów, dostrajanie oparte na adapterach, np. Low-Rank Adaptation (LoRA), uczenie się przez wzmocnienie na podstawie informacji zwrotnych od ludzi (RLHF) i destylację.
Narzędzia do augmentacji, które umożliwiają agentom wykorzystanie wektorów dystrybucyjnych do pobierania, rozumienia i wykorzystywania informacji z rzeczywistego świata za pomocą konfigurowalnych bloków w ramach technologii RAG (retrieval-augmented generation). Vertex AI oferuje również rozszerzenia umożliwiające podejmowanie działań w imieniu użytkowników w aplikacjach firm zewnętrznych.
Osadzenie w rzeczywistości (grounding) w celu poprawy jakości odpowiedzi udzielanych przez Gemini i inne modele AI poprzez porównywanie wyników z wysokiej jakości źródłami danych z internetu i danymi własnymi firm.
Rozbudowany zestaw ustawień, które umożliwiają bezpieczne i odpowiedzialne korzystanie z modeli generatywnej AI, w tym z Gemini.

Oprócz wprowadzenia Gemini do Vertex AI ogłaszamy również:

Automatic Side by Side (Auto SxS) – zautomatyzowane narzędzie do porównywania modeli. Auto SxS jest szybsze i bardziej wydajne kosztowo niż ręczna ocena modelu. Dodatkowo można je dostosować do różnych specyfikacji zadań w ramach nowych przypadków użycia generatywnej AI.
Dodanie Mistral, ImageBind i DITO do gamy modeli Vertex AI w ramach naszego zaangażowania w tworzenie otwartego ekosystemu modeli.
Wkrótce wprowadzimy Gemini Pro do narzędzi Search and Conversation w Vertex AI, aby ułatwić szybkie tworzenie angażujących aplikacji klasy produkcyjnej.

Poszerzanie możliwości Duet AI

Wprowadzając Duet AI, chcemy pomóc naszym klientom w zwiększaniu produktywności, zdobywaniu przewagi konkurencyjnej i ostatecznej poprawie wyników finansowych. Od dziś usługi Duet for Developers oraz Duet AI in Security Operations są ogólnie dostępne, a w ciągu najbliższych kilku tygodni wdrożymy Gemini w całym portfolio Duet AI.

Duet AI for Developers pomaga programistom i programistkom szybciej pisać kod dzięki opartym na AI funkcjom uzupełniania i generowania kodu oraz dostępowi do czatu w wielu zintegrowanych środowiskach programistycznych (IDE). Usługa usprawnia wykonywanie powtarzalnych zadań i procesów programistycznych za pomocą skrótów do najczęstszych działań, w tym do generowania testów jednostkowych i wyjaśniania kodu, a także przyspiesza rozwiązywanie problemów i usuwanie błędów oraz pomaga ograniczyć konieczność ciągłego przełączania się między zadaniami. Duet AI również wspomaga naukę nowych umiejętności, dając możliwość zadawania pytań w oknie czatu za pomocą języka naturalnego.

Dzisiaj ogłaszamy również, że ponad 25 partnerów w dziedzinie wspomagania kodowania i tworzenia baz wiedzy udostępni nam zestawy danych specyficznych dla ich platform, dzięki czemu użytkownicy Duet AI for Developers będą mogli korzystać z pomocy AI opartej na modelach kodowania i danych, dokumentacji produktów, najlepszych praktykach i innych przydatnych zasobach dla firm zapewnionych przez tych partnerów.

Duet AI in Security Operations, czyli jednolita platforma w zakresie działań dotyczących bezpieczeństwa w Google Cloud, może pomóc skuteczniej chronić organizacje przed cyberatakami. Zespoły ds. bezpieczeństwa mogą rozwijać swoje umiejętności i przyspieszyć wykrywanie zagrożeń, analizowanie ich oraz reagowanie na nie, wykorzystując moc generatywnej AI. W ramach Duet AI in Security Operations oferujemy też pomoc AI w Chronicle, dzięki której można przeszukiwać ogromne ilości danych w kilka sekund za pomocą niestandardowych zapytań generowanych w języku naturalnym, ograniczyć czasochłonną weryfikację ręczną, szybko wydobywać kluczowy kontekst, wykorzystując automatyczne podsumowania danych i alertów, oraz poprawić czas reakcji, korzystając z rekomendacji kolejnych kroków w celu usuwania incydentów.

Google zarządza całym stosem technologicznym Duet AI, od infrastruktury i modeli podstawowych po integrację najwyższego poziomu i doświadczenia użytkownika. Jesteśmy dumni, że nasi inżynierowie i badacze współpracują ze sobą, aby dostarczać klientom przełomowe technologie z dziedziny AI, zapewniając jednocześnie konsekwentne i jednolite wrażenia użytkownikom i użytkowniczkom tych usług. Na początku przyszłego roku planujemy rozszerzyć Duet AI na całe portfolio, w tym na BigQuery, Lookera, rozwiązania do obsługi baz danych, Apigee i inne usługi.

Napędzanie kolejnej generacji rozwiązań opartych na AI

Oprócz nowych możliwości w całym naszym pionowo zintegrowanym stosie technologicznym AI oferujemy konkurencyjne ceny, które sprawiają, że Gemini jest dostępne dla większej liczby organizacji. Dodatkowo przyjmujemy na siebie większą odpowiedzialność, aby chronić użytkowników przed ewentualnymi problemami związanymi z prawami autorskimi.

Model Gemini w połączeniu z naszym portfolio wysoce skalowalnej infrastruktury AI, platformą Vertex AI i Duet AI oferuje kompleksowe i potężne rozwiązania chmurowe dla programistów i klientów. Dzięki tym innowacjom Google Cloud napędza powstanie kolejnej generacji agentów opartych na AI działających we wszystkich branżach, umożliwiając organizacjom tworzenie, używanie i skuteczne wdrażanie generatywnej AI oraz przyspieszając transformację

MIEJSCE PUBLIKACJI: