Przedstawiamy PaLM 2
W ostatniej dekadzie nie zabrakło ogromnych przełomów w dziedzinie sztucznej inteligencji, a my mieliśmy w nich spory udział. Rewolucyjne prace Google nad modelami podstawowymi stały się punktem wyjścia dla całej branży i podstawą produktów opartych na AI używanych codziennie przez miliardy ludzi. Wciąż pracujemy nad odpowiedzialnym rozwijaniem tych technologii i widzimy ogromny potencjał zastosowania ich w sektorze opieki zdrowotnej i pracy twórczej.
Podczas ostatnich 10 lat pracy nad sztuczną inteligencją odkryliśmy, ile można osiągnąć dzięki skalowaniu sieci neuronowych. Tak naprawdę widzieliśmy już spektakularne możliwości takich sieci w większych zbiorach danych. Jednak przekonaliśmy się także, że nie zawsze wszystko to, co jest większe, jest także lepsze, oraz że kreatywność badawcza to klucz do tworzenia świetnych modeli. Dzięki zdobytej wiedzy w zakresie tworzenia i trenowania modeli wiemy już, jak otworzyć furtkę do multimodalności, jak ważne są informacje zwrotne od człowieka w całym procesie, a także jak jeszcze skuteczniej budować nowe modele. Są to niezwykle istotne elementy składowe, które pozwolą nam rozwijać najnowocześniejszą technologię AI, która może przynieść ludziom realne korzyści w ich codziennym życiu.
Przedstawiamy PaLM 2
Bazując na naszej poprzedniej pracy, stworzyliśmy PaLM 2 – najnowocześniejszy model językowy nowej generacji, który chcielibyśmy dzisiaj przedstawić. Charakteryzuje się ulepszonymi umiejętnościami tworzenia i rozumienia treści w wielu językach, rozumowania oraz generowania kodu.
- Tworzenie i rozumienie treści w wielu językach: model PaLM 2 jest trenowany na wielojęzycznym zbiorze danych obejmującym ponad 100 języków. Znacznie zwiększyło to jego możliwość interpretowania, tłumaczenia i generowania bardziej złożonego tekstu (w tym frazeologizmów, wierszy czy zagadek) w różnych językach oraz rozwiązywania trudnych zadań. Co więcej, PaLM 2 zdaje także zaawansowane egzaminy językowe na poziomie eksperckim.
- Rozumowanie: szeroko zakrojony zbiór danych wykorzystywany w modelu PaLM 2 obejmuje artykuły naukowe oraz strony internetowe, które zawierają wyrażenia matematyczne. Dzięki temu model wykazuje przełomowe umiejętności w zakresie wnioskowania logicznego, rozumowania zdroworozsądkowego i matematycznego.
- Generowanie kodu: do trenowania modelu PaLM 2 wykorzystaliśmy ogromną ilość publicznie dostępnych zbiorów kodów źródłowych, dzięki czemu świetnie sobie radzi z zadaniami z zakresu kodowania w popularnych językach programowania, jak Python czy JavaScript, a także jest w stanie wygenerować specjalistyczny kod w innych językach, jak na przykład Prolog, Fortran czy Verilog.
Wszechstronna rodzina modeli
Model PaLM 2 nie tylko więcej potrafi, ale jest też szybszy, bardziej wydajny niż poprzednie modele i jest dostępny w różnych rozmiarach, co ułatwi jego szerokie zastosowanie. Planujemy udostępnić PaLM 2 w 4 rozmiarach (w kolejności od najmniejszego do największego): Gecko, Otter, Bison i Unicorn. Gecko jest niezwykle lekki, co czyni go idealnym rozwiązaniem na urządzenia mobilne, a także wystarczająco szybki, aby wykorzystać go w interaktywnych aplikacjach na urządzeniu (nawet takich, z których można korzystać bez połączenia z siecią). Wszechstronność oznacza, że model PaLM 2 można dostosować tak, aby znalazł zastosowanie w różnego rodzaju produktach i tym samym pomagał większej liczbie ludzi.
PaLM 2 wspomaga pracę 25 usług i funkcji Google
Podczas dzisiejszej konferencji I/O ogłosiliśmy, że wiele zespołów w Google wykorzystuje już model PaLM 2 w codziennej pracy oraz że 25 kolejnych usług i funkcji jest zasilanych tym modelem językowym. Oznacza to, że już w tej chwili najnowsze zaawansowane możliwości AI są dostępne w naszych produktach i mogą z nich korzystać nasi użytkownicy – klienci, programiści i różnej wielkości firmy z całego świata. Oto kilka przykładów:
- Ulepszone umiejętności PaLM 2 związane z wielojęzycznością pozwalają nam udostępniać Barda w kolejnych językach (już od dzisiaj). W dodatku model ten od niedawna pomaga użytkownikom wykonywać zadania programistyczne.
- Funkcje Workspace, które pomagają w pisaniu e-maili w Gmailu i podsumowań w Dokumentach Google oraz porządkowaniu danych w Arkuszach Google, wykorzystują możliwości modelu PaLM 2, dzięki czemu użytkownicy mogą wykonywać swoją pracę lepiej i szybciej.
- Med-PaLM 2, wytrenowany przez nasze zespoły badawcze zajmujące się tematyką zdrowia, których członkowie posiadają wiedzę medyczną, potrafi odpowiadać na pytania i podsumować informacje z różnego rodzaju obszernych tekstów medycznych. Osiąga spektakularne wyniki w zakresie kompetencji medycznych i był pierwszym dużym modelem językowym, który tak dobrze poradził sobie podczas odpowiadania na pytania z amerykańskiego egzaminu medycznego. Teraz rozszerzymy ten model o możliwości multimodalne, które pozwolą na syntetyzowanie informacji, takich jak zdjęcia rentgenowskie i mammograficzne, aby pewnego dnia poprawić wyniki leczenia pacjentów. Model Med-PaLM 2 jeszcze tego lata zostanie udostępniony niewielkiej grupie klientów korzystających z usługi Cloud w celu zebrania opinii, które pomogą nam określić jego bezpieczne i przydatne zastosowania.
- Sec-PaLM to wyspecjalizowana wersja PaLM 2 wytrenowana w dziedzinie zabezpieczeń, która może być ogromnym krokiem naprzód, jeśli chodzi o analizę cyberbezpieczeństwa. Dostępny w ramach Google Cloud model wykorzystuje sztuczną inteligencję do analizowania potencjalnie niebezpiecznego kodu i skuteczniejszego wykrywania skryptów, które stanowią rzeczywiste zagrożenie dla ludzi i organizacji w dzisiejszych czasach.
- W marcu udostępniliśmy niewielkiej grupie programistów interfejs PaLM API do testowania, a od dziś programiści mogą zgłosić swoje zainteresowanie korzystaniem z modelu PaLM 2. Już od pewnego czasu nasi klienci mogą przekonać się, jak on działa, w ramach platformy Vertex AI wyróżniającej się ochroną prywatności, zabezpieczeniami i funkcjami zarządzania klasy biznesowej. Model PaLM 2 jest też wykorzystywany w opartym na generatywnej sztucznej inteligencji projekcie Duet AI for Google Cloud, który powstał z myślą o tym, aby pomóc użytkownikom uczyć się, tworzyć i działać szybciej niż kiedykolwiek wcześniej.
Rozwój przyszłości sztucznej inteligencji
PaLM 2 pokazuje wpływ wysoce wydajnych modeli o różnych rozmiarach i szybkościach na nasze życie oraz udowadnia, że wszechstronne modele sztucznej inteligencji przynoszą realne korzyści.