Asystent Google – żywy język wyzwaniem dla maszyny

12

Pisząc swój poprzedni, entuzjastyczny tekst na temat Asystenta Google – przypomniałem sobie, jak to wszystko się u mnie w tym temacie zaczynało. I zdecydowanie za moją najbardziej zaangażowaną interakcję z tym rozwiązaniem odpowiadał inteligentny zegarek.

Były to czasy, kiedy nikt o żadnym Asystencie nie śnił. Całą uwagę koncentrował za to Google Now.
Kiedy czytam o naszym obecnym bohaterze na oficjalnej stronie Google przygotowanej pod polskiego użytkownika, kiedy przeglądam komendy, które należy mu wydawać oraz kiedy konfrontuję to ze wspomnianym Google Now – widzę, że (nieco paradoksalnie) za wiele się nie zmieniło w podstawowych założeniach tego, jak to działa w Asystencie. Oczywiście Google Now był nastawiony na wypowiadanie suchych zapytań. Nie miał ambicji uczenia się, nie opowiadał dowcipów, nie potrafił podpowiadać skojarzonych kontekstowo informacji.

Pamiętam, że to Nexus 5 od LG na dobre rozpoczął moją przygodę z Google Now, ale dopiero kupienie pierwszego smartwatcha Samsunga Gear Live (TUTAJ prehistoryczna recenzja) zapoczątkowało u mnie wielką miłość do werbalnego obsługiwania swoich sprzętów.

Było to jakieś 4-5 lat temu. Usługa głosowa od giganta technologicznego z Mountain View była wtedy dostępna gł. jako strumień wiadomości i newsów, a w obsłudze werbalnej wyłącznie w języku angielskim i tak też z tego korzystałem. Generalnie była to orka na ugorze. Bo np. mogłem wywołać opcję wysłania SMS-a, ale komunikatu nie dawało się podyktować po polsku. Google Now nie potrafił też odnaleźć się w szerszym kontekście związanym z Polską, więc wyszukiwanie informacji na tematy związane z naszym krajem było bardzo karkołomne. Ale dawało to namiastkę tego, co miało nadejść.

Z czasem Google Now zaczęło wspierać nasz język. Wciąż jednak opierało się na sztywnych komendach i prostych odpowiedziach. Asystent Google obiecuje coś innego – konwersację. Oznacza to, że nie tylko będzie potrafił udzielać odpowiedzi, ale też nawiąże z nami nić relacji. A, że komunikowanie się głosem jest dla nas najbardziej pierwotne i naturalne, toteż istnieje duża szansa, że właśnie w ten sposób będziemy porozumiewać się z maszynami w nadchodzącej przyszłości. Tak przynajmniej chcieliby twórcy asystentek głosowych, takich jak Amazon Alexa, Microsoft Cortana, Apple Siri, czy w końcu Google Assistant.

Gdzieś czytałem komentarz, że Asystent Google w obecnej odsłonie to niewielki krok. Zupełnie nie mogę się z tym zgodzić.

Po pierwsze dlatego, że widzę, jaki progres nastąpił względem Google Now. Po drugie dlatego, że nawet gdyby nie brać tego pod uwagę, to jednak pokaż mi drugą tak zaawansowaną usługę, która na naszym rynku mogłaby się sprawdzać tak szeroko i tak zarazem elastycznie. Zresztą sądzę, że problem tkwi w czym innym – a mianowicie w naturalnym przejściu do porządku dziennego, że ze sprzętem (maszyną) można rozmawiać. Że może ona oferować coś więcej niż tylko komunikat na linii komenda odpowiedź, ale prowokować do podtrzymywania dialogu. Pomagać w organizacji czasu, zadań, wyzwań, które przed nami.

A to ośmielenie się, jest dzisiaj – tak sądzę – największym wyzwaniem dla asystentek głosowych w ogóle.

Dla mnie to na ten moment prawie żaden problem, bo zacząłem kilka lat temu i wtedy to naprawdę wzbudzałem zainteresowanie. Napisałem jednak „prawie”, bo pomimo swej otwartości i dość grubej skóry muszę przyznać, że jest wiele sytuacji, w których się od komunikowania głosowego ze smartfonem czy smartwatchem powstrzymuję. Dla przykładu – rzadko dyktuję SMS-y w tramwaju, czy autobusie komunikacji miejskiej, kiedy jest wokół mnie zbyt ciasno…

Tak naprawdę, to w ogóle nie dyktuję dłuższych maili, bo wymaga to mozolnej korekty, gdyż Asystent nie potrafi stawiać kropek, przecinków, średników, myślników, znaków zapytania etc. A w zatłoczonej przestrzeni, kiedy wypowiadam komendę „OK Google…”, wszyscy naokoło już na mnie patrzą z zaciekawieniem. No i słuchają. A ja nie chcę, by ci ludzie wiedzieli co chcę zakomunikować Żonie, czy z kim planuję wieczorne spotkanie oraz w jakim miejscu.

Pewnym problemem jest też fakt, że Asystent reaguje na dowolnie wypowiedzianą frazę „OK Google”. Teoretycznie model głosu zapisywany jest na telefonie, ale wielokrotnie zdarzyło mi się, że na moje „OK Google” reagował smartfon Żony. Więcej nawet – czasami Asystent (a wcześniej Google Now) aktywuje się po wypowiedzeniu samego słowa „OK”. Myślę, że Google musiałby też dobrze przemyśleć strategię upowszechniania Asystenta, tak by nie sprowadzić go wyłącznie do roli opowiadacza sucharskich kawałów, czy sprawdzacza ile kalorii ma awokado.

Po tych wszystkich latach zauważyłem też, że z Asystenta Google korzysta się najlepiej na smartwatchu. Przynajmniej mi.

Po telefon sięgam wówczas praktycznie w znikomych sytuacjach, które wymagają ode mnie bardziej zaangażowanej interakcji. A to sprawia, że bateria w smartfonie działa o wiele lepiej i dłużej. Mogę też dzięki temu zminimalizować ilość akcji, którym poświęcamy czas. Osobiście uwielbiam wpisywać przez Asystenta przypomnienia do kalendarza, które nie do końca potrafię ulokować w czasie do realizacji.

I tu znowu przykład: muszę odebrać paczkę z punktu, gdzie zostawił ją kurier, ale nie wiem, o której będzie to godzinie, bo jestem na drugim końcu miasta i mam jeszcze kilkanaście innych rzeczy do zrobienia. Wówczas mówię „OK Google, przypomnij mi żebym odebrał paczkę, kiedy będę w domu” (ten punkt znajduje się blisko miejsca mojego zamieszkania). Oczywiście, jeśli wiem, którędy będę wracał, mogę podać konkretną ulicę. Przypomnienie pojawi się dokładnie wtedy, kiedy będzie przeze mnie pożądane. No, ale trzeba wpierw pozwolić Google na śledzenie naszej aktywności na podstawie lokalizacji.

Druga rzecz, która z pewnością wpłynie na udaną lub nieudaną adaptację Asystenta to to – jak bardzo w życiu codziennym korzystamy z pewnych rozwiązań w tradycyjny sposób.

Jeśli ktoś organizuje sobie dzień bez kalendarza, bo nie ma codziennie iluś spotkań i nie potrzebuje wszystkiego notować, to po opcje związane z nim nie będzie sięgać. Jeśli ktoś nie prowadzi interaktywnej i współdzielonej listy zakupów, to i tutaj Asystent w niczym mu nie pomoże. To samo tyczy się notatek w Keep, czy innej apce do tego celu przeznaczonej. Jak się ma bardziej wysublimowany gust, to repertuar filmów granych w multipleksach też nie będzie zaspokajał naszych potrzeb związanych z wyszukaniem fajnego seansu, a te zdarzają się w licznych kameralnych kinach studyjnych.

Trzecia rzecz, która może przesądzić o sukcesie Asystenta Google to udana współpraca z urządzeniami peryferyjnymi. W tym kontekście rzucają mi się kolejne dwie powtarzające wady.

Pierwsza to brak zasięgu jakiejkolwiek sieci komórkowej lub WiFi, co skutkuje tym, że Asystent po prostu nie chce działać. Tutaj obocznie można jeszcze dodać – słaba jakość połączenia, bo wówczas nie jest w stanie szybko przetworzyć zapytania, wysłać na serwer i odebrać odpowiedzi, którą wypowie lub wyświetli na ekranie telefonu/zegarka/tabletu etc. I tak – jak już się przyzwyczaicie do tej usługi, to wypad nad polskie morze lub w góry do jakiejś małej wsi szybko uzmysłowi Wam, jak wiele czasu oszczędzamy na pisaniu. To są całe minuty, które spokojnie w ciągu dnia mogą przeistoczyć się w dziesiątki minut, jeśli nie dobrą godzinę, dwie.

Drugi minus, który ja zauważyłem, związany jest z połączenia pary – telefon i smartwatch. Niestety, ale te nie zawsze utrzymują ze sobą stabilne połączenie. Co więcej – i zegarek i smartfon potrafią pokazywać, że sprzęt jest ze sobą idealnie sparowany, a przychodzące notyfikacje tylko nas w tym utwierdzają. Niestety – wielokrotnie coś na tej linii nie działa, jak należy i kiedy chce się podyktować jakąś komendę przez zegarek, to pojawia się komunikat o niedostępności w danym momencie usługi.

I nie ma znaczenia ani producent telefonu ani zegarka. Jako, że testuję sporo tego sprzętu – wyraźnie widzę, że albo to wina softu po jednej ze stron albo jakości samego połączenia bluetooth, które z jakichś przyczyn nie do końca radzi sobie z wywołaniem Asystenta w zegarku i przerzucaniem zapytania do telefonu. Niemniej częste występowanie takich niedogodnień na pewno nie będzie sprzyjało powodzeniu w używaniu Asystenta.

Sądzę, że Asystent, jest z jednej strony wyzwaniem dla Google.

Raz, że gigant musi wymyślić, jak zacząć go monetyzować. Dwa – przekonać ludzi, że warto w to pójść. Trochę przypomina mi to sytuację ze sklepem z aplikacjami. Konkurencyjne platformy mobilne nie są w stanie zagrozić Apple i Google, bo nie posiadają swoich tak bogato wyposażonych wspomnianych sklepów z apkami. W tym kontekście na Asystenta można spojrzeć, jak na swoisty rodzaj sklepu. Jeśli nie będzie z nim współpracowało wielu dostawców różnych usług, po prostu będzie bezużyteczny na dłuższą metę lub po prostu jego funkcjonalność będzie cały czas na niskim poziomie adaptacji.

Grunt jednak, że w Polsce tworzy już swój grunt. Pierwsi jego partnerzy, to u nas sieć Play oraz serwis wyszukujący tanie loty eSky. Im więcej partnerów, tym szerszy nacisk na edukowanie i zachęcanie ludzi do takiej a nie innej formy komunikacji. Z czasem to na pewno chwyci, ale solidnie trzeba podlać glebę odpowiednimi, intuicyjnymi, naturalnymi komendami.

No, a z drugiej strony – dla Asystenta wyzwaniem jest sam… język.

Jak wiemy, jest on tworem niezwykle żywym i tak szybko ewoluującym, że nie nadążają za nim słowniki. To dość kluczowe – bo to organizm. Na pewno, jeśli masz dziecko w wieku szkolnym łapiesz się na tym, że nie chwytasz jego slangu. Asystent musi takich rzeczy uczyć się równo z tymi, którzy te językowe zmiany projektują. Podobnie partnerzy Google będą musieli ciągle poprawiać swoje zapytania, komendy i odpowiedzi – aby pasowały one do tych, którzy chcą za ich pomocą używać Asystenta oraz otrzymywali zrozumiałe dla siebie informacje. A te nie mogą być sztuczne, chropowate, nieaktualne językowo – bo to będzie pierwsza najgroźniejsza przeszkoda dla Asystenta – bariera komunikacyjna.

Sam jestem ciekaw tego rozwoju. Sądzę, że pierwsze sensowne wnioski będzie można wysnuć za dwa lata. Kiedy Asystent Google okrzepnie w języku polskim, a maszyna zmierzy się z niełatwą – aczkolwiek bardzo żywą – polszczyzną. Ja też przyłożę się do tego, aby programiści mieli co robić.

 

****
Zdjęcie tytułowe

Share.

About Author

Niedźwiedź - ROAR! Redaktor Naczelny https://90sekund.pl. Pasjonat humanistyki cyfrowej oraz literatury Myśliwskiego, Pamuka, Cabrea i biegania.