Dźwięk – wyzwanie dziennikarstwa na kolejną dekadę

Artykuł pierwotnie ukazał się w serwisie Europejskiego Obserwatorium Dziennikarskiego.

Mijają lata, a prasa ciągle walczy o byt w wirtualnym świecie. Wreszcie pierwsze prenumeraty cyfrowe zaczynają przynosić na tyle duże zyski, że można realnie myśleć o subskrypcji online w kategoriach ratunku dla gazet. Choć do stabilizacji rynku prasy w erze cyfrowej jeszcze bardzo daleka droga, za rogiem czai się kolejne wyzwanie, z którym media będą musiały się zmierzyć albo wykorzystać w służbie sobie i swoim interesom na rynku medialnym. Tym wyzwaniem jest dźwięk.

Amazon Echo (Alexa), Google Home (Asystent Google), Apple HomePod (Siri). Kto ma choć ogólne pojęcie o nowych technologiach, ten wie, że największe firmy technologiczne świata prowadzą właśnie ekspansję inteligentnych głośników (i asystentów głosowych). To nic innego, jak sztuczna inteligencja zaprzęgnięta do tego, by w formie głosu komunikować się z użytkownikiem i wykonywać jego polecenia w postaci odnajdywania w internecie interesujących go tematów czy włączania ulubionych aplikacji bądź programów. Tak prezentują się najbardziej podstawowe funkcje asystentów głosowych, ale możliwości, które daje sztuczna inteligencja (ang. artifical intelligence – AI), jest znacznie więcej. Tyle, że większość z nich nie została jeszcze wymyślona. Nic nie szkodzi. Specjaliści i tak mają co robić, bo dotychczas nam znane ciągle wymagają mnóstwa pracy, nakładów finansowych i zmian, by sprostać ewoluującym potrzebom społeczeństwa.

Zapewne żadna z branż biznesu nie omieszka spróbować, jak może wykorzystać tę technologię do celów biznesowych. Podobnie jest z mediami, które pochłonięte odnajdywaniem się w cyfrowej rzeczywistości już wiedzą, że kolejne wyzwanie i szanse na rozwój są związane właśnie ze sztuczną inteligencją. Niektóre wielkie koncerny medialne już podjęły działania, aby eksperymentować, wyznaczać trendy i przekonywać do siebie pierwszych użytkowników. Przyjrzyjmy się, jak to robią.

Perspektywa potężnego rozwoju

Nazwy najpopularniejszych asystentów głosowych, należących do największych firm technologicznych na świecie, w Stanach Zjednoczonych wymawia się w środku nocy bez zająknięcia. W Polsce nadal nieliczni zdają sobie sprawę z istnienia tego typu urządzeń, choć świadomość społeczeństwa regularnie wzrasta.

Od 2017 roku National Public Radio i Edison Research publikują raporty dotyczące rynku inteligentnych głośników. Wyniki najnowszego badania opublikowane po raz pierwszy w styczniu podczas CTA Research Summit na targach CES 2019 w Las Vegas wskazują, że już 21% populacji Stanów Zjednoczonych korzysta z co najmniej jednego inteligentnego głośnika. To 53 miliony dorosłych obywateli tego kraju, który liczy ponad 328 milionów mieszkańców. Biorąc pod uwagę, że w 2017 roku tego typu urządzenia posiadało raptem 7% amerykańskiego społeczeństwa, mówimy o znaczącej ekspansji.

W 2019 roku prym w USA wiodą inteligentne głośniki Echo wyprodukowane przez Amazon. Posiada je już 63,3% ogółu osób, które korzystają z tej technologii. Sztuczna inteligencja, choć ciągle bardzo niedoskonała i z wielu względów kłopotliwa, przyciąga jak magnes zarówno pasjonatów nowych technologii, jak i przedstawicieli kolejnych branż, które upatrują w połączeniu głośników z asystentem głosowym szansy na duży zarobek.

Rozrywka dla dzieci, czyli biznes dla dorosłych

Mukul Devichand, redaktor wykonawczy BBC Voice + AI przytoczył na blogu „Technology + Creativity Blog” sentencję wypowiedzianą w 1936 roku przez jednego z byłych dziennikarzy stacji: „Będziecie oglądać narodziny nowej sztuki”. To zdanie odnosiło się do powstania telewizji. Osiemdziesiąt lat później wiadomo, że jej istnienie całkowicie zmieniło funkcjonowanie mediów i było prawdziwą rewolucją, stając się jednym z symboli cyfrowego świata. Dzisiaj stajemy u progu wynalazku, który ponownie może wywrócić świat mediów do góry nogami, tworząc nową rzeczywistość, a przynajmniej mocno ją modyfikując. Mowa o sztucznej inteligencji zaprzęgniętej do obsługi tzw. inteligentnych głośników.

BBC powołało specjalny zespół ludzi zajmujących się opracowaniem sposobów wykorzystania sztucznej inteligencji na potrzeby koncernu. To nie jest chwilowy zachwyt. Już w maju ubiegłego roku przedstawiciele tej firmy doskonale zdawali sobie sprawę, jakie możliwości niesie ta gałąź nowych technologii dla dziennikarstwa i rozrywki. Wystąpienia podczas konferencji BBC Sounds Amazing tylko to potwierdziły. Otwierając to wydarzenie Matthew Postgate, główny specjalista do spraw technologii produktów w dziale projektowania i inżynierii w BBC, powiedział, że „w przeciwieństwie do obrazu, dźwięk jest wszechobecny, kiedy znajdujemy się w stanie świadomości. Uszy nigdy się nie zamykają. Muszą być ważniejsze niż oczy”.

Jego opinia nie wzięła się znikąd. Już w grudniu 2017 roku największy nadawca publiczny na świecie dał możliwość korzystania z pierwszych usług sygnowanych logiem BBC w asystentach głosowych Amazona, Google’a i Apple’a. Były to stacje radiowe oraz podcasty. „Przez cały rok ulepszaliśmy to doświadczenie – integrując na przykład niektóre treści audio BBC Sounds i dodając do tego ogromną bibliotekę programów radiowych BBC w wersji na żądanie” – pisał w styczniu 2019 roku Mukul Devichand na jednym z blogów należących do nadawcy.

Od końca 2017 roku sporo się zmieniło, choć brytyjski koncern ciągle jest na początku drogi i dopiero uczy się, jak wykorzystywać sztuczną inteligencję do prezentowania nowych formatów słuchaczom. Niedawno została uruchomiona usługa dla dzieci. Popularny kanał telewizyjny BBC Cbeebiees doczekał się wersji audio. „Próbowaliśmy przyjąć filozofię ludzi takich jak Leslie Mitchell, który jeszcze w 1936 roku zdał sobie sprawę, że telewizja wymaga nowego sposobu robienia rzeczy stworzonych wcześniej dla radia. Jako prezenter pierwszego programu telewizyjnego BBC założył on, że nierealistyczne byłoby oczekiwanie pozostania anonimowym, tak jak było to wtedy w przypadku prowadzących audycję radiową” – podkreśla Devichand.

W ubiegłym roku najmłodsi słuchacze, dzięki sztucznej inteligencji, mogli porozmawiać ze swoimi ulubionymi postaciami znanymi z kanału telewizyjnego BBC skierowanego właśnie do nich. To jednak tylko jeden z pomysłów na wykorzystanie asystentów głosowych. Brytyjski nadawca nie rezygnuje też z bardziej tradycyjnych form spędzania czasu „przy głośniku”. Pojawiły się quizy, gry w wersji audio, słuchanie muzyki. „Chcemy dać też możliwość zarówno dzieciom, jak i rodzicom wysłuchania tradycyjnych bajek na dobranoc opowiedzianych przez Toma Hardy’ego i Dolly Parton”.

Potencjał informacji

W Stanach Zjednoczonych interesująco wygląda ekspansja informacyjna skierowana do dorosłych użytkowników asystentów głosowych zaimplementowanych w „inteligentnych głośnikach”. Koncerny medialne w tym kraju coraz większy nacisk kładą na sferę informacyjną. Stąd pomysł, aby stworzyć aplikację NPR One (wcześniej Infinite Player) należącą do National Public Radio – publicznego nadawcy w USA.

W trakcie nocy wyborczej w 2016 roku użytkownicy mogli poprosić Alexę o przedstawienie skrótu informacji dotyczących tego tematu. Prawdziwe spektrum możliwości przygotowanych przez pracowników NPR ma być dostępne podczas kampanii wyborczej w wyborach prezydenckich w 2020 roku.

Pomysłów nie brakuje także na tak prostą funkcjonalność, jak poproszenie sztuczną inteligencję o przedstawienie najnowszych wiadomości. „Ta prosta prośba ma potencjał, by rzucić wyzwanie fundamentom radia, przekształcić transmisje w rozmowy, zmienić historie, które ludzie słyszą i stworzyć zindywidualizowane strumienie informacji” – pisze dla Nieman Report Gabe Bullard, ekspert rynku audio związany z Nieman Lab, a wcześniej przez niemal dekadę z NPR.

Istotne dane na temat tej technologii zaprezentowali badacze z Reuters Institute, którzy w raporcie „The Future of Voice and the Implications for News” zawarli następujący wykres, dotyczący najważniejszych, zdaniem użytkowników, funkcji inteligentnych głośników:

Najważniejsze funkcje inteligentnych głośników wg ich użytkowników, źródło: https://reutersinstitute.politics.ox.ac.uk

Aktualności znajdują się dopiero na piątym miejscu pod względem aktywności, do których użytkownicy najczęściej wykorzystują inteligentne głośniki. Prośba o przedstawienie informacji przez asystenta głosowego jest regularnie używana przez 46 proc. społeczeństwa korzystającego z tej technologii, ale tylko dla jednego procenta jest najbardziej ceniony.

Może to oznaczać, że potencjał jest ogromny, ale zwykłe proszenie o skrót informacji to zdecydowanie za mało. Należy znaleźć nowe możliwości i sposoby konsumowania tego typu treści przez użytkowników. Niewykluczone, że powstaną nowe formaty prezentowania informacji dostosowane i dostępne wyłącznie dla asystentów głosowych. W tej chwili nie istnieje funkcjonalność w tym zakresie, która zrobiłaby różnicę i wzbudziła zainteresowanie większej liczby użytkowników.

Problemy podcastów

Sztuczna inteligencja oraz jej wykorzystanie w inteligentnych głośnikach może być także krokiem milowym dla rozwoju podcastów przeżywających prawdziwy boom. Pod koniec 2018 roku redaktorzy Nieman Lab należącego do Harvard University, serwisu badającego rozwój mediów, poprosili ekspertów z branży medialnej z całego świata o podzielenie się przewidywaniami dotyczącymi tego, jak będzie wyglądał rynek mediów w 2019 roku. Wielu z nich zwróciło uwagę właśnie na podcasty, a ostatnie dziewięć miesięcy pokazało, że nie mylili się.

Powstaje coraz więcej podcastów. Tworzą je już nie tylko pasjonaci, którzy nie znaleźli dla siebie miejsca w tradycyjnym radiu, ale także – a może przede wszystkim – duże koncerny medialne, które odkryły potencjał w przekazywaniu informacji za pomocą głosu i szukają sposobów na monetyzację tej formy publicystyki. Podcasty produkują dzisiaj największe gazety świata jak The New York Times (patrz: The Daily) i The Guardian (patrz: m.in. Today in Focus) oraz telewizja CNN (patrz: Boss Files i inne).

Poproszenie inteligentnego asystenta głosowego o włączenie podcastu to dzisiaj najbardziej banalna rzecz na świecie. Stworzenie ekosystemu pozwalającego kreować odcinki na podstawie możliwości wyboru, w którą stronę ma się toczyć dyskusja, to wyzwanie, przed którym niedługo staną twórcy tego typu treści, chcący zaangażować społeczność do aktywnego uczestnictwa, a nawet stania się częścią opowieści.

Obecnie zainteresowanie tą kategorią usług jest znikome. Dostrzegli już to eksperci, którzy podczas sierpniowej konferencji Broadcasters Meet Podcasters zorganizowanej przez Jacobs Media, rozmawiali na ten temat. Paneliści zauważyli, że nawet w USA, gdzie inteligentnych głośników używa 21 procent populacji, nadal występują duże problemy z upowszechnianiem tych usug. Jak podkreślili, bardzo rzadko można usłyszeć od autorów podcastów, aby zapraszali do słuchania ich poprzez te urządzenia.

Kolejną bolączką jest brak synchronizacji chociażby z aplikacjami na smartfony, na których wielu ludzi codziennie słucha podcastów. „Uczestnicy dyskusji zauważyli, że ​​koordynacja inteligentnego głośnika z aplikacją byłaby idealna, podobnie jak w przypadku Audible, które śledzi postępy słuchacza w słuchaniu książki na wielu platformach” – relacjonuje przebieg panelu Steven Goldstein, prezes Amplifi Media zajmującej się opracowywaniem cyfrowej strategii rozwoju dla treści audio. Ważną rolę może odgrywać także poziom skomplikowania komunikatów. Bret Kinsella, założyciel Voicebot.Ai zasugerował, że za pomocą głosu trudno znaleźć nowy interesujący podcast, dlatego należy skupić się na najprostszych rzeczach i schematach, ograniczając poziom skomplikowania do minimum.

T Brand Studio rusza na podbój

Usługi skierowane do słuchaczy to pierwsze, co przychodzi do głowy na myśl o korzystaniu z inteligentnych głośników. Prawdą jest jednak, że żaden biznes nie będzie istniał bez odpowiedniego finansowania. I tutaj pojawia się pytanie: jak monetyzować aktywność wydawców w tej sferze? Odpowiedzi, a może bardziej czegoś w rodzaju inspiracji, można szukać w The New York Times, a konkretnie w T Brand Studio. To dział marketingu zajmujący się tworzeniem treści i doświadczenia, które „pobudzają wyobraźnię i wpływają na odbiorców na całym świecie”. Tak przedstawia siebie ta instytucja. Jednak łatwiej można uznać ją za odrębny byt odpowiedzialny za tworzenie czegoś w rodzaju reklam natywnych z kreatywnym przedstawieniem w multimedialnej i ciekawej dla oka wersji informacji o projektach bądź firmach.

T Brand Studio powstało m.in. dzięki przejęciu wpływowej agencji zajmującej się marketingiem – Hello Society czy agencji projektowej Fake Love, specjalizującej się w projektach na żywo. W połączeniu ze zdobytymi umiejętnościami i wiedzą w zakresie rozszerzonej i wirtualnej rzeczywistości, daje to dużą przewagę nad konkurencją i sprawia, że cel, jaki postawili przed sobą właściciele New York Times, aby do 2020 roku osiągnąć 800 milionów dolarów cyfrowych dochodów, staje się całkiem realny.

Biorąc pod uwagę, jaką popularnością cieszy się codzienny podcast The Daily autorstwa Michaela Barbaro z NYT, trudno nie odnieść wrażenia, że asystenci głosowi będą kolejną płaszczyzną, na której legendarna amerykańska gazeta będzie chciała zarobić poprzez angażujące, wciągające i kreatywne reklamy.

Inteligentny głośnik (na)uczy?

Szukając przykładów wykorzystania sztucznej inteligencji w inteligentnych głośnikach, zacząłem się zastanawiać, do czego jeszcze może zostać wykorzystana ta technologia. Szybko przyszła mi do głowy edukacja, a dokładnie nauka języków obcych. W dzisiejszych czasach niezagospodarowane nisze – szczególnie w świecie nowych technologii – to rzadkość. Dlatego nie musiałem długo szukać głośnika, który oferuje właśnie taką usługę. Mowa o firmie Indiegogo, która oferuje urządzenie o nazwie „Lily” – jak reklamują – uczące języka chińskiego. Kolejne to hiszpański i francuski uruchomione po II kwartale 2019 roku. Następne języki będą prawdopodobnie kwestią czasu.

Jak informują producenci, „Lily” została stworzona „z myślą o słuchaniu muzyki”. Szybko jednak rozszerzono jej umiejętności o zupełnie nowe dziedziny jak nauka języków obcych. To rynek, który rozwija się bardzo dynamicznie i już dzisiaj należy postawić sobie pytanie, jak bardzo inteligentne głośniki oraz sztuczna inteligencja zmienią sposób ich uczenia się. A może dzięki tego typu urządzeniom w ogóle nie będziemy musieli posługiwać się obcymi językami, a będą robiły to za nas właśnie one?

Ogromne możliwości

Od czasu premiery pierwszego iPhone’a w 2007 roku, a więc telefonu z dotykowym ekranem, który na nowo zdefiniował mobilny rynek telefonii komórkowej, nie było na świecie urządzenia, które zmieniłoby równie dużo. Jestem przekonany, że właśnie ono nadeszło – to inteligentny głośnik, który nada dźwiękowi nową jakość, a przede wszystkim wartość, otwierając cały wachlarz możliwości dostępnych w świecie internetu, nowych technologii, marketingu i biznesu.

Zainteresowanie na razie jest odwrotnie proporcjonalne do umiejętności i oferowanych możliwości przez te systemy, ale jest tylko kwestią czasu, aż dostawcy treści nadążą za ewoluującym światem nowych technologii. Zwykło się mówić, że marketing kreuje potrzeby. Ja uważam, że rozwój technologii także. Teraz nadszedł czas na ich zaspokojenie być może w niespotykany dotąd sposób. Pierwsi liderzy już są. Czekamy na kolejnych.