Komputery naśladujące głos użytkownika

Zespół naukowców pod przewodnictwem Noriko Suzuki pracował w laboratorium ATR Media Information Science system komputerowy, który jest zdolny do naśladowania cech charakterystycznych głosu użytkownika komputera. System powstał w oparciu o badania nad powstawaniem więzi międzyludzkich.

Więź porozumienia powstaje przy wielu różnych okazjach, np. kiedy małe dziecko naśladuje swoich rodziców, czy gdy papuga powtarza wypowiedziane przez nas słowa. Kluczową rolę w tworzeniu więzi z inną osobą odgrywa metoda rozpoznawania próby nawiązania wzajemnego porozumienia. Jak mówi Timothy Bickmore, ekspert w dziedzinie interakcji człowiek – komputer laboratorium Media Lab Uniwersytetu Massachusetts Institute of Technology – „Naśladowanie i odzwierciedlanie wzajemnych zachowań między osobami jest związane z rosnącą więzią i porozumieniem jakie się pomiędzy nimi wytwarza. To podobne zjawisko jak tworzenie zaufania pomiędzy terapeutą i pacjentem”.

W celu zweryfikowania poglądu o tym, czy komputer może nawiązać porozumienie z użytkownikiem, Suzuki zaprosił ochotników do eksperymentu, który polegał na tym, że ludzie współpracowali z animowaną postacią na ekranie, do której mieli się zwracać jak do rocznego dziecka. Zadaniem osób uczestniczących w eksperymencie było ułożenie zwierzątka – zabawki, z gotowych bloków. W trakcie układania, mieli oni nazywać poszczególne elementy zwierzęcia, a tym samym uczyć animowaną postać. Jako interakcja, animowana postać nuciła melodię, która odwzorowywała charakterystyczne cechy głosu użytkownika, m. in. rytm, intonację, głośność i wysokość dźwięku. W eksperymencie zastosowano różny stopień naśladowania głosu użytkownika.

Po wykonaniu zadania, użytkownicy oceniali cechy animowanej postaci, w tym zdolność do współpracy, umiejętność uczenia się, możliwość realizacji poleconych zadań, przyjazność i sympatię. Okazało się, że postać osiągnęła maksymalną wartość wszystkich tych wskaźników, gdy stopień naśladowania głosu użytkownika wynosił 80%. Jak powiedział Suzuki, użytkownicy spotkali się z czymś, co można określić mianem emocji komputera, choć w rzeczywistości było to tylko odwzorowanie barwy i intonacji głosu użytkownika. W opinii naukowców, brakujące 20% podobieństwa do własnego głosu dawało uczestnikom eksperymentu poczucie swobody i niezależności postaci z komputera.

Suzuki twierdzi, że system naśladowania głosu użytkownika w interakcji człowieka z komputerem będzie się stale rozwijał. „Obecnie ludzie nieco się obawiają robotów mówiących sztucznych głosem. W przypadku, gdy roboty będą mówić bardziej ludzkimi głosami, mogą one się stać bardziej sympatyczne” – powiedział Suzuki.

Również Bickmore z MIT jest zdania, tego typu naśladownictwo może pomóc ludziom budować więź z postaciami komputerowymi i robotami, a co więcej stwarza ono szansę wzbogacenia o nową jakość gier komputerowych i zabawek.

W przeszłości zaistniało już wiele pomysłów, aby dokonać personalizacji komputerów (np. animowany asystent pakietu Office), które w większości przypadków kończyły się fiaskiem.

O tym, czy podobny los czeka wynalazek Suzuki, przekonamy się w ciągu najbliższych kilku lat…