NIEDOSKONAŁOŚCI

Tak jak nie możemy stale przypominać sobie, iż wad­liwy film jest tworem sztucznym, nie możemy również stale przypominać sobie, że nienaturalna szybkość ruchu lub mowy jest tylko funkcją technologii. Postanowiliśmy zbadać synchronizację mowy i ruchów ust, ponieważ ludzie mają szerokie doświadczenie w obcowaniu z głosami zsynchronizowanymi z ruchami ust. To pozwala im łatwo rozpoznawać niedoskonałości synchronizacji, nawet jeśli mogą, koniec końców, nie brać tego pod uwagę. Innym powo­dem, dla którego zaczęliśmy od tego właśnie problemu, jest fakt, że zsynchronizowanie wideo z audio jest często w no­wych mediach niedoskonałe, szczególnie jeśli chodzi o kom­putery pokazujące filmy wideo oraz wideokonferencje, zwłasz­cza internetowe. W wielu przypadkach trudno jest znaleźć szerokość pasma lub szybkość obliczeniową odpowiednią do uzyskania całkowicie naturalnej prezentacji. Coś trzeba po­święcić, i dotyczy to właśnie często synchronizacji dźwięku z obrazem.

ODMIENNY POGLĄD

Istnieje jednak całkiem odmienny pogląd na tę sprawę. Mimo że ludzie mogą być zdolni, by świadomie pomijać problemy z mediami, trudności techniczne i tak okazują się niezwykłym doświadczeniem psychologicznym. Nienaturalne­go odmierzania czasu nie można zignorować ani przebaczyć, usprawiedliwiając ów stan systemem transmisji, nawet jeśli wydaje się rzeczą oczywistą, skąd bierze się to dziwne zjawis­ko, i nawet jeśli wydaje się nierozsądne, aby osoba, która zna się na technice, mogła dopuścić do sytuacji, że tego rodzaju problem wpłynął na jej ocenę.Biorąca udział w wideokonferencji osoba, która wygląda tak, jakby miała szarpane ruchy, nie jest po prostu kimś upo­śledzonym przez technologię. Jest to także obraz osoby, która nie porusza się dobrze, osoby niezręcznej i nieskoordynowa­nej. Oceny kompetencji mówcy, jakkolwiek nieistotny wyda­wałby się w tym wypadku problem techniczny, mogą w związ­ku z tym ulec zmianie. Przeprowadzając to badanie nienaturalnych doświadczeń, założyliśmy, że skoro małe odcinki czasowe są ważne w świe­cie rzeczywistym, będą zatem równie istotne dla świata me­diów.

BRAK SYNCHRONIZACJI

Brak synchronizacji pomiędzy ustami a mową umniejsza wiarygodność prezentacji medialnych. Jeśli nawet przedsta­wiani mówcy sami są niewiarygodni, spodziewamy się, że ruchy ust i głos będą zsynchronizowane. Nawet jeśli „mówcą” takim będzie ptak, wymagamy przynajmniej synchroniczności dzioba z wydawanym dźwiękiem. Ludziom zależy na natural­ności w mediach nawet wtedy, gdy przedstawiane są postacie, których nie moglibyśmy sobie w innej sytuacji wyobrazić.Co się dzieje, jeśli jedna lub więcej podstawowych cech związanych z synchronizacją zostaje upośledzonych? A co w przypadku, jeśli obrazy i dźwięki tworzące media zostają tak zmienione, że przedstawiają ludzi w sposób, którego widzowie nigdy nie doświadczają? Sądzimy, że istnieją dwie możli­wości.Projektanci mediów uważają na ogół, że ludzie są tak skon­centrowani na treści mediów, iż mogą wybaczyć niewielkie niedoskonałości synchronizacji. Rozważmy system wideokon­ferencji, który pokazuje obrazy z częstotliwością klatek mniej­szą od niezbędnej dla uzyskania wrażenia naturalnego ruchu.Zgodnie z tym poglądem niedoskonałości nie stanowią prob­lemu. Oczekuje się, że użytkownicy wyrozumiale zignorują niedoskonałości w zamian za wygodę komunikowania się z ko­legami z odległych miejsc.

MEDIA A DOPASOWANIE W CZASIE

Odmierzanie czasu na ekranie zdarza się w tradycyjnych me­diach, takich jak telewizja lub film, lecz jest to zjawisko rzadkie. Generalnie rzecz biorąc, kwestia dopasowania w czasie dotyczy ludzi faktycznie ze sobą rozmawiających, a nie technologii per se.Nowsze media jednak dość często stwarzają problemy z syn­chronizacją, które nie mogą zaistnieć w świecie rzeczywistym. W systemach wideokonferencji na przykład oko może wykryć przejścia pomiędzy klatkami, kiedy zastosuje się ich zbyt mało. W rezultacie można zaobserwować dziwaczne szarp­nięcia, kiedy ludzie poruszają się. To samo dzieje się, a zjawis­ko to jest jeszcze bardziej wyraźne, w przypadku nowych wideofonów oraz niektórych programów komputerowych od­twarzających wideo.Jeden z najbardziej zauważalnych błędów występuje wtedy, gdy usta nie poruszają się synchronicznie do słów, które się z nich wydobywają. Widzowie wpatrują się w poruszające się usta, skupiając uwagę na niedopasowaniu dźwięku z ruchem ust, zamiast koncentrować się na tym, co się mówi.

SYNCHRONICZNOŚĆ

Rozważmy następującą przyjacielską wymianę zdań: Jak ci się podobał szkic ostatniego rozdziału?Myślę, że jest w porządku.Jest to, rzecz jasna, odpowiedź pozytywna. Co jednak pomy­ślelibyście, gdyby pomiędzy zakończeniem pytania a począt­kiem odpowiedzi była trzysekundowa pauza? Jednoznaczna odpowiedź staje się wątpliwa. Po trzech sekundach należałoby powiedzieć coś więcej niż „w porządku .Odmierzanie czasu ma wielkie znaczenie. Ludzie interpretu­ją zachowania, które następują w krótkich odcinkach czaso­wych. Z badań w dziedzinach psychologii i komunikacji wia­domo, że określanie czasu jest głównym elementem we wszystkich wymianach interpersonalnych. Niewielka pau­za, lekki uśmieszek lub przelotne spojrzenie pełne zakłopota­nia — wszystkie te niuanse dużo mówią o ludziach, których spotykamy, i o tym, jak powinniśmy na nich zareagować. Inaczej mówiąc, kilka milisekund, a sprawy już mają się inaczej.

PROJEKTANCI POWINNI SKONCENTROWAĆ SIĘ NA DŹWIĘKU

Dla projektantów multimediów strona dźwiękowa stwarza sze­rokie pole do działania. Wszystko wskazuje na to, że to ona może dostarczyć większych wrażeń w przeliczeniu na jednego dolara. Może to być częściowo prawdziwe, ponieważ w tym wypadku niezbędne inwestycje byłyby mniejsze. Łatwiej uzys­kać wierność odtwarzania dźwięku niż obrazu. Lecz nawet jeżeli koszty udoskonalenia wizji i dźwięku byłyby takie same, wyniki tych badań sugerują, że pracę należałoby rozpocząć od strony dźwiękowej urządzenia. Wierność odtwarzania dźwięku wspomaga także stronę wi­zualną, niezależnie od technicznej jakości obrazu, ponieważ dobry dźwięk może nawet sprawić, że obraz wydaje się lepszy. Jest to dobry argument przeciwko zwlekaniu z doskonaleniem wierności odtwarzania dźwięku do czasu, kiedy osiągnie się odpowiedni poziom wierności odtwarzania obrazu. W przy­padku mediów obiektywny opis rozdzielczości jest o wiele mniej istotny od tego, jak treść jest postrzegana.

 

OCENY FRAGMENTÓW

Uczestnicy mniej zapamiętali także z tego, co słyszeli w kli­pach o wysokiej wierności odtwarzania dźwięku i gorzej iden­tyfikowali dźwięki pochodzące z filmów. Działo się tak praw­dopodobnie dlatego, że mizerna wierność odtwarzania dźwię­ku spowodowała, iż musieli oni zwracać uwagę raczej na niezwykłe dźwięki, zamiast zanurzyć się w rzeczywistości filmowej. Zanurzenie takie spowodowało także, iż uczestnicy słyszący dźwięki o wysokiej jakości odtwarzania nieco gorzej zapamiętywali sekwencje wizualne. Odmienne były także subiektywne oceny fragmentów fil­mów. Uczestnicy uważali, że fragmenty wideo z nagraniami wysokiej jakości były bardziej sympatyczne i realistyczne, a ich odbiór wymagał więcej wysiłku.Wywnioskowaliśmy stąd, że wierność odtwarzania dźwięku ma znaczenie. Kiedy jest kiepska, prezentacje brzmią nienatu­ralnie, a ludzie świadomie śledzą treść prezentacji. Kiedy wierność ta jest dobra, zanurzają się w rzeczywistości me­dialnej.

WIERNOŚĆ ODTWORZENIA

Zastosowaliśmy podkład dźwiękowy o standardzie jako­ści CD, nagrany z oryginalnego materiału. Odtwarzaliśmy tę warstwę dźwiękową w wysokiej jakości systemie surround- -sound, co w rezultacie dało wspaniały dźwięk. W celu uzys­kania niskiej wierności odtwarzania dźwięku do oryginalnych ścieżek dodaliśmy trzy rodzaje defektów. Po pierwsze wiele razy przekopiowaliśmy nagranie. Następnie obcięliśmy chara­kterystykę częstotliwościową, ograniczając najniższe i najwyż­sze dźwięki, a nawet dodaliśmy syczące szumy z tandetnego magnetofonu. Końcowym rezultatem było nagranie zdecydo­wanie kiepskiej jakości, lecz nadal zrozumiałe i zsynchronizo­wane z obrazem.Okazało się, że wierność odtwarzania dźwięku była znacz­nie bardziej istotna niż wierność odtwarzania obrazu. Wy­stąpiły znaczne różnice pomiędzy wysoką a niską wiernością odtwarzania dźwięku, jeśli chodzi o wszystkie trzy kryteria: koncentrację uwagi, pamięć i ocenę. Po pierwsze, nagranie dźwiękowe wysokiej jakości wywołało krótsze czasy reakcji na dźwięki zadania dodatkowego, które co jakiś czas roz­brzmiewały podczas trwania fragmentów filmowych. Wskazu­je to, że uczestnicy rzeczywiście mniej uwagi poświęcali pre­zentacji o wysokiej wierności odtwarzania, prawdopodobnie dlatego, że dźwięki były bardziej znajome.

OMYLNOŚĆ PROFESJONALISTÓW

Jeśli profesjonaliści się nie mylą, wierność odtwarzania dźwięku powinna być ważna. Przewidzieliśmy, przede wszyst­kim na podstawie koncepcji, zgodnie z którą kiepski dźwięk nie ma odpowiednika w rzeczywistym świecie, że wierność odtwarzania dźwięku będzie miała wpływ na te same reakcje, które pozostawały nie zróżnicowane w przypadku odmiennej wierności odtwarzania obrazu. Zasada 1. Wierność odtwarzania dźwięku wpłynie na sto­pień koncentracji na mediach.Zasada 2. Wierność odtwarzania dźwięku wpłynie na zapa­miętywanie przez ludzi informacji audio.Zasada 3. Ludzie ocenią wyżej wierność odtwarzania dźwię­ku, w odróżnieniu od gorszej wierności odtwarzania dźwięku.Testowanie tych założeń stanowiło część badania dotyczącego wierności wizualnej; korzystaliśmy zatem z tych samych szes­nastu klipów filmowych. Poza wersjami o wysokiej i niskiej wierności wizualnej sporządziliśmy także dwie prezentacje audio o bardzo dobrym oraz bardzo złym dźwięku.Osiągnięcie wysokiej wierności odtwarzania dźwięku było łatwe.

ZNACZENIE WIERNOŚCI DŹWIĘKU

Przewiduje się, że ta nowa forma telewizji stanie się standardem, który wzmocni wierność odtwarzania obrazu, lecz nowe odbiorniki będą prawdopodobnie popularne, ponieważ są większe i mają proporcjonalnie większą szerokość w stosunku do długości (16:9 zamiast 4:3 – obecnych proporcji ekranów telewizyjnych i komputerowych).Uważamy, że wielkość i kształt ekranu mają zawsze przewa­gę nad wiernością obrazu jeszcze pod jednym względem. No­we ekrany telewizyjne mogą się podobać nawet wtedy, kiedy nic na nich nie ma. Duże, szerokie ekrany pozostają zawsze duże i szerokie bez względu na to, jaki pojawi się na nich obraz, a nawet wtedy, kiedy nie ma na nich żadnego obrazu. Nowy zakup prezentuje się dobrze nawet bez włączania od­biornika.A co z wiernością dźwięku? W odróżnieniu od obrazu wideo, kiepska wierność odtwarzania dźwięku jest, psychologicznie rzecz biorąc, czymś obcym, nawet dziwacznym. Na przykład typowy szum nośnika lub zmniejszony zakres częstotliwości dźwięków nagranych na taśmę nie ma odpowiedników w świe­cie rzeczywistym. I fakt, że wszelkie dźwięki w mediach zwykle dochodzą dokładnie z tego samego kierunku, jest także nienaturalny, szczególnie kiedy obraz sugeruje, że powinny nas otaczać.Pracujący w dziedzinie mediów artyści od dawna zauważyli potęgę dźwięków naśladujących życie, nawet kiedy wydaje się, że emanują z obrazów gorszej jakości. Dla wielu projektantów koncepcja zanurzenia się w rzeczywistości medialnej zaczy­na się od dźwięku. Nie szczędzą starań, by wyeliminować szumy oraz zachować znajome wysokie i niskie częstotliwości; pragną również zapewnić, aby dźwięki dochodziły z właściwych miejsc, tak jakby słuchający doświadczał ich w rzeczywistości.