Hlasové rozpoznávání v divadle — jak funguje a kdy se vyplatí

Hlasové rozpoznávání slibuje něco, po čem nápověda i inspice touží už desítky let: aby se scénář posouval sám, podle toho, co herci právě říkají na jevišti. Žádné ruční klikání, žádné ztrácení se v textu při improvizaci. Zní to jako samozřejmost — vždyť diktování do telefonu funguje. Jenže divadlo je pro rozpoznávání řeči jedno z nejnáročnějších prostředí vůbec. V tomto článku si vysvětlíme, jak technologie funguje, proč na jevišti naráží na své limity a jak ji nastavit tak, aby vám skutečně pomáhala.

Co hlasové rozpoznávání v divadle vlastně dělá

Klasický teleprompter posouvá text konstantní rychlostí nebo na pokyn obsluhy. Hlasové rozpoznávání tenhle princip obrací: software poslouchá mluvené slovo a průběžně ho porovnává s textem scénáře. Když najde shodu, posune zobrazení na správné místo — ideálně o pár slov napřed, aby měl herec nebo nápověda vždy přehled o tom, co přijde.

Klíčové slovo je tu porovnává. Na rozdíl od diktování nejde o to přepsat libovolnou řeč, ale o zarovnání mluveného projevu k předem známému textu. To je výhoda — systém ví, co má slyšet — i past, protože živé jeviště se k psanému textu nikdy nechová učebnicově.

Proč je to na jevišti těžší než v telefonu

Hluk, hudba a akustika

Sál není tichá kancelář. Hraje hudba, ozývá se potlesk, šustí kostýmy, duní kroky po prknech. Mikrofon zachytí všechno — a rozpoznávání se musí prokousat k samotné řeči. Velký rozdíl dělá umístění mikrofonu: nahrávka z mikrofonu na kraji jeviště je čistší než z notebooku v kabině.

Překrývající se repliky a improvizace

Herci si skáčou do řeči, přehazují slova, vynechávají věty, improvizují. Žádný přepis nebude doslovný. Dobrý systém proto nehledá přesnou shodu znak po znaku, ale pravděpodobné zarovnání — drží se kontextu i tehdy, když herec půlku repliky „přebásní".

Více jazyků a vlastní jména

Inscenace běžně míchají jazyky, používají archaismy nebo vymyšlená jména postav. To jsou přesně ta slova, se kterými mají běžné modely problém. Pomáhá, když systém vychází přímo z vašeho scénáře a počítá s jeho slovní zásobou.

Online versus offline rozpoznávání

Většina běžných služeb posílá zvuk na vzdálené servery. V divadle to přináší dva zásadní problémy:

Latenci. Cesta na server a zpět přidá zpoždění, které u posouvání scénáře v reálném čase vadí.
Závislost na připojení. Spolehnout se během premiéry na internet v sále je risk, který si nikdo nechce dovolit.

Proto dává v divadle smysl offline rozpoznávání, které běží přímo na počítači. Theatre Prompter jde právě touto cestou: zpracovává zvuk lokálně, takže funguje i bez připojení a citlivá nahrávka zkoušky nikdy neopustí váš počítač.

💡

Než nasadíte rozpoznávání na ostré představení, vyzkoušejte ho na záznamu zkoušky. Uvidíte, jak si systém poradí s konkrétní akustikou sálu a stylem herců — a doladíte ho v klidu, ne pět minut před začátkem.

Jak to funguje v Theatre Prompter

Theatre Prompter kombinuje offline rozpoznávání řeči s vaším naimportovaným scénářem. Software poslouchá mluvené slovo, průběžně ho zarovnává k textu a posouvá zobrazení tam, kde se právě je. Protože vychází přímo z konkrétního scénáře, nesnaží se „uhodnout" libovolnou řeč — pracuje s textem, který má před sebou.

V praxi to znamená, že nápověda nebo inspice nemusí celé představení viset prstem nad klávesnicí. Systém drží tempo za vás a vy zasáhnete jen tehdy, když je potřeba — třeba při větší improvizaci nebo skoku v ději. Pro situace, kde se na automatiku spolehnout nechcete, zůstává manuální ovládání vždy po ruce.

Praktické tipy pro spolehlivý běh

Investujte do mikrofonu. Čistší vstup udělá pro přesnost víc než jakékoli nastavení softwaru.
Připravte scénář pečlivě. Čím přesněji text odpovídá tomu, co se na jevišti říká, tím lépe systém zarovnává.
Otestujte na zkoušce. Reálná akustika a styl souboru vám řeknou víc než jakákoli specifikace.
Mějte záložní plán. Manuální ovládání by mělo být vždy připravené — technologie pomáhá, ale živé představení má vždycky navrch.

Závěr

Hlasové rozpoznávání nedokáže nahradit zkušenou nápovědu — a ani by nemělo. Co umí, je sundat z jejích beder mechanickou práci s posouváním textu, aby se mohla soustředit na to, na čem v divadle opravdu záleží. Klíčem k úspěchu je realistické očekávání, dobrý mikrofon a možnost kdykoli převzít řízení do vlastních rukou. Pokud tyhle tři věci máte, stává se z rozpoznávání spolehlivý tichý pomocník za oponou.