← Blog

Hlasové rozpoznávání v divadle — jak funguje a kdy se vyplatí

Hlasové rozpoznávání v divadle — jak funguje a kdy se vyplatí

Hlasové rozpoznávání slibuje něco, po čem nápověda i inspice touží už desítky let: aby se scénář posouval sám, podle toho, co herci právě říkají na jevišti. Žádné ruční klikání, žádné ztrácení se v textu při improvizaci. Zní to jako samozřejmost — vždyť diktování do telefonu funguje. Jenže divadlo je pro rozpoznávání řeči jedno z nejnáročnějších prostředí vůbec. V tomto článku si vysvětlíme, jak technologie funguje, proč na jevišti naráží na své limity a jak ji nastavit tak, aby vám skutečně pomáhala.

Co hlasové rozpoznávání v divadle vlastně dělá

Klasický teleprompter posouvá text konstantní rychlostí nebo na pokyn obsluhy. Hlasové rozpoznávání tenhle princip obrací: software poslouchá mluvené slovo a průběžně ho porovnává s textem scénáře. Když najde shodu, posune zobrazení na správné místo — ideálně o pár slov napřed, aby měl herec nebo nápověda vždy přehled o tom, co přijde.

Klíčové slovo je tu porovnává. Na rozdíl od diktování nejde o to přepsat libovolnou řeč, ale o zarovnání mluveného projevu k předem známému textu. To je výhoda — systém ví, co má slyšet — i past, protože živé jeviště se k psanému textu nikdy nechová učebnicově.

Proč je to na jevišti těžší než v telefonu

Hluk, hudba a akustika

Sál není tichá kancelář. Hraje hudba, ozývá se potlesk, šustí kostýmy, duní kroky po prknech. Mikrofon zachytí všechno — a rozpoznávání se musí prokousat k samotné řeči. Velký rozdíl dělá umístění mikrofonu: nahrávka z mikrofonu na kraji jeviště je čistší než z notebooku v kabině.

Překrývající se repliky a improvizace

Herci si skáčou do řeči, přehazují slova, vynechávají věty, improvizují. Žádný přepis nebude doslovný. Dobrý systém proto nehledá přesnou shodu znak po znaku, ale pravděpodobné zarovnání — drží se kontextu i tehdy, když herec půlku repliky „přebásní".

Více jazyků a vlastní jména

Inscenace běžně míchají jazyky, používají archaismy nebo vymyšlená jména postav. To jsou přesně ta slova, se kterými mají běžné modely problém. Pomáhá, když systém vychází přímo z vašeho scénáře a počítá s jeho slovní zásobou.

Online versus offline rozpoznávání

Většina běžných služeb posílá zvuk na vzdálené servery. V divadle to přináší dva zásadní problémy:

  • Latenci. Cesta na server a zpět přidá zpoždění, které u posouvání scénáře v reálném čase vadí.
  • Závislost na připojení. Spolehnout se během premiéry na internet v sále je risk, který si nikdo nechce dovolit.

Proto dává v divadle smysl offline rozpoznávání, které běží přímo na počítači. Theatre Prompter jde právě touto cestou: zpracovává zvuk lokálně, takže funguje i bez připojení a citlivá nahrávka zkoušky nikdy neopustí váš počítač.

💡

Než nasadíte rozpoznávání na ostré představení, vyzkoušejte ho na záznamu zkoušky. Uvidíte, jak si systém poradí s konkrétní akustikou sálu a stylem herců — a doladíte ho v klidu, ne pět minut před začátkem.

Jak to funguje v Theatre Prompter

Theatre Prompter kombinuje offline rozpoznávání řeči s vaším naimportovaným scénářem. Software poslouchá mluvené slovo, průběžně ho zarovnává k textu a posouvá zobrazení tam, kde se právě je. Protože vychází přímo z konkrétního scénáře, nesnaží se „uhodnout" libovolnou řeč — pracuje s textem, který má před sebou.

V praxi to znamená, že nápověda nebo inspice nemusí celé představení viset prstem nad klávesnicí. Systém drží tempo za vás a vy zasáhnete jen tehdy, když je potřeba — třeba při větší improvizaci nebo skoku v ději. Pro situace, kde se na automatiku spolehnout nechcete, zůstává manuální ovládání vždy po ruce.

Praktické tipy pro spolehlivý běh

  • Investujte do mikrofonu. Čistší vstup udělá pro přesnost víc než jakékoli nastavení softwaru.
  • Připravte scénář pečlivě. Čím přesněji text odpovídá tomu, co se na jevišti říká, tím lépe systém zarovnává.
  • Otestujte na zkoušce. Reálná akustika a styl souboru vám řeknou víc než jakákoli specifikace.
  • Mějte záložní plán. Manuální ovládání by mělo být vždy připravené — technologie pomáhá, ale živé představení má vždycky navrch.

Závěr

Hlasové rozpoznávání nedokáže nahradit zkušenou nápovědu — a ani by nemělo. Co umí, je sundat z jejích beder mechanickou práci s posouváním textu, aby se mohla soustředit na to, na čem v divadle opravdu záleží. Klíčem k úspěchu je realistické očekávání, dobrý mikrofon a možnost kdykoli převzít řízení do vlastních rukou. Pokud tyhle tři věci máte, stává se z rozpoznávání spolehlivý tichý pomocník za oponou.