Tonfiks. Käsittelee ääntä.

Suoran lähetyksen tekstitys

Tiistai 28.8.2018 - Eero Aro


Sattuipa silmääni jo hieman vanhahko Ilta-Sanomien juttu suomen murteista.

https://www.is.fi/kotimaa/art-2000005649399.html

Juttuun liittyvässä keskustelussa eräs kommentoija kirjoittaa: "Huippuesimerkki on eräs ravistudion kommentaattori, jonka puhe pitäisi tekstittää (mahdotonta tietenkin suorissa lähetyksissä), mutta ei edes huulilta luettuna onnistu puolenkaan sanoman ymmärtäminen."

Kommentaattoreiden puheen epäselvyydestä olen ehdottomasti samaa mieltä, mutta suoran tv-lähetyksen tekstittäminen ei suinkaan ole mahdotonta.

Niin tehdään ainakin Englannissa, esimerkiksi ITV ja Sky News tekstittävät satelliittilähetyksissään lähes kaiken sisältönsä. Tekstitys toimii puheentunnistuksen avulla. Puhe muunnetaan kirjoitetuksi tekstiksi, joka ilmestyy ruutuun noin 5-15 sekunnin viiveellä.

Skynews_livetekstitys.jpg

Tässä Sky Newsin ruutukaappauksessa siis teksti: "England is placed. I don't know if you have seen the Sun Front Page." on puheentunnistuksen tuottamaa tekstitystä. Eri värit, keltainen ja valkoinen tarkoittavat eri henkilöiden puhetta.

Sky News

Tällainen sovellutus toimii luonnollisesti ensimmäisenä englanninkielellä, koska englantia puhutaan maailmassa niin paljon. Valtakieleen on kannattavaa kehittää sovellutuksia.

Aluksi puheentunnistukseen perustuva tekstitys toteutettiin niin, että ohjelmaa lähettävän tai välittävän tv-yhtiön studiossa joku henkilö kuunteli kuulokkeet päässä, mitä ohjelmassa puhuttiin ja hän puhui kaiken kaiken kuulemansa uudelleen ääneen. Tämän ansiosta puheentunnistusohjelma toimi suhteellisen luotettavasti, kun sen piti tunnistaa vain yhden henkilön puhetta. Ohjelma voitiin säätää juuri sille puhujalle.

Digitaalinen TV ei muutenkaan ole sitä mitä luulisi. Kuva ja ääni tulee televisiostasi nimittäin aina vähän viivästettynä, se ei ole reaaliaikaista. Osa viiveestä johtuu yksinkertaisesti tiedonsiirron digitaalisuudesta, mutta yksi syy viivästää signaalia on antaa puheentunnistukselle aikaa prosessoida data ja tuottaa kirjoitettu teksti ruudulle.

Eikä tässä kaikki. Koska puhe on jo muunnettu tekstiksi, ei ole ollenkaan mahdotonta antaa koneen kääntää se jollekin tai joillekin muillekin kielille. Katsoja voi sitten valita vastaanottolaitteestaan, minkä kielistä tekstitystä haluaa seurata.