23 elokuuta, 2012

Kuka sanelee?

Sanelu toimii oikeasti vuorileijonassa

Asensin kokeeksi Mac Miniin Applen uusimman käyttiksen, Mountain Lion eli OS X:n, koska halusin päästä kokeilemaan nimenomaan sanelu -ominaisuutta. Ominaisuden nimi on englanniksi dictate ja se löytyy järjestelmäasetuksista kohdasta Sanelu ja puhe. Mikrofoni on oltava kytkettynä ja päällä (itselläni se tulee linjatasoisena sisään etuvahvistimen kautta), ellei ole sisäänrakennettua mikrofonia. 

Käyttöjärjestelmää asentaessa muuten pitää hieman yllättäen antaa Applelle lupa käyttää osoitetietojasi ja joitakin muitakin tietoja. Nämä ilmeisesti ainoastaan kuitenkin auttamaan puheentunnistajaa, esim melko todennäköisesti lähitulevaisuudessa eteen tulevassa tilanteessa, jossa tiukka tietokoneen käyttäjä vaatii puhumalla käyttöjärjestelmää heti lähettämään sähköpostia mummilleen pihtiputaalle. Kone voi näin helpommin arvata kenen yhteystietoja käytetään. Kyse ei ole käyttäjän kulutustottumusten tai mahdollisten Putinin-vastaisten elämäntapojen valvonnasta, ei toki, tietenkään.

Näin se toimii

Sanelu kytketään päälle, mutta ei... heti ei ala tapahtua yhtään mitään. Tarvitaan ohjelma joka ottaa sanelua vastaan ja sellainen on vaikkapa Texturi (1.8) joka tulee tietysti käyttiksen mukana. 

Ota ohjelmassa uusi dokumentti esiin ja paina näppäinoikotietä tai valitse Muokkaa -valikosta: Aloita sanelu. 

Mutta... eipäs se toimi vieläkään... Hetkisen surffailun jälkeen löysin kuin löysinkin seuraavan toimivan vinkin (englanniksi). Vähän on siis viilattava konepellin alta.

Järjestelmäasetukset auki, sieltä osio Verkko ja paina alareunasta: Lisävalinnat...
Etsi välilehti DNS, ja lisää + -painikkeella kaksi DNS -palvelinta: (IPv4 tai IPv6 -osoitteet)
208.67.220.220
208.67.222.222
Näpyttele numerot siis käsin ja kuittaa ok ja ota käyttöön. Käynnistä kone kokonaan uudelleen, vasta silloin asetus tulee voimaan. Aloita homma alusta ja avot johan toimii. Näitä IP-osoitteita vuorileijona tarvitsee lähettääkseen sanelusi amerikkaan ja hakemaan tulkitun tekstiversion koneelle.

Ja sitten kun se toimii:

Näppäinoikotie tuo kursorin viereen pienen sykkivän mikrofonin kuvan ja voit sanella noin rivin verran englannikielistä tekstiä. Sanelun voi myös lopettaa nopeammin, jolloin kolme täplää elää hetken mikrofonin tilalla, (sillä aikaa puhe käy tulkittavana ja teksti palautuu koneellesi)

Puhua saa siis vain alle puoli minuuttia kerrallaan, mutta tunnistus toimiikin sitten yllättävän hyvin ja ketterästi. Ottaen huomioon, että tulkinta tapahtuu rapakon takana. Ehtii aika vähän edes harkita mitä seuraavaksi sanoisi. Ja teksti olisi toisaalta hyvä jokaisen rivin jälkeen saman tien oikolukea, ettei jää hassuja virheitä tekstiin. Teksti nimittäin on ihan oikein kirjoitettua, mutta se voi silti olla aivan väärin tunnistettua, eikä mikään oikolukuohjelma auta tässä. Numerot muuten kirjoitetaan numeroiksi eikä kirjaimin.

Google ymmärtää suomea!

Saman tien kokeilin myös Googlen kesällä 2012 aloittamaa suomenkielistä puheentunnistusta. Se toimii vain tietyillä selaimilla (Chrome) ja vain hakukentissä, mutta kun sen makuun pääsee se on yllättävän kätevä, jos siis ei joudu mölähtelemään julkisella paikalla, vaan saa olla rauhassa jossain omassa kotitoimistossa. Lyhyitä tekstinpätkiä voisi tietysti kopioida kentästä... 

Ja onhan näitä kännyköissäkin jo monenlaista puheentunnistusta joten se alkaa olla kohta kai ihan arkista että kone yrittää ymmärtää ihmistä, edes muutamia sanoja. Homma etenee.