Microsoft naučil Cortanu další řeči
14.4.2016, Michal Hala, aktualita
Ale vůbec to neznamená, že by už rozuměla mluvené češtině. Jen došlo k posílení jejích dílčích lingvistických schopností. Takže teď dokáže překládat z šesti mluvených jazyků do zhruba padesáti psaných jazyků.
V loňském září se Cortana naučila překládat z angličtiny a zjednodušené čínštiny do několika dalších jazyků. Celé se to odehrávalo stylem, že jste Cortanu anglicky (nebo čínsky) požádali, ať vám přeloží určitý mluvený text do určité řeči. A ona ve svém pracovním okně zobrazila příslušný překlad. Teď se možnosti rozšiřují a k výchozí skupině řečí přibývají francouzština, italština, němčina a španělština. V těchto řečech tedy rozumí mluvenému textu.
Zkrátka začnete frází „přelož mi“ nebo „jak se řekne“ v jedné z daných řečí a textem, který chcete přeložit (v téže řeči). A Cortana ho umí přeložit do jedné z následujících řečí: angličtina, bosenština, bulharština, čeština, čínština, dánština, estonština, finština, francouzština, haitská kreolština, hebrejština, hindština, hmong daw, holandština, chorvatština, indonéština, italština, japonština, katalánština, klingonština, korejština, litevština, lotyština, maďarština, malajština, maltština, němčina, norština, perština, polština, portugalština, querétaro otomi, rumunština, ruština, řečtina, slovenština, slovinština, srbština (cyrilice i latinka), španělština, švédština, thajština, turečtina, ukrajinština, urdu, velština a vietnamština.
A to je v kostce celá novinka. Celá funkcionalita je postavená na Microsoft Translatoru, který existuje i jako samostatná aplikace pro Windows 10 a také pro Android, iOS, watchOS a postupně je, nebo bude integrován například do Office, Skypu, Bingu a dalších produktů Microsoftu. Buď jak buď to znamená to, že Microsoft musel propojit slovníkové databáze mezi všemi danými jazyky.
Každopádně asi budou všechny aktivity Microsoftu na poli rozpoznávání a zpracování řeči a jazyků nějak synergicky propojené. Celý proces porozumění konkrétní řeči má několik fází. První fází je rozpoznání řeči – to si můžete představit jako převod zvukového signálu (mluvené řeči) do textových dat. Druhou fází je porozumění významu řečeného, které je složitější a abstraktnější než předchozí krok. Třetí fází pak je smysluplná reakce na řečené. Fáze dvě a tři přitom jsou podstatně složitější než fáze úvodní.
Proč ale Cortana pořád neumí česky? Podle všeho Microsoft (logicky) preferuje větší jazyky před menšími, nehledě na to, že čeština je zejména díky ohýbání slov složitější než většina zatím v Cortaně implementovaných jazyků. Nicméně pozitivní je, že zatím umí aspoň překládat z oněch šesti řečí do češtiny. A Bing Translator navíc umí překládat i z češtiny.
Na závěr přidám osobní zkušenost – mám Cortanu (a zákonitě celá Windows 10) v angličtině a ona dokáže dílčí slova, jednoduché fráze a kratší věty přeložit z angličtiny do češtiny celkem slušně. Bohužel problém jí dělá hlavně rozpoznat spojení „… into Czech“, které s chutí zaměňuje za spojení „… to check“ a když se to stane, pak už nepochopí, co po ní chci a připraví dotaz pro Bing, který následně otevře v prohlížeči.
Hodně záleží na tom, jestli použiji vestavěný mikrofon v notebooku, nebo headset. Ve druhém případě je porozumění Cortany o poznání lepší. Určitě jde o zajímavé rozšíření funkcí Cortany, ale zase nečekejte žádný zázrak – komplexnější text může vypadat po překladu i dost zašmodrchaně.
Zdroj: Neowin
Zkrátka začnete frází „přelož mi“ nebo „jak se řekne“ v jedné z daných řečí a textem, který chcete přeložit (v téže řeči). A Cortana ho umí přeložit do jedné z následujících řečí: angličtina, bosenština, bulharština, čeština, čínština, dánština, estonština, finština, francouzština, haitská kreolština, hebrejština, hindština, hmong daw, holandština, chorvatština, indonéština, italština, japonština, katalánština, klingonština, korejština, litevština, lotyština, maďarština, malajština, maltština, němčina, norština, perština, polština, portugalština, querétaro otomi, rumunština, ruština, řečtina, slovenština, slovinština, srbština (cyrilice i latinka), španělština, švédština, thajština, turečtina, ukrajinština, urdu, velština a vietnamština.
A to je v kostce celá novinka. Celá funkcionalita je postavená na Microsoft Translatoru, který existuje i jako samostatná aplikace pro Windows 10 a také pro Android, iOS, watchOS a postupně je, nebo bude integrován například do Office, Skypu, Bingu a dalších produktů Microsoftu. Buď jak buď to znamená to, že Microsoft musel propojit slovníkové databáze mezi všemi danými jazyky.
Každopádně asi budou všechny aktivity Microsoftu na poli rozpoznávání a zpracování řeči a jazyků nějak synergicky propojené. Celý proces porozumění konkrétní řeči má několik fází. První fází je rozpoznání řeči – to si můžete představit jako převod zvukového signálu (mluvené řeči) do textových dat. Druhou fází je porozumění významu řečeného, které je složitější a abstraktnější než předchozí krok. Třetí fází pak je smysluplná reakce na řečené. Fáze dvě a tři přitom jsou podstatně složitější než fáze úvodní.
Proč ale Cortana pořád neumí česky? Podle všeho Microsoft (logicky) preferuje větší jazyky před menšími, nehledě na to, že čeština je zejména díky ohýbání slov složitější než většina zatím v Cortaně implementovaných jazyků. Nicméně pozitivní je, že zatím umí aspoň překládat z oněch šesti řečí do češtiny. A Bing Translator navíc umí překládat i z češtiny.
Na závěr přidám osobní zkušenost – mám Cortanu (a zákonitě celá Windows 10) v angličtině a ona dokáže dílčí slova, jednoduché fráze a kratší věty přeložit z angličtiny do češtiny celkem slušně. Bohužel problém jí dělá hlavně rozpoznat spojení „… into Czech“, které s chutí zaměňuje za spojení „… to check“ a když se to stane, pak už nepochopí, co po ní chci a připraví dotaz pro Bing, který následně otevře v prohlížeči.
Hodně záleží na tom, jestli použiji vestavěný mikrofon v notebooku, nebo headset. Ve druhém případě je porozumění Cortany o poznání lepší. Určitě jde o zajímavé rozšíření funkcí Cortany, ale zase nečekejte žádný zázrak – komplexnější text může vypadat po překladu i dost zašmodrchaně.
Zdroj: Neowin