Fórum Root.cz

Hlavní témata => Software => Téma založeno: Morse Códe 14. 10. 2017, 11:33:50

Název: Oprava normálně psaného textu napsaného v režimu T9
Přispěvatel: Morse Códe 14. 10. 2017, 11:33:50
Potřeboval bych převést text, který jsem psal na telefonu normálním způsobem (např klávesa 5: 1 stisk j, 2 stisky k, 3 stisky L), ale  byl aktivní režim T9 a neměl být, tudíž je zapsaný text nesmyslný. Máte někdo takový program nebo znáte?
Název: Re:oprava normálně psaného textu napsaného v režimu T9
Přispěvatel: Miroslav Šilhavý 14. 10. 2017, 22:41:20
Potřeboval bych převést text, který jsem psal na telefonu normálním způsobem (např klávesa 5: 1 stisk j, 2 stisky k, 3 stisky L), ale  byl aktivní režim T9 a neměl být, tudíž je zapsaný text nesmyslný. Máte někdo takový program nebo znáte?

Bez znalosti konkrétní implementace T9 a přesných slovníků, které byly použity, je to zhola nemožné.
Při znalosti je to stále velice obtížné, protože ve stejné cílové slovo může vyústit různá kombinace kláves (překlepů).
Název: Re:oprava normálně psaného textu napsaného v režimu T9
Přispěvatel: gll 14. 10. 2017, 23:34:42
Potřeboval bych převést text, který jsem psal na telefonu normálním způsobem (např klávesa 5: 1 stisk j, 2 stisky k, 3 stisky L), ale  byl aktivní režim T9 a neměl být, tudíž je zapsaný text nesmyslný. Máte někdo takový program nebo znáte?

v jakem jazyce?
Název: Re:oprava normálně psaného textu napsaného v režimu T9
Přispěvatel: Jenda 15. 10. 2017, 00:34:04
Bez překlepů mi to přijde docela jednoduché (pokud si pamatuju jak funguje T9 :), s překlepy bych zkusil nejdřív nějaký naivní fuzzy matching a kdyby to nepomohlo, tak budeš potřebovat hidden Markov model a Viterbiho algoritmus.
Název: Re:oprava normálně psaného textu napsaného v režimu T9
Přispěvatel: Morse Códe 15. 10. 2017, 09:58:40
Další problém je, že při psaní dochází ke "ztrátové transformaci: Například slovo 'prsa': se skládá z (1+3+4=8) stisků klávesy "7" s příslušnými pauzami pro oddělení  písmen a dále 2.
Výsledek je: "sprš?" tudíž po dosažení stisku 4. "7" se s zápisem sprš neděje nic. Pomohl by s tímhle ten viterbi? výsledkem dekodování nejspíš bude více kandidátů
Název: Re:oprava normálně psaného textu napsaného v režimu T9
Přispěvatel: Morse Códe 15. 10. 2017, 11:33:05
Jazyk T9 je čeština, zapisovaný text v angličtině  (30 slov) a v češtině (10 slov)
Název: Re:oprava normálně psaného textu napsaného v režimu T9
Přispěvatel: Miroslav Šilhavý 15. 10. 2017, 11:45:35
Jazyk T9 je čeština, zapisovaný text v angličtině  (30 slov) a v češtině (10 slov)

Ano, ale ke stejným 10 českým slovům vede skoro bezpočet kombinací stisků kláves. T9 doplňují slova, a opravují překlepy. Kdyby tomu tak nebylo, měl byste jednoduchou práci.
Název: Re:Oprava normálně psaného textu napsaného v režimu T9
Přispěvatel: Vít Šesták (v6ak) 02. 11. 2017, 16:34:01
O tom, že by T9 opravovalo překlepy, jsem neslyšel. Jak to znám, jen se to snaží doplňovat slova, která by tam mohla sedět. Pokud T9 byla zapnutá a neměla být, mělo by být celkem jednoduché zjistit, co bylo stisknuto, tedy například u znaků „a“, „b“, „c“, „á“, „č“ byla stisknuta klávesa 2, u znaků „d“, „e“, „f“, „ď“, „é“, „ě“ trojka atd. S pomocí nástrojů jako tr nebo sed (nebo prostého find&replace v obyčejném textovém editoru) by mělo jít to převést. Snad jediný potenciální problém zde vidím v tom, že se mohlo stát, že mobil najednou neznal žádné vhodné slovo, a odmítl dál (až do konce slova) psát.

Druhá část pak je převod posloupnosti číslic na text. To většinou asi půjde automaticky, i když by v tomto množství textu neměl být problém ani ručně. Je to ale do jisté míry víceznačné, např. 3336666 může být „demo“, nebo třeba „fom“. V některých případech více těchto variant může dávat smysl, ale snad to půjde pořešit ručně.