Oprava normálně psaného textu napsaného v režimu T9

Morse Códe

Potřeboval bych převést text, který jsem psal na telefonu normálním způsobem (např klávesa 5: 1 stisk j, 2 stisky k, 3 stisky L), ale  byl aktivní režim T9 a neměl být, tudíž je zapsaný text nesmyslný. Máte někdo takový program nebo znáte?
« Poslední změna: 16. 10. 2017, 09:15:30 od Petr Krčmář »


Re:oprava normálně psaného textu napsaného v režimu T9
« Odpověď #1 kdy: 14. 10. 2017, 22:41:20 »
Potřeboval bych převést text, který jsem psal na telefonu normálním způsobem (např klávesa 5: 1 stisk j, 2 stisky k, 3 stisky L), ale  byl aktivní režim T9 a neměl být, tudíž je zapsaný text nesmyslný. Máte někdo takový program nebo znáte?

Bez znalosti konkrétní implementace T9 a přesných slovníků, které byly použity, je to zhola nemožné.
Při znalosti je to stále velice obtížné, protože ve stejné cílové slovo může vyústit různá kombinace kláves (překlepů).

gll

Re:oprava normálně psaného textu napsaného v režimu T9
« Odpověď #2 kdy: 14. 10. 2017, 23:34:42 »
Potřeboval bych převést text, který jsem psal na telefonu normálním způsobem (např klávesa 5: 1 stisk j, 2 stisky k, 3 stisky L), ale  byl aktivní režim T9 a neměl být, tudíž je zapsaný text nesmyslný. Máte někdo takový program nebo znáte?

v jakem jazyce?

Jenda

Re:oprava normálně psaného textu napsaného v režimu T9
« Odpověď #3 kdy: 15. 10. 2017, 00:34:04 »
Bez překlepů mi to přijde docela jednoduché (pokud si pamatuju jak funguje T9 :), s překlepy bych zkusil nejdřív nějaký naivní fuzzy matching a kdyby to nepomohlo, tak budeš potřebovat hidden Markov model a Viterbiho algoritmus.

Morse Códe

Re:oprava normálně psaného textu napsaného v režimu T9
« Odpověď #4 kdy: 15. 10. 2017, 09:58:40 »
Další problém je, že při psaní dochází ke "ztrátové transformaci: Například slovo 'prsa': se skládá z (1+3+4=8) stisků klávesy "7" s příslušnými pauzami pro oddělení  písmen a dále 2.
Výsledek je: "sprš?" tudíž po dosažení stisku 4. "7" se s zápisem sprš neděje nic. Pomohl by s tímhle ten viterbi? výsledkem dekodování nejspíš bude více kandidátů


Morse Códe

Re:oprava normálně psaného textu napsaného v režimu T9
« Odpověď #5 kdy: 15. 10. 2017, 11:33:05 »
Jazyk T9 je čeština, zapisovaný text v angličtině  (30 slov) a v češtině (10 slov)

Re:oprava normálně psaného textu napsaného v režimu T9
« Odpověď #6 kdy: 15. 10. 2017, 11:45:35 »
Jazyk T9 je čeština, zapisovaný text v angličtině  (30 slov) a v češtině (10 slov)

Ano, ale ke stejným 10 českým slovům vede skoro bezpočet kombinací stisků kláves. T9 doplňují slova, a opravují překlepy. Kdyby tomu tak nebylo, měl byste jednoduchou práci.

Re:Oprava normálně psaného textu napsaného v režimu T9
« Odpověď #7 kdy: 02. 11. 2017, 16:34:01 »
O tom, že by T9 opravovalo překlepy, jsem neslyšel. Jak to znám, jen se to snaží doplňovat slova, která by tam mohla sedět. Pokud T9 byla zapnutá a neměla být, mělo by být celkem jednoduché zjistit, co bylo stisknuto, tedy například u znaků „a“, „b“, „c“, „á“, „č“ byla stisknuta klávesa 2, u znaků „d“, „e“, „f“, „ď“, „é“, „ě“ trojka atd. S pomocí nástrojů jako tr nebo sed (nebo prostého find&replace v obyčejném textovém editoru) by mělo jít to převést. Snad jediný potenciální problém zde vidím v tom, že se mohlo stát, že mobil najednou neznal žádné vhodné slovo, a odmítl dál (až do konce slova) psát.

Druhá část pak je převod posloupnosti číslic na text. To většinou asi půjde automaticky, i když by v tomto množství textu neměl být problém ani ručně. Je to ale do jisté míry víceznačné, např. 3336666 může být „demo“, nebo třeba „fom“. V některých případech více těchto variant může dávat smysl, ale snad to půjde pořešit ručně.