Fórum Root.cz

Hlavní témata => Software => Téma založeno: Dojdoj 31. 03. 2023, 00:37:12

Název: Nejlepší program pro převod české řeči na text
Přispěvatel: Dojdoj 31. 03. 2023, 00:37:12
Dobrý den

Jaký je v současné době nejlepší speech to text program pro český jazyk. Tzn. program který převádí mluvenou češtinu (ať už "live" nebo z nějakého audio souboru) do psané češtiny...? Rovněž jaký je nejlepší (nejpokročilější, nejpřesnější atd.) program pro to samé ale pro angličtinu... (mluvená angličtina do psané) ?

Předpokládám že je více variant, tak napište které znáte a jsou podle vás nejlepší...
(pokud by to bylo "offline" a text nikam nešel, tak by to bylo asi nejlepší, ale rozhraní přes webovou stránku taky stačí).

Před pár/několika lety jsem se o to zajímal a nebyl jsem moc "impressed" výsledky, předpokládám ale, že v roce 2023, zvláště s pokroky v AI už takových programů bude hodně a budou přesné (i pro češtinu)...?

Dejte tipy co znáte a jsou podle vás nejlepší, díky.
Název: Re:Nejlepší "speech to text" program pro češtinu? ( i ENG)?
Přispěvatel: 3ugeene 31. 03. 2023, 05:38:23
speechtech
Název: Re:Nejlepší "speech to text" program pro češtinu? ( i ENG)?
Přispěvatel: 3ugeene 31. 03. 2023, 08:28:31
speechtech

aha, sorry, otázka byla na STT ne TTS
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: Petr Krčmář 31. 03. 2023, 08:30:39
Před několika dny vyšel na Lupě rozhovor s Janem Cibulkou z iRozhlasu (https://www.lupa.cz/clanky/jan-cibulka-irozhlas-ai-uz-v-redakci-testujeme-clanky-psat-neumi-ale-pomaha-s-rutinou/) a ten doporučoval nástroj Whisper (https://openai.com/research/whisper), který prý velmi spolehlivě přepisuje českou řeč i z nekvalitních nahrávek z kavárny.
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: Dojdoj 31. 03. 2023, 17:02:52
Před několika dny vyšel na Lupě rozhovor s Janem Cibulkou z iRozhlasu (https://www.lupa.cz/clanky/jan-cibulka-irozhlas-ai-uz-v-redakci-testujeme-clanky-psat-neumi-ale-pomaha-s-rutinou/) a ten doporučoval nástroj Whisper (https://openai.com/research/whisper), který prý velmi spolehlivě přepisuje českou řeč i z nekvalitních nahrávek z kavárny.

Díky to vypadá zajímavě i když na stránce se píše že je to jen pro ENG. Chci se ale zeptat - nejsem programátor a nikde tam nevidím žádné tlačítko pro "download"...?

Jen odkaz na kod... to si jako musím sám zkompilovat (nebo jak se tomu říká)...? žádný normální download "exe" souboru nebo tak podobně není?

Rovněž - toto funguje čistě offline, nebo (a to asi spíše) se to někam odesílá, tam se to zpracovává a pak posílá zpátky...? (takže s "privacy" nepočítat a co jednou nahraju už někde navždy lítá?)

Díky
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: honzako 31. 03. 2023, 18:03:27
Whisper - to je zajímávé, a možná i funkční.
Nicméně pro tazatele bych chtěl říci ať příliš nejásá a kouká se na ceníky kolik taková služba stojí.
A z principu věci, pakliže je to služba tak nefunguje nikdy offline.
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: Tomáš Rollo 31. 03. 2023, 20:33:09
Před několika dny vyšel na Lupě rozhovor s Janem Cibulkou z iRozhlasu (https://www.lupa.cz/clanky/jan-cibulka-irozhlas-ai-uz-v-redakci-testujeme-clanky-psat-neumi-ale-pomaha-s-rutinou/) a ten doporučoval nástroj Whisper (https://openai.com/research/whisper), který prý velmi spolehlivě přepisuje českou řeč i z nekvalitních nahrávek z kavárny.

Díky to vypadá zajímavě i když na stránce se píše že je to jen pro ENG. Chci se ale zeptat - nejsem programátor a nikde tam nevidím žádné tlačítko pro "download"...?

Jen odkaz na kod... to si jako musím sám zkompilovat (nebo jak se tomu říká)...? žádný normální download "exe" souboru nebo tak podobně není?

Rovněž - toto funguje čistě offline, nebo (a to asi spíše) se to někam odesílá, tam se to zpracovává a pak posílá zpátky...? (takže s "privacy" nepočítat a co jednou nahraju už někde navždy lítá?)

Díky

Jsou dve moznosti - bud si to rozbehat lokalne, viz napr: https://www.assemblyai.com/blog/how-to-run-openais-whisper-speech-recognition-model/

Nebo pouzit API od OpenAI, viz https://platform.openai.com/docs/guides/speech-to-text a https://openai.com/blog/introducing-chatgpt-and-whisper-apis
Cena $0.006 za minutu je myslim velmi prijemna
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: Milan Kvasnica 31. 03. 2023, 21:42:22
Zrovna včera jsem si rozcházel a kvůli rychlosti oproti whisperu doporučuju https://github.com/guillaumekln/faster-whisper
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: _Jenda 01. 04. 2023, 02:40:42
Whisper - to je zajímávé, a možná i funkční.
Nicméně pro tazatele bych chtěl říci ať příliš nejásá a kouká se na ceníky kolik taková služba stojí.
A z principu věci, pakliže je to služba tak nefunguje nikdy offline.
Já tomu teda nerozumím, ale není tohle Whisper co si pustíš lokálně? https://github.com/ggerganov/whisper.cpp

Taky jsem na nějakém IRC viděl, že si někdo stěžoval, že malý Whisper umí jen angličtinu, a protože potřebuje i jiný jazyk, musí používat nějaký velký Whisper a nevejde se mu to do paměti. To by opět ukazovalo, že si to lidi umí provozovat lokálně. Ale možná si to s něčím pletu.
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: Marek Turnovec 01. 04. 2023, 10:08:50
Já se nedávno účastnil prezentace jednoho nemocničního informačního systému, který má mít i funkci na převod mluveného slova do textu (doktor může nadiktovat zprávu či třeba vizitu). Prý používají nějaké řešení od Googlu a s kvalitou jsou prý celkem spokojení. Ptal jsem se, jestli to znamená, že to ta hlasová data posílá někam na servery Googlu a prý že ne, že je možné to používat i lokálně. Snad zmiňovali něco jako "Google Dictate", ale nic takového se mi nedaří najít. Našel jsem něco jako Google Speech-To-Text, ale to vypadá jako služba... Tak nevím, ví případně někdo něco víc?
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: Tomáš Rollo 01. 04. 2023, 13:29:07
Whisper - to je zajímávé, a možná i funkční.
Nicméně pro tazatele bych chtěl říci ať příliš nejásá a kouká se na ceníky kolik taková služba stojí.
A z principu věci, pakliže je to služba tak nefunguje nikdy offline.
Já tomu teda nerozumím, ale není tohle Whisper co si pustíš lokálně? https://github.com/ggerganov/whisper.cpp

Taky jsem na nějakém IRC viděl, že si někdo stěžoval, že malý Whisper umí jen angličtinu, a protože potřebuje i jiný jazyk, musí používat nějaký velký Whisper a nevejde se mu to do paměti. To by opět ukazovalo, že si to lidi umí provozovat lokálně. Ale možná si to s něčím pletu.

Whisper jde urcite provozovat lokalne. Jde je o nasledujici:
- ne na vsechny platformy existuji GUI-based aplikace pro BFU, napr. na MacOS uz ano (napr. https://apps.apple.com/cz/app/whisper-transcription/id1668083311?mt=12), na Windows jsem zatim nevidel. Tj. castokrat jde spis o navod pro lidi co jsou hodne CLI-kompatibilni
- provozovani ML modelu je narocne na CPU a RAM, tj. na beznem NTB to skutecne muze prevadet pomalu, prip. vetsi modely, ktere CJ zvladaji kvalitne, vyzaduji hodne RAM

Tj. pokud ma clovek dobry HW a neni BFU, da se to rozbehat lokalne a zadarmo.

Pokud ne, tak jsou tady nejruznejsi (samozrejme placene) online sluzby, od tech volanych pres API (https://replicate.com/openai/whisper ci https://cloud.google.com/speech-to-text) nebo ty pro koncove uzivatele (napr. https://fireflies.ai)
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: Dojdoj 29. 12. 2023, 18:10:27
Oživuju thread :-)

Nic lepšího/snažšího než Whisper stále není...? I po 9 měsících je to pořád nejlepší varianta...? (vývoj v AI je překotný, takže by mě vůbec nepřekvapilo kdyby se z těch 9 nebo kolik měsíců neobjevilo něco lepšího, nebo srovnatelného (a třeba jednodušího na používání) atd...?

Díky
Název: Re:Nejlepší program pro převod české řeči na text
Přispěvatel: acerimmer 29. 12. 2023, 21:21:04
Na mobilech Samsung se jako nouzovka zdarma da pouzit funkce "Live transcribe". Umi cesky, ale cca kazdou druhou vetu je treba poupravit.