Tohle se prý dělá jednoduše s využitím stereo kanálů, protože u hudby bývá zpěvák stejně intenzivně v obou kanálech, zatímco nástroje jsou asymetricky. Takže „stačí“ vytáhnout to co je v obou kanálech stejné a to co je rozdílné.
Software, který popisujete, je matematicky úplně primitivní. Vezmete kanál A a necháte ho tak, jak je. Vezmete kanál B a převrátíte ho kolem středové osy. Pak ty kanály "sečtete" (prolnete). Výsledkem je rozdíl ve zvuku mezi oběma kanály, takže přesně jak říkáte: hlas z toho zmizí a zůstane hudba, akorát to dostane takový trochu „surround“ efekt. Takže takových aplikací budou mraky (sám jsem si v dřevních dobách DOSu a Turbo Pascalu takovou udělal) a jsou velice nenáročné na výpočet, protože nic složitého nepočítají.
Potíž tohohle principu je, že obráceně to nejde - nejde z toho zvuku touto cestou vytáhnout to, co je pro oba kanály společné.
A samozřejmě to nelze použít na situaci původního tazatele v tomhle vlákně. To chce prostě docela neprimitivní soft na analýzu obsahu zvuku a identifikaci jednotlivých částí, ještě tak nejjednodušší je to na frekvenční bázi, takže s tím jde poměrně úspěšně dělat např. takové věci jako odstranění šumu z nahrávky z gramofonové desky, odstranění různých relativně konstantních zvuků pozadí (ideálně za situace, že v tom zvuku je samostatně kousek toho, co chcete vyházet, aby si to mělo na čem navzorkovat, co za zvuk požadujete vyhodit). Ale hlasy se mezi to nepočítají, protože to už je ze všech úhlů pohledu poměrně komplikovaný zvuk a ten software, co tu na něj odkazuje jjrsk, bych třeba osobně moc rád viděl v akci, protože bych se docela těšil na to, jak mi z výsledku spadne brada
.