Jenže když parsuješ HTML, tak to nemůžeš parsovat jako XML. Použij HTML parser.
Je nějaký důvod, proč by to nebylo možné? Je to značkovací jazyk podobně jako xml, má nějakou strukturu, kterou lze logicky procházet. XML řeší, aby dokument měl striktní strukturu, ale neřeší značky, HTML naopak řeší, aby dokument obsahoval určité značky a strukturu má podobnou. Nemají náhodou společného předka? Ale hlavně ta funkce opravdu funguje a lze ji uvedeným způsobem použít. Určitě to někdy využiju