Řekl bych, že z popisu není úplně jasné, co chcete. Chcete to dělat jednorázově třeba v developer tools v prohlížeči? Nebo na to chcete nějaký automat pro dávkové zpracování? Chcete vytahovat informace jen z HTML, nebo i z CSS?
Pokud chcete jen z HTML vytáhnout vše, co ovlivňuje CSS, jsou to obvykle jen tři atributy – id, class a style. Dále to ale samozřejmě může ovlivňovat hierarchie dokumentu (předchozí a nadřazené uzly DOMu) a jakékoli další atributy (CSS má atributový selektor).
Pokud by vám stačilo vytahat ty tři atributy (id, class, style), je asi nejjednodušší převést HTML na XHTML a pak použít XSLT (nebo XQuery nebo samotné XPath, záleží na požadovaném výstupu.