Popularne artykuły

Mam kilkaset stron zapisanych w plikach html . Stamtąd chcę wyciągnąć z każdego pliku konkretnego diva, np. <div=teskt> wyciągnąć treść i ją zapisać do txt.
Z tego tekstu, każdy kolejny... tekst, chciałbym oddzielić. Zaczyna się liczbą rzymską, potem jest opis jednosłowny i treść właściwa. Dokument ma budowę np.:

I. SŁOWO_KLUCZ,

teskt

II. SŁOWO_KLUCZ,

tekst

[...]

IX. SŁOWO_KLUCZ

tekst.

Chciałbym wrzucić każdy taki akapit do osobnego pliku txt.

I to chyba na razie tyle. Udałoby się to jakimś narzędziem ogarnąć?

#komputery