Cześć. Wiem, że społeczność może nie na temat, lecz użytkownicy z tej społeczności pewnie będą znać odpowiedź. Pozwolę się tutaj zapytać.
-
Mam kilkaset stron zapisanych w plikach html . Stamtąd chcę wyciągnąć z każdego pliku konkretnego diva, np. <div=teskt> wyciągnąć treść i ją zapisać do txt.
-
Z tego tekstu, każdy kolejny... tekst, chciałbym oddzielić. Zaczyna się liczbą rzymską, potem jest opis jednosłowny i treść właściwa. Dokument ma budowę np.:
I. SŁOWO_KLUCZ,
teskt
II. SŁOWO_KLUCZ,
tekst
[...]
IX. SŁOWO_KLUCZ
tekst.
Chciałbym wrzucić każdy taki akapit do osobnego pliku txt.
I to chyba na razie tyle. Udałoby się to jakimś narzędziem ogarnąć?
#komputery