Pytanie do ogarniających ludzi #machinelearning #uczeniemaszynowe #sztucznainteligencja #datascience

Dopiero wczoraj ogarnąłem podstawy PyTorch na tyle, żeby zrobić prosty model do klasyfikacji danych ze zbioru MNIST.

Ogólnie coś tam matematyki i ML ogarniam (wcześniej używałem tensorflow), więc to nie jest też tak że wczoraj sie nauczyłem co to jest ML.


Trafiłem na pracę Microsoftu o modelu do czytaniu struktury tabel ze zdjęć https://arxiv.org/pdf/2208.04921

Problem w tym że model nie został nigdzie opublikowany, ogólnie niewiele znalazłem na ten temat poza pracami naukowymi od tych samych ludzi.


Wg waszej oceny, jak bardzo możliwe odtworzenie tego modelu, i uzyskanie chociaż zbliżonej skuteczności?

Znalazłem nowszą, bardziej rozbudowaną wersje tej samej pracy https://arxiv.org/pdf/2303.11615 w które jest jakby więcej szczegółów. Niestety moja wiedza jest zbyt skromna żeby po przeczytaniu ocenić na podstawie tej pracy czy uda mi sie to powtórzyć

31a3cb2e-818d-489c-bd5d-8d4efe75c6f6

Komentarze (3)

redve

@ataxbras trafiłem na to, ale wcześniej sie mu nie przyglądalem. Rozumiem że to jest coś do wykrywania wielu obiektów (nieznanej ilości) ze zdjęcia, na przykład linii które wyciągam w module SegRETR split module, do wykrywania linii?

ataxbras

@redve Tak. Głębiej w strukturę, zwyczajnie ustawiasz matching pod określone FFT i robisz segmentację. Linii, komórek, itp. Jest gdzieś tego paper.

Zaloguj się aby komentować