Pytanie do ogarniających ludzi #machinelearning #uczeniemaszynowe #sztucznainteligencja #datascience Dopiero wczoraj - redve

Popularne artykuły

Popularne dyskusje

Kategorie

Popularne tagi

Pytanie do ogarniających ludzi #machinelearning #uczeniemaszynowe #sztucznainteligencja #datascience Dopiero wczoraj - redve - Hejto.pl

Fanatyk

w Hydepark w zeszłym roku

Pytanie do ogarniających ludzi #machinelearning #uczeniemaszynowe #sztucznainteligencja #datascience

Dopiero wczoraj ogarnąłem podstawy PyTorch na tyle, żeby zrobić prosty model do klasyfikacji danych ze zbioru MNIST.

Ogólnie coś tam matematyki i ML ogarniam (wcześniej używałem tensorflow), więc to nie jest też tak że wczoraj sie nauczyłem co to jest ML.

Trafiłem na pracę Microsoftu o modelu do czytaniu struktury tabel ze zdjęć https://arxiv.org/pdf/2208.04921

Problem w tym że model nie został nigdzie opublikowany, ogólnie niewiele znalazłem na ten temat poza pracami naukowymi od tych samych ludzi.

Wg waszej oceny, jak bardzo możliwe odtworzenie tego modelu, i uzyskanie chociaż zbliżonej skuteczności?

Znalazłem nowszą, bardziej rozbudowaną wersje tej samej pracy https://arxiv.org/pdf/2303.11615 w które jest jakby więcej szczegółów. Niestety moja wiedza jest zbyt skromna żeby po przeczytaniu ocenić na podstawie tej pracy czy uda mi sie to powtórzyć

Arxiv

Komentarze (3)

ataxbras w zeszłym roku

@redve Odtworzenie 1:1 to pewnie nie Twój cel, raczej odtworzenie funkcjonalności. Podstawą jest tu ten transformer: https://github.com/facebookresearch/detr . Jak go opanujesz, to reszta pójdzie z górki.

GitHub - facebookresearch/detr: End-to-End Object Detection with Transformers

End-to-End Object Detection with Transformers. Contribute to facebookresearch/detr development by creating an account on GitHub.

GitHub

redve w zeszłym roku

@ataxbras trafiłem na to, ale wcześniej sie mu nie przyglądalem. Rozumiem że to jest coś do wykrywania wielu obiektów (nieznanej ilości) ze zdjęcia, na przykład linii które wyciągam w module SegRETR split module, do wykrywania linii?

ataxbras w zeszłym roku

@redve Tak. Głębiej w strukturę, zwyczajnie ustawiasz matching pod określone FFT i robisz segmentację. Linii, komórek, itp. Jest gdzieś tego paper.

Zaloguj się aby komentować

Popularne artykuły

Popularne dyskusje

Kategorie

Popularne tagi

Dyskusja użytkownika redve

Komentarze (3)