Hejtosze i hejtoszki, pytanie mam odnośnie analizy danych, statystyki czy jakby to inaczej profesjonalnie nazwać.
Robię sobie obecnie w excelu coś takiego jak "Multiple-criteria decision analysis" i zastanawiam się nad etapem normalizacji danych do zakresu 0-1.
Normalnie stosuje się formułę taką jak na zdjęciu poniżej, gdzie min i max wylicza się ze zbioru wszystkich obecnie dostępnych wartości. Powiedzmy że mam kilka wartości: 4, 3, 6, 4, 5. Minimum to by było 3 i maksimum to by było 6. Wszystko jasne i zrozumiałe, ale powiedzmy, że ten parametr istnieje na skali od 1-6, tylko tak się złożyło, że akurat nie mam pozycji która miała by tak niskie wartości jak 1 i 2.
Więc zastanawiam się, czy powinienem minimum brać jako 1 czy jako 3? Teoretycznie, skoro skala wartości jest od 1 do 6, wartość 3 byłaby znormalizowana do 0.4 zamiast do 0, więc nie wpłynęła by aż tak negatywnie na wynik. Ale czy jest to zgodne ze sztuką? Czy są jakieś naukowe metody na decydowanie o takich rzeczach? Co sądzicie?
#matematyka #statystyka #programowanie #excel
