Z pewnością będę poruszał ten temat (GO) jeszcze nie raz. ( ͡~ ͜ʖ ͡°)
Na tym GIFie pokazany jest paradoks Simpsona : gdy analizujemy wąski wycinek danych, możemy nie zauważyć trendu wynikającego z większej ilości danych lub wręcz uzyskać trend przeciwny.
Dopiero, gdy zaczniemy obserwować dane z szerszej perspektywy, zauważymy prawdziwy trend - w tym przypadku wzrost średnich rocznych temperatur, czyli tzw. globalne ocieplenie.
Bez wątpienia w ciągu ostatnich dni działy się rzeczy wielkie i doniosłe. Nastąpił rozłam na wykopie, a z tym migracja tutaj. Wczoraj miała miejsce mała aferka (już nieceniam słuszności), gdzie chyba część ludzi powróciła na wykop, albo zrezygnowała.
Czy moglibyście stworzyć wykres przypływu i odpływu użytkowników w ciągu ostatnich 5 dni?
@Yakubowsky Też o tym myślałam, ciekawie będzie zobaczyć kiedy nastąpił największy napływ, szkoda tylko że nigdy nie będzie statystyk odpływu z Vikop.ru do porównania
Hejtosze i hejtoszki, pytanie mam odnośnie analizy danych, statystyki czy jakby to inaczej profesjonalnie nazwać.
Robię sobie obecnie w excelu coś takiego jak "Multiple-criteria decision analysis" i zastanawiam się nad etapem normalizacji danych do zakresu 0-1.
Normalnie stosuje się formułę taką jak na zdjęciu poniżej, gdzie min i max wylicza się ze zbioru wszystkich obecnie dostępnych wartości. Powiedzmy że mam kilka wartości: 4, 3, 6, 4, 5. Minimum to by było 3 i maksimum to by było 6. Wszystko jasne i zrozumiałe, ale powiedzmy, że ten parametr istnieje na skali od 1-6, tylko tak się złożyło, że akurat nie mam pozycji która miała by tak niskie wartości jak 1 i 2.
Więc zastanawiam się, czy powinienem minimum brać jako 1 czy jako 3? Teoretycznie, skoro skala wartości jest od 1 do 6, wartość 3 byłaby znormalizowana do 0.4 zamiast do 0, więc nie wpłynęła by aż tak negatywnie na wynik. Ale czy jest to zgodne ze sztuką? Czy są jakieś naukowe metody na decydowanie o takich rzeczach? Co sądzicie?
@Anj W tym wypadku bierzesz najmniejszą i najwyższą wartość z zakresu danych. Inaczej tego nie ustalisz, bo nawet ceny mogą być ujemne lub niewymierne.
Jeśli pojawią się nowe wartości parametrów, to normalizację wszystkich danych (albo jedynie zmienionego parametru) należy przeprowadzić ponownie (przynajmniej ja bym tak zrobił, a komputery sobie z tym szybko poradzą).
Źródła wykorzystane do napisania tego tekstu zamieszczam na końcu
Samobójstwo stanowi trzecią najczęstszą przyczynę zgonów na świecie dla grupy wiekowej między 15. a 44. rokiem życia. W sposób ten ginie rocznie więcej osób niż w wyniku konfliktów zbrojnych i zamachów terrorystycznych. Badania prowadzone przez Światową Organizację Zdrowia oraz Międzynarodowe Towarzystwo Zapobiegania Samobójstwom wykazują, że istnieje tendencja wzrostowa, jeśli chodzi o zachowania samobójcze. W latach 1950-2000 ich liczba wzrosła o ponad 60%. Zdaniem większości suicydologów jest to jednak niedoszacowane i oficjalnie ujawnia się co najmniej od 10% do 20% mniej samobójstw niż faktycznie popełniono. Akt odebrania sobie życia jest w wielu krajach potępiany ze względu na obowiązujące powszechnie przekonania religijne. Z tego powodu w niektórych przypadkach bliscy ofiary próbują ukryć fakt o tym, że sama pozbawiła się życia. Kluczowy jest także aspekt prawny, ponieważ zazwyczaj firmy ubezpieczeniowe odmawiają rodzinie wypłaty odszkodowania.
Wśród krajów zachodnioeuropejskich należy wyróżnić Belgię, która charakteryzuje się wyjątkowo wysokim wskaźnikiem w tej części globu, wynoszącym 18 samobójstw na 100 tys. mieszkańców. Przyczyną takiego stanu rzeczy może być fakt, że władze tego państwa w 2002 roku wprowadziły przepisy prawne legalizujące eutanazję. Jej dostępność poszerzyła ustawa nowelizująca z 2014 roku, dzięki czemu mogą z niej korzystać wszystkie chętne osoby bez ograniczeń wiekowych.
Czwartym najwyższym wskaźnikiem samobójstw na świecie szczyci się Korea Południowa. Ich liczba jest wysoka szczególnie wśród osób w podeszłym wieku ze względu na odejście od modelu, zgodnie z którym dzieci powinny opiekować się swoimi rodzicami, gdy nie mogą oni już samodzielnie funkcjonować. Decydują się więc na wcześniejsze zakończenie życia, aby nie stanowić obciążenia dla swojej rodziny. Spory odsetek stanowią także uczniowie i studenci, czego przyczyną może być wywierana na nich presja w odnoszeniu sukcesów naukowych. W przypadku niepowodzenia w szkole lub na uczelni traktują swoją porażkę jako hańbę dla siebie i swojej rodziny. Prowadzi to do takich problemów jak alkoholizm, stres i brak snu. Powszechne metody odebrania sobie życia w Korei Południowej to zatrucie tlenkiem węgla, a także skok z mostu. Rząd tego kraju stara się przeciwdziałać zjawisku poprzez zwiększenie dostępu do opieki psychiatrycznej. Większość osób, które podejmują próbę samobójczą posiada zaburzenia psychiczne.
Samobójstwo to powszechne zjawisko w Japonii. Pomimo tego, że nie znajduje się ona wśród dziesiątki krajów o największym współczynniku samobójstw, to problem ten jest na tyle poważny, że władze państwowe aktywnie podejmują próby interwencji w celu zmniejszenia ryzyka prób zakończenia życia, szczególnie wśród grup społecznych zmagających się z problemami finansowymi. Jest to główna przyczyna śmierci mężczyzn w wieku od 20 do 44 lat i kobiet w wieku od 15 do 34 lat. Szczególnie niepokojąca jest skala tego zjawiska wśród osób, które straciły pracę i nie są w stanie utrzymać swojej rodziny. Popularnym miejscem wśród osób, które chcą odebrać sobie życie jest las Aokigahara u podnóżka japońskiej góry Fuji. Każdego roku dochodzi tam do licznych przypadków prób samobójczych, a lokalna policja regularnie patroluje teren.
W Szwecji wskaźnik liczby samobójstw na 100 tys. mieszkańców wynosił w 2019 roku 14,796 . Wpływ na jego wielkość może mieć fakt, że kraj ten charakteryzuje się długimi zimami, krótkimi dniami i niewielką ilością słońca, przede wszystkim w regionach północnych, czego efektem jest występowanie licznych przypadków depresji sezonowej.
Większość ofiar samobójstw w Chinach to kobiety, w przeciwieństwie do krajów zachodnich, gdzie zdecydowanie częściej są to mężczyźni. Dynamiczny wzrost gospodarczy doprowadził do tego, że w wielu przypadkach decydują się one na rozwód, lecz efektem tego jest obowiązek samotnego wychowywania dzieci i wielogodzinnej pracy, przez co część z nich nie daje rady funkcjonować w taki sposób i decyduje się na drastyczne kroki. Wiele ubezpieczeń nie obejmuje pobytu w szpitalu w przypadku próby samobójczej. Pięciokrotnie częściej podejmują się jej mieszkańcy obszarów wiejskich niż miejskich.
W Europie największy współczynnik zgonów z powodu samobójstwa na 100000 mieszkańców w roku 2019 występował na terenie Ukrainy, gdzie wynosił 26,34. W Litwie i Rosji było to odpowiednio 23,87 i 22,77, natomiast w Polsce 13,68.
Źródła:
M. Derdziuk, Praktyka eutanazji w Belgii jako owoc przemian społeczno-obyczajowych, „Teologia i Moralność” 2017, nr 2, s. 163.
K.M. Shin, S-M. Cho, Suicide among the elderly and associated factors in South Korea, „Aging & Mental
R. Yu, Y. Chen, L. Li, J. Chen, Y. Guo, Z. Bian, Factors associated with suicide risk among Chinese adults: A prospective cohort study of 0.5 million individuals. „PLoS Med” 2021, nr 3, s. 7.
Nie mają więcej. To jest ilość zarejestrowanych na 1000 mieszkańców. Prawdopodobnie u nas jest więcej niezarejestrowanych jako uchodźcy. Ale może być też tak, że na mieszkańca oni przyjęli więcej osób.
Czołem! W czasie pandemii w google wyświetlało na bieżąco statystyki zachorowań (a właściwie pozytywnych testów) na Covid-19, śmierci, procent wysczepienia w poszczególnych krajach. Teraz tego nie widzę znacie może jakieś źródło z takimi danymi? Pozdrawiam
@ocotutajchodzi tylko jest jeszcze jeden mały czynnik, który różnicuje sytuację sprzed roku - większa mobilność obecnie, teraz jest wszystko otwarte, łącznie z transportem międzynarodowym na większą skalę niż w zeszłym roku
@Morrak Tym lepiej dla statystyk z 2021 roku - skoro mobilność jest większa, to powinno być więcej zakażeń. A póki co w każdej z czterech głównych kategorii jest lepiej. Nie tak dobrze, jak sobie życzę, ale lepiej.
@ocotutajchodzi ano, na razie jest lepiej. Ja liczę, że tej fali nie będzie, a przynajmniej nie będzie już tak mocna. I że ta cala sytuacja pójdzie se w końcu w cholere :<
W "upublicznionym" wycieku danych Facebooka jest 2 669 381 rekordów dotyczących rodzimych kont.
Rekordy zawierają:
numer telefonu,
identyfikator użytkownika na FB,
imię / imiona (wyświetlane w profilu),
nazwisko / nazwiska (wyświetlane w profilu),
płeć (wybiórczo wyświetlana, prawdopodobnie tylko wtedy, jeżeli była ustawiona w profilu),
miejsce zamieszkania (wybiórczo wyświetlane, tylko wtedy, jeżeli było ustawione w profilu),
miejsce "pochodzenia" (wybiórczo wyświetlane, tylko wtedy, jeżeli było ustawione w profilu),
stan cywilny (wybiórczo wyświetlany, tylko wtedy, jeżeli był ustawiony w profilu),
miejsce zatrudnienia (wybiórczo wyświetlane, tylko wtedy, jeżeli było ustawione w profilu),
prawdopodobnie data ostatniego logowania / aktualizacji,
adres e-mail (sporadycznie),
data urodzenia (wybiórczo wyświetlana, tylko wtedy, jeżeli była ustawiona w profilu),
data ukończenia edukacji (wybiórczo wyświetlana, tylko wtedy, jeżeli była ustawiona w profilu),
prawdopodobnie data utworzenia konta.
Wygląda też na to, że w każdym rekordzie znajduje się przybliżona data zrzutu. Zakłada się, że baza pochodzi z 2019 roku.
Kopiąc dalej można dostrzec kilka ciekawostek. Oto 11 wybranych:
W 21 593 przypadkach pojawiły się adresy e-mail (~0,81% ogółu),
Najczęściej występującą formą / miejscem zatrudnienia są samozatrudnieni (suma: 'employed', 'firma', 'działalność', 'dzialalność', 'działalnośc', 'dzialalnosc'): 25 587 osób (~0,96% ogółu).
Na drugim miejscu, przyszłość narodu:
"Szlachta nie pracuje" (14 192 wystąpień),
"Wyższa Szkoła Robienia Hałasu (WSRH)" (1095 wystąpień),
"Wyższa szkoła melanżu ." (1048 wystąpień),
"SZLACHTA BALUJE PLEBS HARUJE" (796 wystąpień),
"Wyższa szkoła melanżu ." (1048 wystąpień),
"Szlachta Nie Pracuje" (667 wystąpień)
i mniej znaczące arystokracje (także w stylu "szlahta" oraz "opierdalam się").
W sumie: 18 769 osób (luźna konkluzja: około 0,7% ogółu może mieć rycerskie korzenie).
Emeryci i renciści zamykają podium (suma: 'retired', 'emeryt', 'rencista'): 6342 osoby (~0,24% ogółu).
Najwyżej klasyfikowaną pod powyższym względem firmą jest Poczta Polska (pisana w różnych formach): 2 458 osób (~0,09%).
W sumie 642 855 osób podało cokolwiek w polu zatrudnienia. Dla tej kategorii brałem pod uwagę te pozycje, które wystąpiły, co najmniej 40-krotnie.
W całej grupie jest:
1 327 577 kobiet (~49,73% ogółu),
1 220 698 mężczyzn (~45,73% ogółu),
a 121 106 osób (~4,54% ogółu) postanowiło nie dzielić się tym szczegółem.
Stan cywilny kształtuje się następująco:
brak statusu: 2 022 577 osób (~75,77% ogółu),
małżeństwo: 323 040 osób (~12,1% ogółu),
singiel: 143 119 osób (~5,36% ogółu),
w związku: 119 279 osób (~4,47% ogółu),
zaręczeni: 41 223 osób (~1,54% ogółu),
rozwiedzeni: 5075 osób (~0,19% ogółu),
wdowcy: 4898 osób (~0,18% ogółu),
pozostali ("to skomplikowane ;)", związek cywilny, otwarta relacja, separacja, związek rejestrowany): 10 170 osób (~0,39% ogółu).
Uwzględniając pozycje powyżej 100 wystąpień najwięcej osób zamieszkuje następujące miasta:
Warszawa: 95 178 osób (~3,56% ogółu),
Wrocław: 51 320 osób (~1,92% ogółu),
Kraków: 47 054 osób (~1,76% ogółu),
Poznań: 37 532 (~1,41% ogółu),
Gdańsk: 26 542 osób (~0,99% ogółu),
bez ustawionej lokalizacji: 1 295 608 (~48,53% ogółu).
Uwzględniając damską i męską formę wśród 348 013 nazwisk królują:
Nowak: 17 698 osób (~0,66% ogółu),
Kowalski / Kowalska: 14 662 (~0,55% ogółu),
Kowalczyk: 5849 (~0,22% ogółu),
Wójcik: 4996 (~0,19% ogółu),
Mazur: 4406 (~0,16% ogółu).
Datę urodzenia (częściową lub pełną) uzupełniło 125 331 osób (~4,69% ogółu).
W sumie "wyciekły" dane o ca 533 milionach kont z całego świata.
W związku z tym, że jak widać nasze dane są zawsze i wszędzie bezpieczne życzę wszystkim owocnego wypełniania spisu powszechnego
W niedzielę, dzień po wprowadzeniu obostrzeń liczba zakażonych znacząco spadła (niecałe 15k) w stosunku do poprzednich dni (ponad 20k-25k), świetne zachowanie naszego rządu, dobrze że nad nami czuwają