Statystyki w Polsce

Statystyki w Polsce

Liczba osób w Polsce pobierających emeryturę niższą niż minimalna emerytura, tzw. emeryturę głodową.

Data wpisu: 10.10.2023

W niniejszym artykule pragnę przedstawić, w jaki sposób dopasować teoretyczną linię trendu do danych empirycznych oraz dokonać oceny z wykorzystaniem wykresu punktowego oraz dwóch podstawowych miar dopasowania modelu teoretycznego do danych empirycznych:

Analizę przygotowano na podstawie danych z Zakładu Ubezpieczeń Społecznych (ZUS) dotyczących wysokości emerytur.

Źródło: 1.

Dane przedstawiono na wykresie punktowym z dopasowaniem funkcją liniową i kwadratową:

Rysunek: opracowanie własne.
Rysunek: opracowanie własne.

Obydwie miary dopasowania modelu wskazują na lepsze dopasowanie funkcją kwadratową. Współczynnik determinacji dla funkcji kwadratowej jest wyższy i wynosi 98% w przeciwieństwie do liniowej wynoszącej 95%, natomiast zmienność składnika resztowego dla funkcji kwadratowej jest niższa i wynosi 20,01 w przeciwieństwie do funkcji liniowej wynoszącej 29,67.

Analizując dane na wykresie zauważyć można, że od roku 2017 liczba osób pobierających tzw. emeryturę głodową wyraźnie wzrasta.

Jeżeli sytuacja polityczno-gospodarcza kraju nie ulegnie zmianie, to istnieje wysokie prawdopodobieństwo, że w roku 2024 liczba emerytów z tzw. emeryturą głodową przekroczy liczbę 400 tysięcy.

.

Wykres przygotowano z wykorzystaniem programu Minitab.

Autor: dr inżRafał Popiel

Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych:

…………………………………………………………………………………………………………………………………………………………….

Zadłużenie samodzielnych publicznych zakładów opieki zdrowotnej (SPZOZ).

Data wpisu: 02.10.2023

W dzisiejszym wpisie chciałbym przedstawić zastosowanie wykresu punktowego (ang. Scatterplot), który wykorzystywany jest do analizy danych, reprezentowanych przez co najmniej dwie zmienne, na kartezjańskim układzie współrzędnych.

Wykres punktowy służy do określenia siły i kierunku zależności pomiędzy zmienną X (objaśniającą) a zmienną Y (objaśnianą). Zalecane jest dopasowanie linii regresji do danych oraz policzenie podstawowych statystyk: współczynnika determinacji (R2), zmienności na resztach (S), współczynnika kierunkowego, czyli nachylenia linii regresji względem osi X (osi odciętych) i wyrazu wolnego.

Dane do budowy wykresu pozyskano ze strony Ministerstwa Zdrowia i dotyczą zadłużenia samodzielnych publicznych zakładów opieki zdrowotnej (SPZOZ). Według Systemu Statystyki w Ochronie Zdrowia zadłużenie SPZOZ od 2008 roku kształtuje się następująco:

Źródło: 1.

Na podstawie danych z tabeli, przygotowano wykres punktowy:

Rysunek: opracowanie własne.

Na wykresie znajdują się dwa panele, pierwszy dotyczący lat 2008-2015 i drugi dotyczący lat 2016-2022. Za czasów rządów partii PO-PSL nachylenie linii regresji (współczynnik kierunkowy) wynosiło 398 674, natomiast za rządów partii PiS wynosi 3 543 926, co oznacza wzrost o około 789%. Można powiedzieć, że za rządów PiS zadłużanie samodzielnych publicznych zakładów opieki zdrowotnej przyśpieszyło przeciętnie o 789% w stosunku do rządów PO-PSL i jest istotne statystycznie.

W wartościach bezwzględnych, wzrost zadłużenia pomiędzy 1 kwartałem 2008 a 4 kwartałem 2015 roku (rządy PO-PSL) wyniósł ok. 1,29 mld złotych, natomiast wzrost zadłużenia pomiędzy 1 kwartałem 2016 a 3 kwartałem 2022 roku (rządy PiS) wyniósł 8,29 mld złotych.

Przedstawione obliczania przeczą bieżącej narracji partii rządzącej, że sytuacja finansowa samodzielnych publicznych zakładów opieki zdrowotnej jest lepsza teraz za rządów PiS, niż była za rządów PO-PSL.

.

Wykres przygotowano z wykorzystaniem programu Minitab.

Autor: dr inżRafał Popiel

Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych:

…………………………………………………………………………………………………………………………………………………………….

Przeciętne zatrudnienie w Kancelarii Prezesa Rady Ministrów.

Data wpisu: 27.09.2023

W niniejszym wpisie chciałbym przedstawić zastosowanie wykresu wartości indywidualnej (ang. Individual Value Plot), który stosowany jest do oceny położenia, rozrzutu, symetrii rozkładu danych, a także do wstępnej identyfikacji obserwacji (pomiarów) odstających.

Na wykresie znajdują się pojedyncze (szare) punkty odpowiadające wartościom konkretnych pomiarów oraz punkty niebieskie przedstawiające wartości średniej arytmetycznej z pomiarów. Na wykres nanieść można opcjonalnie dodatkowe punkty przedstawiające wartości median. Wykres wartości indywidualnej świetnie sprawdza się dla próbek o niewielkiej liczności.

Dane do wykresu pozyskano z kontroli wykonania budżetu państwa przeprowadzaną corocznie przez Najwyższą Izbę Kontroli.
Na wykresie przedstawiono przeciętne zatrudnienie w Kancelarii Prezesa Rady Ministrów w latach 2007-2014 oraz 2017-2022, w których Premierami byli Donald Tusk i Mateusz Morawiecki.

Przeciętne zatrudnienie w tych latach w KPRM kształtowało się następująco:

Źródło: 1, 2.

Na podstawie danych z tabeli, przygotowano wykres wartości indywidualnej:

Rysunek: opracowanie własne.

Na podstawie danych stwierdzić należy, że średnia wielkość przeciętnego zatrudnienia w KPRM za czasów Mateusza Morawieckiego wzrosła o 25,1% z przeciętnie 565,5 do 707,2 etatu.
Wzrost zatrudnienia wiąże się ze wzrostem kosztów utrzymania kancelarii Premiera, co kłóci się z często propagowanym przez bieżący rząd sloganem wyborczym „tanie państwo”.

.

Wykres przygotowano z wykorzystaniem programu Minitab.

Autor: dr inżRafał Popiel

Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych:

…………………………………………………………………………………………………………………………………………………………….

Powierzchnia nieruchomości gruntowych w Polsce nabytych przez osoby fizyczne z Niemiec.

Data wpisu: 20.09.2023

Celem wpisu jest przedstawienie i analiza danych za pomocą wykresu przedziałowego dla średniej arytmetycznej. Wykres przedziałowy jest jednym z podstawowych wykresów służących do oceny różnicy pomiędzy wartościami średnimi (i nie tylko) obliczonymi na podstawie danych z pobranej próbki. Jest także świetnym narzędziem wykorzystywanym do celów optymalizacji i regulacji procesów przemysłowych.
Wykres przedstawia estymator punktowy średniej arytmetycznej dla każdej próbki wraz z dwustronnym przedziałem ufności najczęściej 95-procentowym.


Dane do budowy wykresu pozyskano ze sprawozdań Ministra MSWiA z realizacji ustawy z dnia 24 marca 1920 roku nabywaniu nieruchomości przez cudzoziemców.
Według sprawozdań, powierzchnia nieruchomości gruntowych w Polsce nabytych przez osoby fizyczne z Niemiec kształtuje się następująco:

Źródło: 1, 2, 3, 4, 5, 6.

Na podstawie danych z tabeli, przygotowano wykres przedziałowy:

Rysunek: opracowanie własne.

Na podstawie danych stwierdzić należy, że przeciętna (średnia arytmetyczna) sprzedaż gruntów w latach 2007-2015 wyniosła 140,69 ha, natomiast w latach 2016-2022 wyniosła 601,64 ha. Stanowi to wzrost o 328%. Dodatkowo przedziały ufności nie pokrywają się wzajemnie, co pozwala na interpretację, że wzrost sprzedaży nieruchomości gruntowych za rządów partii PiS jest istotny statystycznie.

Powyższy obraz kłóci się z licznymi stwierdzeniami przedstawicieli partii rządzącej „że to oni, poprzednicy wyprzedawali Polskę Niemcom”.

.

Wykres przygotowano z wykorzystaniem programu Minitab.

Autor: dr inżRafał Popiel

Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych:

…………………………………………………………………………………………………………………………………………………………….

Relacja pomiędzy spadającym wskaźnikiem inflacji a poziomem cen – sondaż wśród Polaków.

Data wpisu: 12.09.2023

W niniejszym wpisie chciałbym przedstawić zastosowanie wykresu kołowego, kolumnowego i testu  Chi2 na podstawie wyniku sondażu przeprowadzonego w ramach projektu ciekaweliczby.pl

Pytanie w ramach ankiety brzmiało: „Co według Ciebie oznacza informacja, że inflacja w marcu 2023 roku wyniosła 16,1% w porównaniu z marcem ubiegłego roku, natomiast inflacja w kwietniu 2023 roku wyniosła 14,7% w porównaniu z kwietniem ubiegłego roku?”.

Poprawnej odpowiedzi, „że ceny dalej rosną, tylko trochę wolniej”, udzieliło tylko 60% ankietowanych.
Szczegółowe dane przedstawiono na wykresie kołowym:

Rysunek: opracowanie własne. Źródło: ciekaweliczby.pl

Ciekawie wygląda rozkład udzielonych odpowiedzi, ze względu na poparcie ankietowanego dla danej partii politycznej. Wyższy odsetek poprawnych odpowiedzi (powyżej 70%) udzieli wyborcy „opozycji demokratycznej”, w przeciwieństwie do wyborców partii PiS (53%).

Jednocześnie wyższy odsetek błędnych odpowiedzi, „że wraz ze spadkiem inflacji ceny spadają”, udzielili wyborcy PiS (21%) w przeciwieństwie do wyborców opozycji (1%). Szczegółowy rozkład głosów przedstawiono na wykresie kolumnowym:

Rysunek: opracowanie własne. Źródło: ciekaweliczby.pl

Wynik ankiety poddano także weryfikacji za pomocą nieparametrycznego testu niezależności dwóch zmiennych Chi2, w którym sprawdzianem testu jest statystyka:

Wynik testu przedstawiono poniżej:

W wyniku testu Chi2 potwierdzono istotność statystyczną (p-value 0,00) zależności pomiędzy odsetkiem odpowiedzi a preferencją wyborczą ankietowanego. Wyborcy partii PiS istotnie statystycznie więcej razy udzielili błędnych odpowiedzi w stosunku do wyborców opozycji.

Nasuwa się pytanie, czy przyczyną tego zjawiska może być fakt, że wyborcy partii PiS częściej wybierają przekaz telewizji rządowej od przekazu innych mediów.

.

Wykresy przygotowano z wykorzystaniem programu Minitab.

Autor: dr inżRafał Popiel

Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych:

…………………………………………………………………………………………………………………………………………………………….

Odsetek katolików uczestniczących w niedzielnych mszach świętych. Dane z trendem.

Data wpisu: 05.09.2023

Artykuł ma na celu przedstawienie sposobu pokazania i zinterpretowania danych z trendem. Do tego celu użyjemy wskaźnika Dominicantes. Wskaźnik Dominicantes oblicza się jako odsetek katolików uczęszczających na niedzielną mszę świętą w odniesieniu do ogólnej liczby zobowiązanych. Więcej o metodzie badania można znaleźć tu: Dominicantes metodologia (iskk.pl)

Wartości wskaźnika Dominicantes od roku 1990 kształtują się następująco:

Źródło: Annuarium Statisticum Ecclesiae in Polonia. Dane za rok 2021 (iskk.pl)

Najprostszym podejściem jest przedstawienie tych danych na wykresie liniowym. Jeżeli obliczymy także wartość średniej arytmetycznej i zakres 6 odchyleń standardowych, to do tego celu zdawać by się mogło, że można użyć podstawowej karty Shewharta wartości indywidualnej (Xi):

Rysunek: opracowanie własne.

Na wykresie pojawiają się dane w trendzie spadkowym – wskaźnik Dominicantes systematycznie od roku 1990 spada. Dla tego typu danych zastosowanie karty wartości indywidualnej nie jest dobrym pomysłem. W takiej sytuacji korzystne jest zastosowanie karty regresji:

Rysunek: opracowanie własne.

W tym przypadku dane wartości wskaźnika Dominicantes są lepiej dopasowane niż w przypadku karty Shewharta. Uwzględniając negatywne nachylenie linii regresji i wartość współczynnika kierunkowego wynoszącego -0,00482 można oszacować, że przeciętny roczny spadek odsetka katolików uczestniczących w niedzielnych mszach świętych wynosi ok. 0,48 punktu procentowego. Dodatkowo wartość wskaźnika za 2021 i 2022 rok uległa wyraźnemu obniżeniu i znajduje się w okolicy (i poza) dolną linią ograniczenia statystycznego (LCL). Różnica wskaźnika pomiędzy rokiem 2019 a 2021 wyniosła aż 8,6 punktu procentowego.


Można tylko spekulować, co jest przyczyną tak dużego spadku (covid i zamknięcie kościołów, filmy braci Sekielskich o pedofilii w kościele, związanie z partią PiS większości hierarchów Episkopatu, czy inne), ponieważ w tym artykule analizie poddana została tylko zmienna Y (wskaźnik Dominicantes) bez korelowania jej z jakąkolwiek zmienną X.

Warto zapamiętać, że dane z procesów z trendem analizować należy z wykorzystaniem karty regresji i za jej pomocą sterować procesem a także porównywać proces przed i po zmianie np. z wykorzystaniem testu dwóch regresji prostych.

.

Wykresy przygotowano z wykorzystaniem programu Minitab.

Autor: dr inżRafał Popiel

Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych:

…………………………………………………………………………………………………………………………………………………………….

Wzrost wynagrodzenia nauczycieli w Polsce

Data wpisu: 31.08.2023

Czas kampanii przed wyborami do parlamentu to czas gorących dyskusji i sporów na tematy polityczne, światopoglądowe czy ekonomiczne.

Jednym z głównych sporów jest wzrost płacy minimalnej w Polsce, szczególnie „za ostatnie osiem lat”.

Gdyby spojrzeć na dane w sposób bezwzględny, tak jak to prezentuje rząd polski to istotnie, minimalne wynagrodzenie w Polsce wzrasta:

.

statystyki

Rysunek: opracowanie własne. Źródło: Minimalne wynagrodzenie za pracę od 2003 r. – ZUS

.

Analogicznie, poddając analizie wzrost wynagrodzenia nauczycieli w Polsce to wzrost w wartościach bezwzględnych wynagrodzenia, jest także znaczący a trend widoczny:

statystyki

Rysunek: opracowanie własne. Źródło: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 ,16, 17

.

Jednak ten sposób patrzenia na dane może wnosić pewne zniekształcone spojrzenie na rzeczywistość, czyli na zasobność portfela obywatela.

Połączmy powyższe dane i spróbujmy spojrzeć na wynagrodzenie nauczycieli w sposób względny, to znaczy względem minimalnego wynagrodzenia w Polsce.

Jeżeli policzymy, o ile wynagrodzenie nauczycieli było wyższe od płacy minimalnej w Polsce w kolejnych latach, i przedstawimy to w wartościach procentowych (względnych), to sytuacja nie wygląda już tak „różowo”:

Rysunek: opracowanie własne.

Analizując dane w ten sposób, można zrozumieć niezadowolenie nauczycieli i jednocześnie nie zgadzać się z twierdzeniem ministerstwa edukacji, że sytuacja płacowa nauczycieli jest lepsza niż za czasów „poprzedniej władzy”, chociaż oczywiście wtedy także trend był spadkowy.

Podobna sytuacja dotyczyć będzie wielu zawodów w Polsce, z pewnością większość tzw. budżetówki.

Warto zapamiętać, że dane (zmienne) można i trzeba analizować w sposób bezwzględny, jednak bardzo często te same dane należy analizować w odniesieniu do innej zmiennej i przedstawiać np. w wartościach procentowych (względnych).

.

Wykresy przygotowano z wykorzystaniem programu Minitab.

Autor: dr inżRafał Popiel

Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych: