25 lutego 2023

Moja prognoza demograficzna, czyli jak zbudowałem prostą prognozę

W tym wpisie chciałbym pokazać Czytelnikom, jak można skonstruować swoją prognozę demograficzną na podstawie dostępnych danych.  Przeglądając dane demograficzne za ostatnie lata, zauważyłem spadającą liczbę kobiet w wieku rozrodczym. To popchnęło mnie do wyliczenia, jakie jest płodność poszczególnych grup wiekowych. Okazało się, że zarówno według danych ze spisu, jak i nieco wcześniej, za około 94% porodów odpowiadały kobiety w wieku 20-39 lat. To podsunęło mi pomysł na zastosowanie kilku uproszczeń w celu zbudowania prostej prognozy.

Sięgnąłem po dane o porodach według wieku matki, jakie zawiera "Baza demografia" GUS, dostępna online. Tam też są dane o ludności w podziale na wiek i płeć, a ostatnie pełne dostępne dane dotyczą roku 2021. Skoncentrowałem się na grupie wiekowej 20-39, ale też rocznikach ją poprzedzających.

Ponieważ do wieku 20 lat jest dwadzieścia roczników poprzedzających (0-19), których liczność znamy dla każdego rocznika, to można przewidzieć, jak będzie zmieniała się liczność grupy wiekowej 20-39. W tym celu wystarczy założyć, że każda 19-latka za rok, o ile dożyje, zostanie 20-latką, 20 latka - 21-latką itd. aż do 39-latek, które stając się 40-latkami, opuszczą grupę 20-39. W zwykłym arkuszu kalkulacyjnym wystarczy grupę wiekową 0-38 dla każdego rocznika przeliczyć na 1-39 i powtarzać tę operację 19 razy, otrzymując prognozę do roku 2040. A wszystko to bez opierania się o szeroką grupę wiekową 15-49, która jest formalną podstawą liczenia TFR.

Założenie "o ile dożyje" oznacza, że jakaś część kobiet nie dożyje. Jak to policzyć? GUS udostępnia tablice trwania życia w podziale na wiek i płeć. Znajduje się tam także współczynnik ryzyka zgonu qx  wyrażony ułamkiem dla każdego rocznika. Szansa na przeżycie to jego przeciwieństwo, 1-qx. Mnożymy liczność rocznika kobiet * (1-qx) i mamy liczność rocznika kobiet za rok, o rok starszego. I tak dla każdego rocznika, co rok, przeliczałem grupę kobiet.

Oczywiście taka prognoza nie uwzględnia migracji, z którą ma problem nawet GUS, ma też tę wadę, że prawdopodobieństwo zgonu może się zmienić, a po pandemii było wyższe, niż wcześniej. Dlatego na potrzeby tej kalkulacji przyjąłem współczynniki z roku 2021 dla roku 2021, ale dla kolejnych lat współczynniki z roku 2019, które są nieco korzystniejsze. Tym samym zakładam odwrót pandemii.

Teraz wystarczy zsumować liczność kobiet dla wieku 20-39 i można kreślić pierwszy prognostyczny wykres. Ponieważ wszystkie kobiety, które tu przeliczamy, to roczniki, które się urodziły, to ryzyko poważnych odchyleń należy uznać za niewielkie. Oto wynik:

Jak widać, liczba kobiet 20-39 będzie spadać przez 12 lat, przy czym spadki po roku 2028 będą słabły, i ustabilizuje się nieco powyżej 3,7 mln do roku 2040. W 2041 roku do wieku 20 lat dojdzie rocznik urodzony w 2021 roku, a w kolejnym urodzony w 2022 roku i już wiemy, że kontynuacja tego wykresu nie zapowiada się wesoło, ale na razie odłóżmy ten temat.

Mając liczność kobiet w wieku 20-39 dla każdego rocznika sięgnąłem po dane o porodach z roku 2021 w podziale na wiek matki. Rok 2021 może nie był zbyt typowy z powodu pandemii, ale był to rok spisu powszechnego i dlatego sięgnąłem po skorygowane dane. TFR w tymże roku wyniósł 1,32. Jest to wartość znacznie niższa niż poprzednio, ale lepsza niż w 2022 roku. Założyłem, że płodność w kolejnych latach będzie wyglądać podobnie i przeliczyłem porody każdego rocznika na 1000 kobiet, aby uzyskać współczynniki do dalszych obliczeń.

Przemnażając rocznik kobiet przez uzyskane współczynniki porodów, otrzymałem liczbę rodzonych dzieci dla każdego rocznika. Teraz wystarczy je zsumować i na koniec przemnożyć przez odwrotność udziału grupy 20-39 we wszystkich urodzeniach, by uzyskać ogólną liczbę urodzeń dla jednego roku! 
Jeszcze skopiowanie wzoru dla kolejnych lat i mamy prognozę urodzeń, uff!


Szara linia to moja prognoza. Spada w kierunku 250 tys. urodzeń, by około 2032-33 roku osiągnąć dołek, po którym nastąpi słabe odbicie. 

Do wykresu pozwoliłem sobie dodać jeszcze prognozę urodzeń ONZ zgodnie z modelem średnim WPP2022, dla porównania. Wiemy, że w roku 2022 mieliśmy 305,5 tys. urodzeń i że liczba ta obejmuje około 15 tys. urodzeń matek-obcokrajowców. Jak widać, moja prognoza dla roku 2022 okazała się zbyt optymistyczna. Ale czy dostrzegacie, jak fantastyczne wydaje się teraz to, co prognozuje ONZ? Ta górka do 2023 to były wg ONZ urodzenia uchodźców!

Oczywiście Czytelnicy zauważą, jak liczne są uproszczenia i założenia w takiej prognozie. Realnie TFR ulega licznym zmianom z roku na rok, jest trudny do przewidzenia, różne wydarzenia wpływają na płodność. Może być on zarówno wyższy, jak i niższy. Może też kiedyś uda oszukać się biologię i będzie więcej porodów po 40 roku życia, albo będzie więcej młodych matek, jak w kulturach krajów rozwijających się. ONZ te możliwe przebiegi probabilistyczne ładnie obrazuje na swoich stronach jako liczne probabilistyczne linie, bynajmniej nie gładkie. Ponadto ONZ zakłada powolne odbijanie TFR w kierunku ok. 1.8, wskazując na realizację marzeń o idealnej rodzinie. 

Ta gładkość wykresu to wynik uproszczeń na rzecz czytelności. Gdzie ją jeszcze można znaleźć? Np. w starej prognozie GUS z 2014 roku. GUS w wariancie średnim na rok 2020 przewidywał 339 tys. urodzeń (było 355 tys.), a  na rok 2025 przewidywał 310 tys. urodzeń. Jak wydaje się, dwukrotnie przestrzelił, ale inaczej za każdym razem. 

Mając taki prosty, bazowy model, można eksperymentować dalej z liczbami. Można doliczać lub odliczać kobiety-migrantki (nie zrobiłem tego nawet dla roku 2022, nie potrafię przewidzieć siły i trwałości migracji). Można podnosić współczynniki płodności albo obniżać, by sprawdzić, co się stanie. Można w końcu porównać z danymi realnymi, by ocenić, jak toczą się sprawy. Np. wiedząc o spadku urodzeń w 2022 roku, można podejrzewać, że część z nich to odłożone ciąże, które mogą zrealizować się później, ale można też mieć obawy, że spadek płodności jest trwalszy i zakładany TFR 1.32 z roku 2021 wcale nie jest bardzo pesymistyczny.

Wnioski płynące z prognozy nie są zbyt optymistyczne dla biznesu dziecięcego, jednak można też snuć takie, które sugerują działania: jeśli do Polski będzie płynął strumień młodych kobiet-migrantek, skłonnych do założenia rodzin i zamieszkania, to obie krzywe się podniosą. Można i trzeba próbować przeciwdziałać spadkom, tworząc polityki społeczne wspierające płodność.

Na koniec warto zauważyć, że mając liczby prognozowanych urodzeń, można przeliczyć, ile z tych urodzeń to dziewczynki. Część z nich, dożywszy wieku 20 lat, wejdzie do grupy wiekowej 20-39, co pozwala prognozować jej liczność dalej, poza rok 2040, ale będą to rachunki obarczone dużo wyższym ryzykiem nietrafności, bo przyszłe TFR jest zagadką. Dlatego prognozy ponad 20 lat to już zupełnie inna historia.

Brak komentarzy:

Prześlij komentarz