Elektritarbimise statistiline mudel

Suur rabelemine elektriturul tekitas soovi vaadata, kas elektritarbimist saab ka selgitada statistilise mudeliga ja kuidas selle kirjeldusvõime on muutunud üle aastate. Panin selle siia blogisse üles, et kunagi oleks endal meeles mõnele tudengile selle põhjal uurimistöö välja pakkuda. Uuendan seda jooksvalt.

Andmed

Minu uuritavaks tunnuseks on tunnine elektritarbimine, mille andmed on pärit Eleringi dashboardist.

Et andmetes esinevad mõned anomaaliad varasematel aastatel, siis on alt tsenseeritud 0.0001 protsentiililt (517 MWh). See mõjutab 2016 ja 2017. aasta vaatlusi.

Üks peamine tarbimist selgitav komponent on temperatuur (kasutan hetkel Tallinn-Harku ilmajaama keskmist temperatuuri).

Lisaks kasutan infot (1-0 kujul), kas antud tunniks on päike juba tõusnud või loojunud. Selle allikaks on Ri pakett suncalc. Olgu tähelepanu juhitud, et päikesetõusu ja loojumise kellaaeg on joonisel koordineeritud maailmaaeg ehk UTC, mis on 2 või 3 tundi erinev Eesti kohalikust ajast sõltuvalt kellakeeramisest.

Lisaks temperatuurile ja päikesetõusule kasutan mudeli kellaaega ja seda siis 2D mõõtmes, et saaks panna nii, et 23.59-le järgneks taas 00.00, mis lineaarsel teljel oleksid teineteisest väga kaugel. Selleks teen teisendused, kus aega mõõdame siinus- ja koosinusteisenduste abil.

Seega lähevad mudelisse sisse mõlemad aja koordinaadid, mis võimaldavad tunni mõju paremini arvestada. Analoogselt teeme ka kalendrikuuga, mis tagab, et detsembrikuule (12) järgneks jaanuar (1).

Majandusaktiivsuse muutust võtan hetkel arvesse vaid ühe näitajaga, nimelt töötasu saavate inimeste arv kuu jooksul, tegemist on Maksu- ja Tolliameti kuiste koondandmetega. (2022 juuli väärtust veel ei olnud analüüsi kirjutamise hetkel ja see on võetud võrdseks juuni omaga).

Lisaks on mudelis sees veel info kas tegemist on tööpäevaga või nädalavahetusega, samuti kas on riiklik puhkepäev.

Katsetan ka mudelis elektrihinnaga börsil ning ka suhtelise hinnaga (hind antud tunnis võrreldes ööpäeva keskmise hinnaga), kuid nendega peab olema ettevaatlik, sest elektrihind ise on ökonomeetria mõttes endogeenne: mida suurem on agregeeritud nõudlus, seda suurem ka hind, ning prognoosimise mõttes ei oleks suurt kasu hinnast mudelis.

Metoodika

Kasutan väga lihtsat parameetrite suhtes lineaarset regressioonimudelid, kuid kus selgitavad tunnused on erinevate polünoomidena ja interaktsioonidena, et võtta kinni temperatuuri, tööpäeva, päevavalguse mittelineaarsed mõju. Mudeli puhul ei ole keskendutud praegu prognoosivõimele mistõttu võib olla tegu ka liigse valimisisese kirjeldusvõime tagaajamisega (ülesobitamisega).

Mudelisse on pandud temperatuur neljandat järku polünoomina, interaktsioonid tunni ja tööpäeva/puhkepäeva vahel, interaktsioon tunni ja päikesepaiste vahel, temperatuuri ja tööpäeva/puhkepäeva vahel, temperatuuri ja päikesepaiste vahel ja veel ka mõned kolmekordsed korrutised. Et vaatluste arv on suur (ca 56 tuhat), siis on muidugi kõik mittelinaarsused statistiliselt olulised majandusteadlaste tavapärastel olulisusnivoodel.

Et vaadata mudeli kirjeldusvõimet üle aja, siis on see hinnatud ka muutuva aknaga (akna suurus ligikaudu üks aasta ehk 8928 andmepunkti = 24 tundi x 31 päeva x 12 kuud).

Tulemused

Et mudel sisaldab igasuguseid interaktsioone, siis tavapäraste kordajate esitamine paljuski ei oma mõtet. Allosas on tavapärane tabel enda jaoks küll toodud, et kunagi oleks hea meelde tuletada.

Esimene huvipakkuv koht võiks olla tarbimise hinnatud seos temperatuuriga. Alljärgnev joonis esitab eraldi efekti tööpäeva ja puhkepäeva lõikes. (Kõik tulemused on mudelist 1, kus ei ole sees hinda). Elektritarbimine on kõrgem külmaga, kuid suureneb ka temperatuuri tõustes üle 20 kraadi. Olgu lisatud, et täiendav mittelineaarsus tööpäeva/puhkepäevaga kinnitust ei leidnud, seega tööpäev vaid nihutas kõverat.

Seos tunniga ja tööpäeva/puhkepäevaga on kooskõlas ootustega, mõlemad on kõrgemad päevasel ajal, tööpäeviti on tarbimine suurem, kuid puhkepäevadel on tarbimise tipp hilisem. (Jõnks joonisel 15-16 kellaaja vahel on ilmselt tingitud päikeseloojangu mõjust, aga peab veel kontrollima.)

Päikesepaiste oodatavalt vähendab tarbimist, kui võrrelda samal kellajal toimuvat tarbimist erinevatel aastaaegadel (ühel juhul päike loojas, teisel juhul tõusnud). Suhteliselt on päevavalguse efekt alati suurem puhkepäeviti. Päikesevalguse absoluutne (ja ka suhteline) efekt on väikseim tööpäeva hommikuti, vahemikus kell 5-7 .

Seos kalendrikuuga on ootuspärane – suvekuudel on tarbimine väikseim ja detsembris-jaanuaris suurim.

Hindamaks, kas antud mudel kirjeldab ühtviisi hästi elektritarbimist üle aja on alljärgnevalt hinnatud mudel muutuva aknaga (ligikaudu üks aasta). Alljärgneval joonisel on esitatud mudeli determinatsioonikordaja muutus üle aja. (R2 konkreetses punktis kajastab seega eelneva 12 kuu andmete põhjal hinnatud mudeli kirjeldusvõimet).

On näha, et kirjeldusvõime oli madalam kasutades vaatlusi perioodil 2019-2020, mis ilmselt iseloomustab COVID-perioodi muutusi ning on hakanud kukkuma uuesti alates elektrihinna kiirest tõusust.

Üks võimalik selgitus, miks traditsioonilised tegurid enam nii hästi elektritarbimist ei kirjelda, võib olla kasvav päikesepaneelide arv majapidamistes ja seega tarbimine on vähenenud päikesepaistelistel ilmadel aina enam. Et päikesepaneelide olemasolu kohta majapidamistel hetkel andmeid ei ole, siis kasutame lähendina päikeseenergia elektritootmise andmeid taas Eleringi töölaualt. Eeldus on see, et mida rohkem müüakse päikeseenergiat võrku, seda rohkem toodetakse seda ka enda tarbeks.

Et päikeseenergia elektritootmise tunnise sammuga aegrida on kättesaadav vaid aastast 2020 ja kuni juunini 2022, siis võrdluseks on hinnatud mudel koos ja ilma päikeseenergia tootmisega. Oodatult vähendab suurem päikeseenergia tootmine tarbimist. Kordaja (allolevas tabelis muutuja PEtootmine) on samas üllatuslikult suur, 1MWh suurem päikeseenergia tootmine, vähendab 0.288 MWh tunni võrra tarbimist. Päikeseenergia tootmine ilmselt võtab osaliselt kinni mudelis ka kellaaja ja päikesevalguse tunnuste efekti, mille kordajad oluliselt muutuvad päikeseenergia tootmise mudelisse lisamisel. (Nt tunnus paikepaistab muudab lausa märki).

Päikeseenergia tootmise lisandumine küll suurendab tarbimismudeli täpsust, kuid siiski näitab ka mudel selle tunnusega selget kirjeldusvõime vähenemist 2022. aastal. Seega informatsioon päikeseenergia tootmisvõimaluste kohta ning ka näiteks päikesevalguse hulga kohta (nt pilvisus) võiks aidata täpsemini prognoosida tarbimist viimastel aastatel, kuid midagi on ilmselt veel mudelist puudu.

Käesolev statistiline mudel ei ole küll mõeldud lühiajaliseks prognoosiks (milleks ilmselt SARIMA tüüpi aegrea mudelid oleksid täpsemad), kuid mudeli täpsuse iseloomustamiseks on siiski esitatud jägnevalt prognoosid kaks päeva ette ehk 48 andmepunkti. Ainukesed selgitavad tunnused, mille väärtus oleks vaja ette teada meie mudelis on temperatuur ja hõivatute arv. Temperatuuri puhul saaks põhimõtteliselt kasutada ilmateenistuse mudelipõhist tunnist prognoosi. Hetkel kasutame siiski tegelikku temperatuuri, seega ülehindame mudeli täpsust praktikas. Samuti on jäetud mudelisse tegelik hõivatute arv, sest selle andmed nagunii ei muutuks kahe päeva jooksul. (Prognoosimudelisse ei lisa loomulikult tegelikku hinda ja jätame välja ka päikeseenergia tegeliku tootmise.)

Prognoosi andmisel hinnatakse mudelite parameetrite väärtused eelneva kolme aasta andmete põhjal ja igal südaöösel antakse seejärel prognoos ette 48 tunniks. Alljärgneval joonisel on esitatud iga päev antud 48 tunni prognooside keskmine absoluutne viga ja keskmine absoluutne protsentviga.

Keskmiselt on 48 tundi ette prognoosiviga taolise mudeliga perioodi 2019-2022 kohta ca 50MWh ja keskmine suhteline viga 5.3%. Suhteline viga on sesoonne, sest suviti on absoluutne tarbimise tase madalam, samas kui prognoosivea keskmine suurus üllatuslikult ei ole sesoonne.

Nii absoluutne kui suhteline viga pigem kasvavad ajas, sealjuures suhteline viga just 2022. aastal. Nii nagu ülal leidis kinnitust, et mudeli kirjeldusvõime oluliselt langes 2022. aastal, kui hinnad muutusid volatiilsemaks, nii ka mudeli prognoositäpsus on 2022. aastal langenud.

Mudelit saab edasi arendada mitmel moel. Lihtsaim viis on lisaks sisse tuua dünaamilised SARIMA mudelite elemendid (nt sesoonsete viitaegadega tarbimised, viitajaga prognoosivead jmt). Näiteks viimase (48 tundi tagasi) ja nädalataguse (7×24 tundi varasema) tarbimise teadaoleva tarbimise sissetoomine vähendab MAPE suurust 3.8% peale ning keskmine absoluutne viga väheneb enam kui veerandi võrra 35 MWh peale kogu vaadeldud perioodil.

Siiski kasvavad prognoosivead üle aja, mis näitab, et lihtne mudel temperatuuri, päevavalguse, pühade jm sesoonsete teguritega enam nii hästi ei kirjelda energitarbimist kui varem.

Kui soovida mudelit kasutada agregeeritud tarbimise prognoosimiseks, siis oleks järgmine samm tegeliku temperatuuri asemel kasutada prognoositud väärtusi, vahest kaaluda ka täiendavate ilmaparameetrite sissetoomist. Mudelisse võiks lisada ka keerukama viitaegade dünaamika (sesoonsed tarbimise autoregressiivsed liikmed, vahest ka mõned vealiikmete autoregressiivsed liikmed, mis võtaks arvesse tarbimise asendatuvust üle päevade). Lühem mudeli treeningperiood samuti parandab prognoosimisel täpsust. Näiteks kasutades treeningperioodina kolme aasta asemel kahte aastat väheneb MAPE veel 3.7% peale.

Rubriigid: Uncategorized | Sildid: | Lisa kommentaar

Vanemahüvitis ja isad: kas paranev perede arvutusoskus või isade kasvavad pereväärtused?

Vanemahüvitise saajate andmed näitavad järjekindlalt kasvavat meeste osakaalu saajate hulgas. 2021. aasta juuli lõpu seisuga moodustasid mehed 16% vanemahüvitise saajatest. Iga vanemahüvitise seaduse muudatusele, mis tegi vanemahüvitise ja töötasu samaaegse saamise rahaliselt soodsamaks, on järgnenud hüpe meeste osakaalus.

Isade kasv ongi tulnud eelkõige tänu nendele isadele, kes jätkavad vanemahüvitise saamise kõrval ka töötamist. Ligi kolmveerand isadest (71%) töötas vanemahüvitise saamisega samal ajal. Võrdluseks, emadest, kes saavad vanemahüvitist, töötab vaid iga kümnes (9%).

Et isade vanemahüvitis on ka suurem, sest meestel on keskmiselt kõrgem palk, siis hinnanguliselt läheb kogu vanemahüvitise summast isadele praeguseks pea veerand (23.6% juuli lõpu seisuga). Seega saavad isad aina kasvava osa vanemahüvitise kogusummast ja samal ajal pea kolmveerand neist jätkavad vanemahüvitise saamise kõrvalt ka töötamist.

Seega on vanemahüvitise paindlikumaks muutmine saavutanud oma eesmärgi – vähemalt formaalselt tegelevad isad päeval rohkem lastega ja õhtuti või nädalvahetusel teevad tööd. Muidugi on oht, et isad on päeval tööl, lastega ei tegele, kuid pere saab nii isa vanemahüvitist kui töötasu seetõttu, et see on neile kasulikum võrreldes olukorraga, kui ema saaks vanemahüvitist.

Oleks muidugi hea, kui sotsiaalkindlustusamet avaldaks regulaarselt ka koondstatistikat, mida hakkavad tegema need ema pärast seda, kui isad hakkavad saama vanemahüvitist – kas emad lähevad (osa-ajaga) tööle või jäävad nad mitteaktiivseks.

Samas, lõpuks on võit igal juhul: kas on noored isad aina enam perelembesed või aitab vanemahüvitise seadus vanematel õppida finantstarkust.

Viited:

Rubriigid: Lühianalüüsid, Uncategorized | Lisa kommentaar

Kuidas TAI andmebaasist kergesti andmeid saada? Vol 2

Tegemist on uuendatud versiooniga eelmisest postitusest Kuidas TAIst kergesti andmed Ri saada? seoses sellega, et muutus pakett pxweb ning ka TAI andmebaasi aadress.

Eestis kogub tervise valdkonna statistikat TAI – Tervise Arengu Instituut, kes avaldab seda enda tervisestatistika ja terviseuuringute andmebaasis. Nende andmebaas kasutab programmi PC-Axis, mis on välja töötatud Rootsi Statistikaameti poolt.
Sellele tarkvarale on kirjutatud R-is valmis pakett pxweb (vt info CRANis), mis võimaldavad neid andmeid otse lugeda R-i sisse kas käsuga või pool-interaktiivsel moel.

Installeerime ja aktiveerime paketi pxweb ja teised paketid dplyr ja ggplot2 andmete töötlemiseks ning kuvamiseks.

install.packages("pxweb")
library(pxweb)
library(dplyr)
library(ggplot2)

Paketiga tuleb kaasa fail tekstifail api.json, mis asub paketi kataloogis /pxweb/extdata/api.json. Failis on kirjas asutused, mis teadaolevalt samuti kasutavad tarkvara PC-AXIS ja võimaldavad andmeid alla laadida. Neid saab loetleda funktsiooniga pxweb_api_catalogue(). Vaatame näiteks api kataloogi esimest elementi, mis on Rootsi statistikaametite leht.

pxweb_api_catalogue()[1]
## $api.scb.se
## Api: api.scb.se
##      Statistics Sweden 
##      ('scb')
## Version(s)   : v1 
## Language(s)  : en, sv 
## Limit(s)     : 30 calls per 10 sec.
##                110000  values per call.
## Url template :
##  http://api.scb.se/OV0104/[version]/doris/[lang] 

Selleks, et pakett töötaks täielikult ka TAI andmetega, võiks lisada faili api.json TAI andmete asukoht ja vajalikud parameetrid, kuid seda ei ole tegelikult vaja.

Andmete esmakordseks allalaadimiseks, kui veel süntaksi kuju ei ole tuttav, siis on soovitatav kasutada interaktiivset käsku interactive_pxweb()

d <- pxweb_interactive()

Kui failis api.json ei ol lisatud TAI andmebaasi, siis peaks näitama selle ära funktsioonis.

d <- pxweb_interactive("http://statistika.tai.ee/api/v1/et/Andmebaas/")

See juhendab samm-haaval kuni lõpliku andmepäringuni funktsiooniga pxweb_get. Lõpliku andmepäringu kuju saab seejärel ise kergesti edasi töödelda.

Kui tabeli nimetus ja soovitud tunnuste väärtused on varasemalt teada, siis saab kirjutada andmepäringu otse. Näiteks laeme alla tervishoiutöötajate palgad kõikide aastate, ametialade, teenuse osutaja liigi ja palga liigi lõikes. Ma tean, et see asub TAI andmebaasi alamkataloogis 04THressursid/06THTootajatePalk, tabelis TT06.px.

Teeme valmis listi pxweb_query_list, mis sisaldab meid huvitavate tunnuste väärtusi. Seejärel tõmbame andmed alla pxweb_data objekti ning teeme selle andmetabeliks käsuga as.data.frame. Andmetabel on pikal kujul. Listi saab ette anda ka JSON objektina ning andmed võib välja võtta samuti soovi korral JSON objektina.

pxweb_query_list <-list(
"Aasta"=c("2012","2013","2014","2015","2016","2017","2018","2019"),
"Ametiala"=c("0","1","2","3","4","5","6","7"),
"Tervishoiuteenuse osutaja liik" = c("0","1","2","3","4","5","6","7","8","9","10","11","12","13","14"),
"Brutokuupalga liik" = c("0","1","2","3","4","5","6","7"))
px_data <- pxweb_get(
url = "https://statistika.tai.ee/api/v1/et/Andmebaas/04THressursid/06THTootajatePalk/TT06.px", query = pxweb_query_list) df_long <- as.data.frame(px_data, column.name.type = "text", variable.value.type = "text")

Ülal listis pxweb_query_list võib kasutada ka tärni ‘*‘, mis näitab, et soovime kõiki väärtuseid antud tunnuse puhul. Teine võimalus on kirjutada sinna sisse konkreetne väärtuste loetelu nagu ülal.

Ja ongi andmed alla laetud ja valmis töötlemiseks. Näiteks esitame allalaetud andmete põhjal tervishoiutöötajate mediaanpalkade arengu 2012-2019.

df_long %>% 
filter(`Tervishoiuteenuse osutaja liik` == "Teenuseosutajad kokku",
`Brutokuupalga liik` == "Keskmine kuupalga mediaan (2. kvartiil)") %>%
ggplot(aes(y=`Tervishoiutöötajate brutokuupalk ja kuupalga kvartiilid`, x=Aasta, group=Ametiala, color=Ametiala)) +
geom_point() +
geom_line() +
labs(title = "Mediaanpalga areng", color="", x="", y="Euro", caption ="Allikas: TAI, tabel TT06;
arvutus: ~Documents/kommentaarid/TAIandmed/")

Vahel on andmete allalaadimise maht suurem, kui TAI andmebaas hetkel lubab ja päring annab veateate (vt ka https://github.com/rOpenGov/pxweb/issues/178). Sel juhul tasub proovida andmete alla laadimist osade kaupa.  Näiteks, kui soovida laadida tervishoiukogukulude andmeid jupiti, siis tuleks lisada väärtus parameetrile $config$max_values_to_download

pxweb_query_list <-list("Aasta"=c("2008","2009","2010","2011","2012","2013","2014","2015","2016","2017", "2018", "2019"),
      "Tervishoiuteenus"=c("0","1","2","3","4","5","6","7","8","9","10","11","12","13","14","15", "16","17","18","19","20","21","22","23","24","25","26","27","28","29", "30","31","32","33","34","35","36","37","38","39","40","41","42"),

"Rahastamismudel"=c("0","1","2","3","4","5","6","7","8","9","10","11"))
#andmetabel
url = "https://statistika.tai.ee/api/v1/en/Andmebaas/04THressursid/10Tervishoiukulud/KK01.px" tai_pxweb <- pxweb(url) #lisame täpsustava info, et korraga laeks osa andmeid tai_pxweb$config$max_values_to_download <- 100000 #laadimine px_data <- pxweb_get(tai_pxweb, query = pxweb_query_list)

Allikad:

Mans Magnusson, Leo Lahti and Love Hansson (rOpenGov 2014-2016). pxweb: R tools for PX-WEB API. URL: http://github.com/ropengov/pxweb

Rubriigid: Näpunäide, Uncategorized | Lisa kommentaar

Tervis ja tööjõud – mõned joonised

(Lühem versioon ilmus Arenguseire Keskuse uudiskirjas.)

McKinsey rahvusvahelise instituut avaldas suvel mahuka analüüsi “Prioritizing health: A prescription for prosperity” parema tervise positiivsest mõjust majandusele. Eesti kohta tehtud näitearvutuste põhjal pakkus instituut, et parema tervisega inimeste korral võiks Eesti sisemajanduse koguprodukt olla 20 aasta pärast 11% suurem (link kaardile, kust näeb Eesti andmeid).

Seda lugedes tekkis soov tõsta kokku mõned Eesti andmeid, mis iseloomustavad tervise mõju majandusele.

Parema tervise mõju majandusele avaldub läbi erinevate kanalite:

  1. Parem tervis suurendab tööjõu hulka: inimesed ei sure tööealistena, nad töötavad kõrgema vanuseni ja nad töötavad suurema töökoormusega.
  2. Parema tervisega inimesed on töökohal tootlikumad.
  3. Parema tervisega inimesed saavad omandada parema hariduse, mis avaldab omakorda mõju tootlikkusele.
  4. Parema tervisega inimesed säästavad enam, mis loob vahendid investeerimiseks.

Terved inimesed vajavad ka vähem tervishoiu- ja hoolekandekulusid, olgu tehtud kas leibkonna või riigieelarve vahenditest, mis loob võimaluse kasutada seda raha muudeks tegevusteks.

Viimane laiem Eesti kohta tehtud uuring jääb 2006. aastasse, kui valmis mahukas Praxise, sotsiaalministeeriumi ja Maailma Terviseorganisatsiooni analüüs tervise mõjust Eesti majandusele (link). Uuring näitas, et Eestis on haigestumine oluline tegur töötajate enneaegsel hõivest lahkumisel ning kehval tervisel on ka märkimisväärselt negatiivne mõju töötundidele ja palgale. Teiste riikide kogemuse põhjal pakkus see uuring, et täiskasvanute suremuse vähendamisel 1,5% võrra aastas võiks 25 aasta pärast tulemuseks olla 14% kõrgem SKP inimese kohta.

Hilisemaid üksikuid uuringuid Eesti kohta on veel mitmeid, nt halva tervise mõju kohta tööturult eemalejäämisele (Sõrmus (2014), Karilaid-Vidder (2015)) või haiguspäevadele (Aaviksoo 2017).

Alljärgnevalt ongi toodud mõned joonised, mis iseloomustavad, kui suur osa Eesti tööjõu potetnsiaalist jääb kasutamata kehva tervise tõttu.

1. Enneaegne suremus

Esimene kanal, kuidas tervis mõjutab töötajate arvu on inimeste enneaegne suremus. Näiteks on Eesti meeste suremustõenäosused vanusevahemikus 30-70 enam kui kaks korda suuremad kui Rootsi meestel. Erinevused naistel suremustõenäosustes ei ole nii suured, jäädes enamasti alla kahe korra.

See tähendab, et kui säiliks 2018. aasta suremuskordajad, siis 2018. aastal sündinud 7345 poisslapsest elaks 65 aasta vanuseks vaid kolmveerand (5579). Kui aga Eesti noored mehed elaksid tervislikumalt ja meil oleks Rootsi meeste suremuskordajad, siis elaks pensionieani lausa tuhat poissi rohkem (6606). Kokku elaks üks põlvkond mehi oma parimas tööeas (vanuses 20-65) enam ligi 11 tuhat inimaastat rohkem (3,6%).

2. Haiguse tõttu tööturult eemal olek

Statistikaameti andmetel on Eestis aastas keskmiselt 40 tuhat tööealist inimest, kes ei tööta kehva tervise tõttu. Neile lisandub veel 20 tuhat juba pensionieas inimest, kes parema tervise puhul samuti töötaks. Seega ideaalse tervise puhul võiks lisanduda ligi 60 tuhat praegu tööturult väljas olevat inimest tööturule. See moodustab ligi 9% praegu tööturul hõivatud inimestest ning oleks oluline panus majanduskasvu.

Kui võtta võrdluseks taas näiteks Rootsi või Soome, siis näeme, et vanusrühmas 50-64 on meil 3-4% enam inimesi, kes on haiguse või vigastuse tõttu mitteaktiivsed. Kui saavutaksime näiteks selles vanusrühmas kasvõi Soome või Rootsi taseme, siis oleks tööturul rohkem umbes 1000 inimest.

3. Väiksem töölt puudumine ja töötunnid

Haigekassa statistika järgi maksti 2018. aastal haigushüvitist 3,8 miljoni päeva eest. Arvestades juurde hüvitamata päevad, siis puudusid inimesed töölt haiguse tõttu suurusjärgus 2-3% tööpäevadest.

Praxise 2006. aasta uuring leidis, et halva terviseseisundiga inimestel olid nädala töötunnid meestel keskmiselt 12 tunni võrra väiksemad ja naistel 8 tunni võrra väiksemad võrreldes hea terviseseisundiga inimestega.

4. Produktiivsus

Haigestumine mõjutab mitte ainult püsivalt tööjõust lahkumist või ka suremust, vaid ka produktiivsust töökohal. Ühest küljest võib produktiivsust otseselt suurendada paranenud füüsilise ja vaimse aktiivsuse kaudu. Teisalt võivad füüsiliselt ja vaimselt aktiivsemad isikud paremini ja efektiivsemalt kasutada tehnikat, masinaid ja seadmeid. Produktiivsust mõõdetakse tavaliselt inimese palgaga. Ülalmainitud Eesti 2006. aasta uuring, kasutades küll juba 2003. aasta andmeid leidis, et halb tervis (võrreldes hea tervisega) vähendas inimeste kuusissetulekuid oluliselt – meeste puhul peaaegu 30% ja naiste puhul umbes 20% keskmisest palgast.

Ri fail joonistega

Rubriigid: Lühianalüüsid, Uncategorized | Lisa kommentaar

Eesti Panga finantsstatistika allasikutamine R-iga

Eesti Pank avaldab enda kodulehel finantsstatistikat, kuid kahjuks mitte väga mugavas formaadis, et seda automaatselt Ri laadida ja siis analüüsida.

Siiski, kui sama tabelit kasutada sageli, saab ühekordse käsitööga ülejäänud protsessi automatiseerida.

Näiteks soovime vaadata majapidamiste hoiuste muutust, mis asuvad tabelis 1.1 Krediidiasutuste ja liisinguettevõtete analüütilised näitajad (miljon eurot). Tabeli esmakordsel käsitsi allalaadimisel (olgu Exceli või CSV failina) saame alla laetud faili lingist teada raporti id (Reports?id), alguskuupäeva (date1), lõpukuupäeva (date2), keele (lng=et), allalaetavad väärtused, nt väärtus, muutus või aastane muutus. (fa=,VAARTUS,MUUT,MUUT_AA). Neid saab siis juba ise hiljem automaatses päringus muuta Ris.

R-is saame kasutada käsku GET paketist httr, et andmefail alla laadida koos kõigi atribuutidega. Andmete kättesaamiseks peame eraldama sisu (käsuga content) ning seejärel saame teksti muuta andmetabeliks käsuga read.delim.


library(httr)
temp <- GET("https://statistika.eestipank.ee/Reports?id=868&format=csv&date1=2004-01-1&date2=2020-07-31&lng=et&fa=,VAARTUS")
sisu <- content(temp, "text")
dfalg <- read.delim(textConnection(sisu), 
                    header=TRUE, sep=";", 
                    strip.white=TRUE, 
                    blank.lines.skip = TRUE, skip = 4)

Et andmetabel sisaldab ka päist, siis sisse lugemata jäetud rida arv võib olla eri tabelitel erinev. Antud tabelis on esimesed 4 rida pealkirjade ja muu info päralt (skip = 4).

Sellega on andmefail olemas. Et tabel on laial kujul, siis on perioodid veergudes ning tunnuste nimed esimeses veerus. Iga konkreetne tabel võib olla kahjuks natuke erineva struktuuriga.

Meie näitetabelist saame võtta välja meid huvitavad tunnused (ridades) ja pöörata tabel ümber pikale kujule, teha kuupäeva ning teha muutuja väärtused numbriliseks. Näiteks võtan 4. ja 12. reast majapidamiste laenud ja hoiused ning teen joonise.


library(dplyr)
library(tidyr)
library(ggplot2)

df <- dfalg[c(4,12),] #hoian 4 ja 12 rea, laenud ja hoiused 
colnames(df)[1] <- "tunnus" #esimese veeru nimeks tunnus
df$tunnus[1] <- "Laenud" #nimetan ümber
df$tunnus[2] <- "Hoiused" #nimetan ümber
df <-df %  gather(key = "kpv", value = "vaartus", -tunnus) #viin pikale kujule
df <-df % 
  mutate(kpv = as.Date(gsub("X", "", kpv),"%d.%m.%Y"), #kuupäeva tegemine
         vaartus = as.numeric(gsub(",", ".", gsub(" ", "", vaartus))), #väärtusest tühik välja ja koma punktiks
         vaartus12 = (vaartus-dplyr::lag(vaartus, 12))/dplyr::lag(vaartus, 12)*100)  %>%  #aastane juurdekasv protsentides
  filter(!is.na(kpv)) #kui faili lõppu jäi mõni rida, siis viskame välja

#Joonise tegemine
#Pisut puhtamad teemad veebi jaoks
source("http://kodu.ut.ee/~avork/files/Rkoode/Rggplotwebiteemad.R")

ggplot(df %>%  dplyr::filter(kpv>=as.Date("2012-01-01")), aes(x = kpv, y = vaartus12, color = tunnus)) +
  geom_line() +  
  scale_y_continuous(labels = function(x) paste0(x, "%")) + 
  labs(x="", y = "Aastane muutus", color = "", title = "Majapidamiste hoiuste ja laenude aastane juurdekasv")  +
  theme_web_classic()

ggsave(filename = "joonis1naideEPfin.jpg", width = 8, height = 6)

Ja tulemusena näeme, et praeguse kriisi ajal kiirenes majapidamiste hoiuste kasv ning aeglustus majapidamistele antud laenude kasv.

Palju käsitööd, kuid kui uuel kuul tulevad uued andmed, siis piisab päringus muuta kuupäeva ja ongi uuendatud joonis olemas. (Eeldusel, et andmete muu struktuur ja vorm püsib muutumatuna.)

Tänusõnad Märten Veskimäele abi eest.

Ri fail http://kodu.ut.ee/~avork/files/Rkoode/saastmine_blogisse.R

Rubriigid: Näpunäide, Uncategorized | Lisa kommentaar

Vanemahüvitise paindlikkus ja isad

Vanemahüvitis on Eesti perepoliitika üks kulukamaid meetmeid. 2019. aastal kulus sellele 262 miljonit eurot. Võrdluseks, et kõikidele teistele peretoetustele (lapsetoetus esimesele, teisele ja kolmandale lapsele, üksikvanema toetus, paljulapseliste perede toetus jm) kulus kokku 303 miljonit eurot.

Vanemahüvitist võib saada ka siis, kui lapsevanem töötab. Alates vanemahüvitise kehtestamisest on neid reegleid muudetud korduvalt ja seda vanemaid soosivamaks. Lapsevanem võib samal ajal teenida ka töötasu. Alljärgnev joonis iseloomustab arvutusreegleid, mis kehtisid erinevatel perioodidel. Pikemalt olen selgitatud seadustes sätestatud valemeid eraldi dokumendis.

Mida hilisem reform, seda rohkem jäi vanemahüvitist alles samal ajal töötamise korral. Näiteks kui 2005. aastal määrati 700-eurone vanemahüvitis ja siis saadi lisaks 2000 eurot brutopalka, jäi lõplikuks vanemahüvitise brutosummaks vaid 250 eurot. 2019. aastal aga jäi sama esialgse vanemahüvitise ja brutopalga korral vanemahüvitise lõplikuks summaks juba enam kui kaks korda rohkem ehk 530 eurot. Ning alates teatud palgast vanemahüvitist enam edasi ei vähendatud alla poole esialgse.

Taoline töötamise ja vanemahüvitise koos saamise võimaldamine on toonud kaasa ka selle, et aina rohkem on hakanud mehed, kes on ka kõrgema eelneva palga ja seega vanemahüvitisega, samaaegselt saama nii vanemahüvitist kui ka töötasu. See võimaldab perel saada suuremat vanemahüvitist, kuid jätkata isal ka töötamist. (Tõsi, ema peab mingil moel saama endale ravikindlustuse, sest lapsehoolduspuhkusel saab olla vaid üks vanem).

On näha, et alates 2018. aasta märtsist, kui kõrgema palga saamist enam ei karistatud nii palju, on järsult kasvanud isade arv, kes saavad vanemahüvitist, ulatudes 2020. aasta juuniks 14%ni vanemahüvitise saajatest. Enamus isadest samal ajal ka töötavad. Ka kevadine majanduskriis ei ole töötamisele mõju avaldanud.

Töötavate isade osakaal vanemahüvitise saajate seas on kasvanud 48%lt 2015. aasta alguses, 71%ni 2020. aasta juunis. Kui varasemalt oli töötavate isade seas pooled need, kes said palka alla alampalga ehk tegid pigem mingeid juhutöid, mis kodus lapsega olemise kõrvalt võisidki võimalikud olla, siis praeguseks saavad peaaaegu kõik töötavad ja vanemahüvitist samaaegselt saavad isad palka üle alammäära.

See kõik võib olla kooskõlas seaduse oodatava mõjuga – emad on päeval tööl, isad tegelevad samal ajal lastega ning kui lapsed lõpuks õhtul magavad, siis kirjutavad isad arvutis Javat ja teenivad kõrget palka juurde. Aga võib olla ka vastupidi, et isad on päeval tööl, lastega ei tegele, kuid pere saab nii isa vanemahüvitist kui töötasu seetõttu, et see on neile kasulikum võrreldes olukorraga, kui ema saaks vanemahüvitist.

Selleks, et neid kahte võimalikku selgitust eristada, oleks vaja, kui sotsiaalkindlustusamet avaldaks ka regulaarselt koondstatistikat, mida hakkavad tegema need ema pärast seda, kui isad hakkavad saama vanemahüvitist – kas emad lähevad (osa-ajaga) tööle või jäävad nad mitteaktiivseks.

Lõpuks ei ole ju midagi selles halba, kui vanemad oskavad hästi matemaatikat ja kasutades seaduse valemeid maksimeerivad leibkonna kogutulu. Iseasi, kas nappide sotsiaalvaldkonna vahendite puhul on siiski tegemist kõige tõhusama meetmega, kuidas suurendada isade rolli laste kasvatamises.

Viited:

Rubriigid: Lühianalüüsid, Uncategorized | Lisa kommentaar

Töötus, koroona ja Google Trends

Viimast kriisi iseloomustab andmete esitamissageduse kiirus. Uusi koroonajuhte loetakse igapäevaselt. Töötukassa hakkas aprillist avaldama töötuse statistikat igapäevaselt. Statistikaamet avaldab töötamise registri põhjal töösuhete muutuse nädala kaupa ning ettevõtluse kuist kiirstatistikat tuginedes maksudeklaratsioonidele.

Inimeste käitumise analüüsimiseks ja majanduse prognoosimiseks on üks täiendav võimalus vaadata juurde Eesti internetiotsingute märksõnade sagedust Google Trendsi abil.

Järgmisel joonisel on esitatud märksõna “töötukassa” nädalane otsingusagedus (suhtelisel skaalal) ja võrreldud seda töötute arvu muutusega alates 2018. aasta algusest.

Eriolukorra kehtestamise järgselt, 12. märtsil, kasvas märksõna “töötukassa” otsing praktiliselt momentaalselt. Tegelik töötute arvu kasv järgnes mõne nädala pärast. Praeguseks on langenud nii töötukassa otsingusagedus kui ka tegelik töötuse juurdekasv.

Sarnaselt saab vaadata märksõnade “covid” ja “koroona” arengut. Otsing nende kohta kasvas järsult nädal nädal enne eriolukorra kehtestamist, püsis mõnda aega ja seejärel langes. Viimasel paaril nädalal on taas näha tõusutrendi.

Google Trends märksõnade sagedusi on kasutatud paljudes majanduse prognoosimudelites, olgu siis töötuse, inflatsiooni või aktsiahindade prognoosimisel. Google Scholar üle tuhande teadusartikli sellel teemal. Samuti on erinevaid märksõnu kasutada ka Covid viiruse leviku prognoosimisel.

Jääb oodata, et järgmisel õppeaastal on mitmeid tudengeid, kes katsetavad, kas kriisi algust, sügavust ja lõppu aitaksid täpsemalt prognoosida inimeste internetiotsingud.

R-i fail andmete ja jooniste kohta.

Rubriigid: Lühianalüüsid, Uncategorized | Lisa kommentaar

Ametirühmade keskmised palgad maksuameti andmete põhjal

Eesti Maksu- ja Tolliamet publitseeris ametikohtade keskmised töötasud, et ettevõtted ja inimesed saaksid oma palku nendega võrrelda. Hetkel on kättesaadavad andmed alates 2019. aasta juulist.

Näiteks olen toonud TOP 20 ametialad (ametikohtade klassifikaatori neljanda taseme järgi). Sinna kuuluvad vaid juhtide ja tippspetsialistide pearühma kuuluvad ametialad.

Nagu oodata on, siis nende järgi tasub noortel õppida meditsiini, infotehnoloogiat või õigusteadust. Või võtta eesmärk saada tippjuhiks või kõrgeks valitsusametnikuks.

Andmete põhjal saab kergesti analüüsida ka ametirühmade keskmiste palkade vahelist hajuvust või konkreetsete ametirühmade vahelist palkade erinevust. Üle pikema perioodi vaadates võiks iseloomustada võimalikke struktuurseid muutusi tööturul.

Alljärgneval joonisel on esitatud 291 ametirühma keskmiste palkade jaotuse üle kuude kõik koos ja seejärel pearühmade kaupa. Periood on veel muidugi liiga lühike, et mingeid trende näha.

Pearühmade kaupa samu jaotusi üle kuude vaadates võib täheldada hinnatud jaotusfunktsioonide muutusi, kuid ametirühmasid enamustes pearühmades väga vähe (joonisel toodud number sulgudes iga pearühma taga). Seetõttu tasub vaadata vaid suuremaid pearühmasid, nt tippspetsialistid.

Viimaks võib püüda hinnata nende andmete põhjal ka käesoleva koroonakriisi mõju. Järgnevalt on esitatud ametirühmade keskmiste palkade muutused aprill-juuni 2020 vs juuni 2019-märts 2020, ehk siis erinevus pärast kriisi võrreldes kriisieelse ajaga.

Ametialade keskmiste palkade langemist on kõigis pearühmades. Kõige enam on palgalangusega ametialasid oskus- ja käsitööliste seas (pooltes ametirühmades palk keskmine langes). Kõige vähem on palgalangusega ametialasid tippspetsialistide seas (vaid iga kuuendas ametirühmas langes palk).

Kindlasti tuleb andmete tõlgendamisel hoolikalt lugeda EMTA metoodikakirjeldust. Andmed sisaldavad vaid töölepingulise suhtega inimeste palkasid. Tööajaerinevusi arvesse ei võeta. Seega ei ole need andmed otseselt võrreldavad Statistikaameti arvutatud keskmiste palkadega. Andmete juures ei ole antud inimeste arvu neis rühmades, mistõttu gruppid ei ole ka võrreldavad suuruse lõikes.

Allikad:

Rubriigid: Lühianalüüsid, Uncategorized | Lisa kommentaar

Töötasu hüvitise olulisusest koroonakriisi ajal

Töötukassa poolt makstud töötasu hüvitise kogukulu moodustas 26. juuli seisuga 256 miljonit eurot, mis on ligi 1% selle aasta prognoositavast sisemajanduse koguproduktist. Võrdluseks võib tuua, et eelmise kriisi ajal, 2009. aastal, moodustasid kõik töötuskindlustuse kulud hüvitistele 1,14% SKPst. Seega on töötasu hüvitise kulud märkimisväärsed, sest sel aastal lisanduvad veel ka kulud tavapärastele töötuskindlustushüvitistele.

Hindamaks töötasu hüvitise olulisust tegevusvaldkondade lõikes võrdleme töötasu hüvitise brutokulu kokku märtsi, aprilli ja mai kuu eest samadel kuudel TSD deklaratsioonidel deklareeritud töölepinguga töötavate brutosummaga.

Kui vaadata töötasu hüvitiste kogukulu tegevusvaldkondade lõikes, siis on oodatult esimeste seas toitlustamise, majutuse, meelelahutusega ja reisimisega seotud tegevusalad, kus töötasu hüvitis moodustas kolmandikust kuni pooleni nende tegevusalade töötasust.

Tööstuse valdkonnast on suurimad töötasu hüvitise kasutajad tekstiilitootmine, trükindus, mööblitootmine ja nahatöötlemine.

Järgmisel joonisel on esitatud seos töötasu hüvitise osakaalu ja aastase käibe languse (märts-mai 2020 võrreldes aasta taguse perioodiga) vahel.

Oodatult on töötasu hüvitise osakaal palgas seda suurem, mida suurem on tegevusala käibe langus.

Kõige suurem käibelangus tabas EMTAKi järgi reisibüroode tegevust (EMTAK 79), majutust (EMTAK 55), muuseumid ja raamatukogud (EMTAK 91) ning loome- ja kunsti ning meelelahutusvaldkonnas (EMTAK 90).

Kui eeldada, et käibe langus peaks olema peamine töötasu hüvitise põhjus, siis võinuks oodata isegi suuremat töötasu hüvitise osakaalu näiteks tegevusalades “91 Raamatukogude, arhiivide, muuseumide ja muude kultuuriasutuste tegevus” ja “59 Kinofilmide, videote ja telesaadete tootmine; helisalvestiste ja muusika kirjastamine”. (EMTAK 19, kus oli ka suur käibe langus, kuid väga vähe töötasu hüvitise saajaid on “Koksi ja puhastatud naftatoodete tootmine”.)

Töötasu hüvitise mõte on hoida majanduskriisi ajal inimesi ettevõtetega seotud, makstes kinni suure osa nende töötasust. Selle eelduseks on see, et kriis on lühiajaline ning ei ole ette näha suuri muutusi tööturu struktuuris peale kriisi. Kriis lõppedes, oleks ettevõtetel lihtne taastada endine tootmismaht.

Kui kriis on aga pikaajaline ja sellega kaasneksid ka muutused tööturul (nt osade ametikohtade kadumine ja teiste tekkimine), siis võib olla otstarbekam maksta pigem kõrgemat töötuskindlustushüvitist ja motiveerida inimesi uusi ameteid vastu võtma.

Teise poolaasta andmete põhjal võiks juba vaadata, kuidas on muutunud hõive nendes tegevusalades, kus oli suur töötasu hüvitise osakaal. Kui vaatamata sellele, et maksti kõrget töötasu hüvitist, neis sektorites ikkagi hiljem hõive kukub oluliselt, siis võib tagantjärgi tarkusena analüüsida, kas ei oleks olnud otstarbekam kohe soodustada inimeste ümberõpet.

Tehnilise märkusena peab lisama, et andmed on kokku pandud mitte ettevõtete vaid tegevusvaldkondade tasandil eri allikatest (Töötukassa ja EMTA). Seetõttu ei pruugi olla tagatud, et samad ettevõtted on klassifitseeritud mõlema asutuse poolt sama EMTAK 2 alla.

Allikad:

Rubriigid: Lühianalüüsid, Uncategorized | Lisa kommentaar

Kui sünnitataks alati keskmiselt

Tuues põhjenduseks tervishoiuteenuste pakkumise kulu-efektiivsemaks ja kvaliteetsemaks muutmise, plaanitakse sulgeda 2018. aastal Põlva ja Valga sünnitusosakonnad. Sünnitajad on teretulnud Tartu ülikooli kliinikumi. Meedias kõlanud TÜ kliinikumi juhtide arvamuste järgi on kliinikumis ruumi piisava varuga, et pakkuda kvaliteetset teenust ja vastata sünnitajate ootustele.

Et meedias on käsitletud keskmisi näitajaid, siis sooviksin alljärgnevas lühianalüüsis rõhutada teist aspekti – sünnituste varieeruvust. Nimelt peab sünnituste arvu igapäevasel prognoosimisel ja nende jaoks ressursside planeerimisel ühe haigla piires arvestama, et tegemist on üsna volatiilse näitajaga. Alljärgneval joonisel on toodud sünnituste päevane aegrida kliinikumis jaanuar 2017-aprill 2018 koos libiseva keskmisega (must joon) ja mulle teadaolevalt avatud sünnitustubade arvuga (punane joon).

synnidaegrida

Ülaltoodud jooniselt on selgelt näha, et üksnes keskmiste sünnituste arvu võrdlemine kliinikumi sünnitustubade või perepalatite arvuga ei iseloomusta kogu pilti. Nii näiteks on vaadeldud perioodi keskmine sünnituste arv päevas 6,7, mis tõesti on väiksem kui avatud sünnitustubade arv kaheksa. Samas on veerandil päevadest sünnituste arv 8 või enam ning igal kümnendal päeval on sünnituste arv 10 või enam. (Lisaks esineb veel täiendav varieeruvus tulenevalt sellest, kui kaua üks sünnitaja sünnitustoas on, kuid nii detailseid andmeid kahjuks ei ole avalikult olemas.)

Sünnituste arvu ühes haiglas iseloomustatakse tavaliselt Poissoni jaotusega. (Vt varasemate taoliste analüüside kohta nt Gam et al. A model for the distribution of daily number of births in obstetric clinics based on a descriptive retrospective study. BMJ Open 2013;3: e002920. doi:10.1136/bmjopen-2013-002920.)

Poissoni jaotus tähendab seda, et sünnitajate keskmine arv on seotud ka hajuvusega. Kui sünnitusi tuleb juurde, siis kasvab ka nende varieeruvus. Ka TÜ kliinikumi andmete puhul on sündide arvu dispersioon 7.3 (standardhälve 2.7), mis on ligikaudu võrdne keskmise sünnitajate arvuga, nii nagu nagu Poissoni jaotusele kohane.

synnidhistogram

Kui oleksin kliinikumi sünnitusosakonna juhataja, siis minule tekitaks Põlva ja Valga haigla sünnitajate lisandumine kahetisi tundeid. Töökoormuse keskmine kasv tähendab keskmiselt suuremat personali vajadust ja seega suuremat eelarvet. Samas kasvab ka sündide varieeruvus, mis tekitab suurema korratuse igapäevatöös. Kasvab päevade arv, kui kõik sünnitustoad on täis, kui perepalateid ei jagu ning ämmaemandad jooksevad mitme sünnitustoa ja operatsiooniblokis tehtavate keisrite vahet.

Näiteks, kui liita 2017. aasta TÜ kliinikumi, Valga ja Põlva haiglate sünnituste arvud, siis kasvaks keskmine sünnituste arv ise vaid 0,8 sünnituse võrra ehk 7,5 sünnituseni päevas. Samas kasvab dispersioon 9,2ni. See toob kaasa selle, et kui kõik Valga ja Põlva haigla sünnitused oleksid Tartus, siis oleks igal neljandal päeval sünnituste arv 10 või enam ning igal kümnendal päeval 12 või enam. Seega ehkki keskmiselt on kõik korras ja sünnituste arv on keskmiselt endiselt väiksem kui sünnitustubade arv, siis kasvab risk, et sünnitajaid on enam kui normaalne töökorraldus võimaldaks.

Sünnituste keskmine arv erineb ka päevade lõikes, kuid iga päeva sees on jaotus taas Poissoni jaotuse lähedane. Nädalavahetuseti on sünnitajate keskmine arv väiksem. (Seda seletab ilmselt plaaniliste keisrite toimumine argitpäeviti.)

synnidhistogrampaevad

Alljärgnevalt on simuleeritud veel sünnitanud naiste sünnitusjärgne viibimine TÜ kliinikumis kui kõik Valga ja Põlva sünnitajad oleksid tulnud TÜ kliinikumi 2017. aastal.
Tervisearenguinstituudi statistika kohaselt Tabel RV301 oli keskmine ravikestus sünnitusabis 2016. aastal 2,8 päeva. Eeldame, et tavasünnitaja on haiglas koos sünnituspäevaga kokku 2, 3 või 4 päeva vastavalt tõenäosustega 50%, 40% ja 10%. Samad tõenäosused keisriga sünnitaja puhul oleksid vastavalt 10%, 20% ja 70%. Kui keisersünnituste osakaal on viiendik, siis saadud osakaalud annavadki keskmiseks voodipäevade arvuks täpselt 2,8.

Simulatsioonitulemused näitavad, et naiste simuleeritud arv, kes on haiglas, ületab 2,5 protsendil juhtudest voodite arvu 30 (13 perepalatit + 16 kohta kahekohalistes palatites + 1 koht ühekohalistes palatites). Eeldatavasti on see puhver, mida saab päevasisese planeerimisega kergesti korraldada, või on see lihtsalt simulatsiooniviga. Kui aga liita siia juurde kõik Valga ja Põlva haigla sünnitajad, siis ulatub naiste simuleeritud arv, kes vooditesse ära ei mahu 8 protsendini. See viitab sellele, et kliinikul on vaja planeerida endale voodi- ja inimreservi võrreldes praeguse olukorraga kui soovida, et kõik sünnitajad kliinikumis end mugavalt tunneks ka tulevikus.

simuleeritudnaistearv

Simuleeritud naiste arv haiglas päevade kaupa (mediaan, ülemine ja alumine kvartiil) on esitatud järgmisel joonisel. Kui sünnitamine oleks planeeritav, siis annaks soovituse noortele, et ajalooliste andmete põhjal on kõige rahulikum sünnitada pühapäeval ja lahkuda kolmapäeva varahommikul.

simuleeritudsynnitajad

Kokkuvõtteks sooviks rohkem näha, et taoliste otsuse puhul ei piirdutaks analüüsis vaid paari keskmise arvuga, vaid näidataks (eeldatavasti on kliinikul analüüs tehtud), kuidas mõjutab Põlva ja Valga sulgemine ka kliinikumi ressursside planeerimist tulenevalt kasvavast variatsioonist.

Kui Põlva ja Valga sulgemise puhul tuuakse põhiargumendina madalast sünnituse koguarvust tulenevat võimaliku ohtu teenuse kvaliteedile, siis ei tohiks jätta näitamata, kuidas mõjutab inimeste heaolu ka see, kui sünnitaja satub Tartusse päeval, kui seal on juba ees 15 sünnitajat.

Lõpumärkus. Autoril puudub seos Põlva, Valga või TÜ kliinikumi sünnitusosakonnaga. Kõik kolm last on sündinud TÜ kliinikumis. Antud lühianalüüsi ajend oli loeng loenduvatest andmetest (count data)  ja Poissoni jaotusest majandustudengitele. Kui keegi soovib analüüsi reprodutseerida, siis andmed on all joonistel. Jõudu!

syndidealgandmed20.pngAllikas: mitmed tublid ajakirjanikud, kes fotod ja videod on on-line väljaannetesse pannud

Rubriigid: Lühianalüüsid, Uncategorized | 2 kommentaari