diff --git a/2022/charts.html b/2022/charts.html index b3e3dbd..3c80473 100644 --- a/2022/charts.html +++ b/2022/charts.html @@ -3,16 +3,25 @@ Koodiklinikan Palkkakysely - + + -
+
-
2022-10-19T09:13:38.897243image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Correlations

2023-09-24T12:36:02.342993image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
2022-10-19T09:13:39.063131image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
2022-10-19T09:13:39.220767image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.

Missing values

2022-10-19T09:13:32.728380image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
TyökokemusMontako vuotta olet tehnyt laskuttavaa työtä alalla?Tuntilaskutus (ALV 0%, euroina)Vuosilaskutus (ALV 0%, euroina)TyöaikaKuukausipalkkaVuositulotKk-tulotOletko palkansaaja vai laskuttaja?IkäSukupuoliHankitko asiakkaasi itse suoraan vai käytätkö välitysfirmojen palveluita?Mistä asiakkaat ovat?KaupunkiMillaisessa yrityksessä työskenteletEtä- vai lähityöKilpailukykyinenEtä
Työkokemus1.0000.3530.1840.045-0.0090.5900.5670.5670.0960.4910.2370.0000.2800.1220.0000.0000.1750.000
Montako vuotta olet tehnyt laskuttavaa työtä alalla?0.3531.0000.041-0.024NaNNaNNaNNaN1.0000.0000.2130.0000.1320.0000.0000.0000.0000.000
Tuntilaskutus (ALV 0%, euroina)0.1840.0411.0000.623NaNNaNNaNNaN1.0000.1770.5930.1130.3450.0000.0000.0000.0000.000
Vuosilaskutus (ALV 0%, euroina)0.045-0.0240.6231.000NaNNaNNaNNaN1.0000.0000.3470.0000.1520.0000.0000.0000.0000.000
Työaika-0.009NaNNaNNaN1.0000.1620.1050.1051.0000.1080.2080.0000.0000.0000.4450.0000.0170.080
Kuukausipalkka0.590NaNNaNNaN0.1621.0000.9250.9251.0000.1150.1460.0000.0000.6010.0000.0000.3060.080
Vuositulot0.567NaNNaNNaN0.1050.9251.0001.0001.0000.1210.1160.0000.0000.6590.0000.0000.2880.091
Kk-tulot0.567NaNNaNNaN0.1050.9251.0001.0001.0000.1210.1160.0000.0000.6590.0000.0000.2880.091
Oletko palkansaaja vai laskuttaja?0.0961.0001.0001.0001.0001.0001.0001.0001.0000.0000.1081.0001.0001.0001.0001.0001.0001.000
Ikä0.4910.0000.1770.0000.1080.1150.1210.1210.0001.0000.1140.2010.3810.1520.0730.0000.0650.056
Sukupuoli0.2370.2130.5930.3470.2080.1460.1160.1160.1080.1141.0000.0000.2150.0000.2160.2180.0760.077
Hankitko asiakkaasi itse suoraan vai käytätkö välitysfirmojen palveluita?0.0000.0000.1130.0000.0000.0000.0000.0001.0000.2010.0001.0000.3570.0000.0000.0000.0000.000
Mistä asiakkaat ovat?0.2800.1320.3450.1520.0000.0000.0000.0001.0000.3810.2150.3571.0000.0000.0000.0000.0000.000
Kaupunki0.1220.0000.0000.0000.0000.6010.6590.6591.0000.1520.0000.0000.0001.0000.0000.2260.0350.000
Millaisessa yrityksessä työskentelet0.0000.0000.0000.0000.4450.0000.0000.0001.0000.0730.2160.0000.0000.0001.0000.2830.0990.093
Etä- vai lähityö0.0000.0000.0000.0000.0000.0000.0000.0001.0000.0000.2180.0000.0000.2260.2831.0000.0001.000
Kilpailukykyinen0.1750.0000.0000.0000.0170.3060.2880.2881.0000.0650.0760.0000.0000.0350.0990.0001.0000.000
Etä0.0000.0000.0000.0000.0800.0800.0910.0911.0000.0560.0770.0000.0000.0000.0931.0000.0001.000

Missing values

2023-09-24T12:35:52.205388image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2022-10-19T09:13:33.359013image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
A simple visualization of nullity by column.
2023-09-24T12:35:52.594681image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2022-10-19T09:13:33.846294image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-09-24T12:35:52.994588image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.
2022-10-19T09:13:34.290800image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
The dendrogram allows you to more fully correlate variable completion, revealing trends deeper than the pairwise ones visible in the correlation heatmap.

Sample

First rows

TimestampOletko palkansaaja vai laskuttaja?IkäSukupuoliTyökokemusMontako vuotta olet tehnyt laskuttavaa työtä alalla?PalvelutTuntilaskutus (ALV 0%, euroina)Vuosilaskutus (ALV 0%, euroina)Hankitko asiakkaasi itse suoraan vai käytätkö välitysfirmojen palveluita?Mistä asiakkaat ovat?TyöpaikkaKaupunkiMillaisessa yrityksessä työskenteletTyöaikaRooliEtä- vai lähityöKuukausipalkkaVuositulotVapaa kuvaus kokonaiskompensaatiomallistaKilpailukykyinenVapaa sanaIdeoita ensi vuoden kyselyynEtäKk-tulot
02022-09-26 16:35:50.002Palkansaaja33mies12.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0TeknologiajohtajaJotain siltä väliltä6500.081250.0NaNTrueNaNNaN50/506770.833333
12022-09-26 16:37:21.049Palkansaaja33mies16.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuTuotetalossa, jonka core-bisnes on softa1.0OhjelmistokehittäjäPääosin tai kokonaan etätyö9000.0117000.0NaNTrueNaNNaNEtä9750.000000
22022-09-26 16:38:47.396Palkansaaja33mies16.0NaNNaNNaNNaNNaNNaNNaNTurkuTuotetalossa, jonka core-bisnes on softa1.0Full-stack-ohjelmistokehittäjäJotain siltä väliltä5000.062500.0NaNFalseNaNNaN50/505208.333333
32022-09-26 16:39:47.534Palkansaaja38mies13.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0DevaajaJotain siltä väliltä5100.063750.0NaNFalseNaNNaN50/505312.500000
42022-09-26 16:41:09.685Laskuttaja28mies6.01.0Data-analytiikka, Arkkitehtuuri, Data Engineering,90.0160000.0Käytän välitysfirmojaSuomestaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
52022-09-26 16:43:39.266Laskuttaja28mies6.010.0Fullstack80.0100000.0ItseSuomesta, UlkomailtaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNLykkyä tykö vapaakenttien normalisointiin!Tämä oli mukavan lyhyt ja ytimekäsNaNNaN
62022-09-26 16:44:27.744Palkansaaja38mies12.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0Full-stackPääosin tai kokonaan etätyö7500.090000.0NaNTrueNaNNaNEtä7500.000000
72022-09-26 16:44:49.112Palkansaaja33mies12.0NaNNaNNaNNaNNaNNaNNaNVaasaTuotetalossa, jonka core-bisnes on softa1.0Ohjelmistokehittäjä full-stack, laitteistokehitys, tekoäly/koneoppiminenPääosin tai kokonaan etätyö3700.048000.0Kuukausipalkka + vaihtelevan kokoinen joulubonusTrueNaNNaNEtä4000.000000
82022-09-26 16:45:12.422Palkansaaja33mies4.0NaNNaNNaNNaNNaNNaNVismaTampereKonsulttitalossa1.0Full-stackPääosin tai kokonaan etätyö4600.057500.0NaNTrueNaNNaNEtä4791.666667
92022-09-26 16:45:44.793Palkansaaja38mies14.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuYrityksessä, jossa softa on tukeva toiminto (esim pankit, terveysala, yms)1.0NaNJotain siltä väliltä4300.055000.0NaNFalseNaNNaN50/504583.333333

Last rows

TimestampOletko palkansaaja vai laskuttaja?IkäSukupuoliTyökokemusMontako vuotta olet tehnyt laskuttavaa työtä alalla?PalvelutTuntilaskutus (ALV 0%, euroina)Vuosilaskutus (ALV 0%, euroina)Hankitko asiakkaasi itse suoraan vai käytätkö välitysfirmojen palveluita?Mistä asiakkaat ovat?TyöpaikkaKaupunkiMillaisessa yrityksessä työskenteletTyöaikaRooliEtä- vai lähityöKuukausipalkkaVuositulotVapaa kuvaus kokonaiskompensaatiomallistaKilpailukykyinenVapaa sanaIdeoita ensi vuoden kyselyynEtäKk-tulot
6742022-10-09 18:56:30.713Palkansaaja38mies20.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0Web-analyytikkoPääosin tai kokonaan etätyö7300.090000.0NaNFalseNaNNaNEtä7500.000000
6752022-10-09 19:31:27.704Laskuttaja28mies4.01.0Full stack86.0125000.0Käytän välitysfirmojaSuomestaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
6762022-10-09 20:54:49.686Palkansaaja33nainen0.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuTuotetalossa, jonka core-bisnes on softa1.0Junior frontend devPääosin tai kokonaan etätyö3750.047000.0Palkkamalliin kuului osakkeita n. 17t € arvosta, vestautumisaika 4 vuotta, kertyvät asteittain.TrueNaNTyökokemusvuosien vaihtoehdoissa voisi olla kokonaislukujen sijaan mahdollista valita myös esim. "alle vuosi". Mun relevantti kokemus alalta on puoli vuotta, joten en haluais millään vastata "nolla vuotta" 😄Etä3916.666667
6772022-10-09 21:34:52.664Palkansaaja33mies6.0NaNNaNNaNNaNNaNNaNNaNLappeenrantaKonsulttitalossa0.8NaNJotain siltä väliltä4200.052500.0NaNNaNNaNNaN50/504375.000000
6782022-10-09 22:07:02.512Palkansaaja33NaN5.0NaNNaNNaNNaNNaNNaNNaNTampereTuotetalossa, jonka core-bisnes on softa1.0Team leaderJotain siltä väliltä5100.0NaNNaNFalseNaNNaN50/50NaN
6792022-10-09 22:29:23.021Palkansaaja33mies6.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0OhjelmistokehittäjäPääosin tai kokonaan toimistolla4730.061000.0Kiinteä kuukausipalkka + vuosibonus yrityksen tuloksen mukaanFalseNaNNaNToimisto5083.333333
6802022-10-10 06:26:34.080Laskuttaja33mies12.0NaNNaN170.0NaNItseSuomesta, UlkomailtaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
6812022-10-10 06:52:45.143Palkansaaja28mies2.0NaNNaNNaNNaNNaNNaNHelsingin KaupunkiPK-SeutuJulkinen tai kolmas sektori1.0Backend, devops, projektipäällikköPääosin tai kokonaan toimistolla2300.028750.0NaNFalseNaNNaNToimisto2395.833333
6822022-10-10 07:46:57.646Palkansaaja33NaN7.0NaNNaNNaNNaNNaNNaNFraktioPK-SeutuKonsulttitalossa1.0SuunnittelijaJotain siltä väliltä4900.061250.0NaNTrueNaNNaN50/505104.166667
6832022-10-10 07:49:49.204Laskuttaja23mies7.04.0Backend, systems120.0135000.0ItseUlkomailtaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
\ No newline at end of file diff --git a/2022/raw.xlsx b/2022/raw.xlsx index bfd9ef3..bcf5207 100644 Binary files a/2022/raw.xlsx and b/2022/raw.xlsx differ