diff --git a/2022/charts.html b/2022/charts.html index a958e8f..60b3c6a 100644 --- a/2022/charts.html +++ b/2022/charts.html @@ -9,10 +9,10 @@ -
+
2022-10-10T09:33:03.617715image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/2022-10-17T12:39:19.050500image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
2022-10-10T09:33:03.817353image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
2022-10-17T12:39:19.302448image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
2022-10-10T09:33:03.972510image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
2022-10-17T12:39:19.491446image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.

Missing values

2022-10-10T09:32:57.872693image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.

Missing values

2022-10-17T12:39:11.521983image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
A simple visualization of nullity by column.
2022-10-10T09:32:58.284023image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
A simple visualization of nullity by column.
2022-10-17T12:39:12.015650image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2022-10-10T09:32:58.648420image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2022-10-17T12:39:12.643194image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.
2022-10-10T09:32:59.167145image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.
2022-10-17T12:39:13.199761image/svg+xmlMatplotlib v3.5.3, https://matplotlib.org/
The dendrogram allows you to more fully correlate variable completion, revealing trends deeper than the pairwise ones visible in the correlation heatmap.

Sample

First rows

TimestampOletko palkansaaja vai laskuttaja?IkäSukupuoliTyökokemusMontako vuotta olet tehnyt laskuttavaa työtä alalla?PalvelutTuntilaskutus (ALV 0%, euroina)Vuosilaskutus (ALV 0%, euroina)Hankitko asiakkaasi itse suoraan vai käytätkö välitysfirmojen palveluita?Mistä asiakkaat ovat?TyöpaikkaKaupunkiMillaisessa yrityksessä työskenteletTyöaikaRooliEtäKuukausipalkkaVuositulotVapaa kuvaus kokonaiskompensaatiomallistaKilpailukykyinenVapaa sanaIdeoita ensi vuoden kyselyynKk-tulot
02022-09-26 16:35:50.002Palkansaaja33mies12.0NaNNaNNaNNaNNaNNaN-PK-SeutuKonsulttitalossa1.0Teknologiajohtaja50/506500.081250.0NaNTrueNaNNaN6770.833333
12022-09-26 16:37:21.049Palkansaaja33mies16.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuTuotetalossa, jonka core-bisnes on softa1.0OhjelmistokehittäjäEtä9000.0117000.0NaNTrueNaNNaN9750.000000
22022-09-26 16:38:47.396Palkansaaja33mies16.0NaNNaNNaNNaNNaNNaNNaNTurkuTuotetalossa, jonka core-bisnes on softa1.0Full-stack-ohjelmistokehittäjä50/505000.062500.0NaNFalseNaNNaN5208.333333
32022-09-26 16:39:47.534Palkansaaja38mies13.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0Devaaja50/505100.063750.0NaNFalseNaNNaN5312.500000
42022-09-26 16:41:09.685Laskuttaja28mies6.01.0Data-analytiikka, Arkkitehtuuri, Data Engineering,90.0160000.0Käytän välitysfirmojaSuomestaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
52022-09-26 16:43:39.266Laskuttaja28mies6.010.0Fullstack80.0100000.0ItseSuomesta, UlkomailtaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNLykkyä tykö vapaakenttien normalisointiin!Tämä oli mukavan lyhyt ja ytimekäsNaN
62022-09-26 16:44:27.744Palkansaaja38mies12.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0Full-stackEtä7500.090000.0NaNTrueNaNNaN7500.000000
72022-09-26 16:44:49.112Palkansaaja33mies12.0NaNNaNNaNNaNNaNNaNNaNVaasaTuotetalossa, jonka core-bisnes on softa1.0Ohjelmistokehittäjä full-stack, laitteistokehitys, tekoäly/koneoppiminenEtä3700.048000.0Kuukausipalkka + vaihtelevan kokoinen joulubonusTrueNaNNaN4000.000000
82022-09-26 16:45:12.422Palkansaaja33mies4.0NaNNaNNaNNaNNaNNaNVismaTampereKonsulttitalossa1.0Full-stackEtä4600.057500.0NaNTrueNaNNaN4791.666667
92022-09-26 16:45:44.793Palkansaaja38mies14.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuYrityksessä, jossa softa on tukeva toiminto (esim pankit, terveysala, yms)1.0NaN50/504300.055000.0NaNFalseNaNNaN4583.333333

Last rows

TimestampOletko palkansaaja vai laskuttaja?IkäSukupuoliTyökokemusMontako vuotta olet tehnyt laskuttavaa työtä alalla?PalvelutTuntilaskutus (ALV 0%, euroina)Vuosilaskutus (ALV 0%, euroina)Hankitko asiakkaasi itse suoraan vai käytätkö välitysfirmojen palveluita?Mistä asiakkaat ovat?TyöpaikkaKaupunkiMillaisessa yrityksessä työskenteletTyöaikaRooliEtäKuukausipalkkaVuositulotVapaa kuvaus kokonaiskompensaatiomallistaKilpailukykyinenVapaa sanaIdeoita ensi vuoden kyselyynKk-tulot
6742022-10-09 18:56:30.713Palkansaaja38mies20.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0Web-analyytikkoEtä7300.090000.0NaNFalseNaNNaN7500.000000
6752022-10-09 19:31:27.704Laskuttaja28mies4.01.0Full stack86.0125000.0Käytän välitysfirmojaSuomestaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
6762022-10-09 20:54:49.686Palkansaaja33nainen0.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuTuotetalossa, jonka core-bisnes on softa1.0Junior frontend devEtä3750.047000.0Palkkamalliin kuului osakkeita n. 17t € arvosta, vestautumisaika 4 vuotta, kertyvät asteittain.TrueNaNTyökokemusvuosien vaihtoehdoissa voisi olla kokonaislukujen sijaan mahdollista valita myös esim. "alle vuosi". Mun relevantti kokemus alalta on puoli vuotta, joten en haluais millään vastata "nolla vuotta" 😄3916.666667
6772022-10-09 21:34:52.664Palkansaaja33mies6.0NaNNaNNaNNaNNaNNaNNaNLappeenrantaKonsulttitalossa0.8NaN50/504200.052500.0NaNNaNNaNNaN4375.000000
6782022-10-09 22:07:02.512Palkansaaja33NaN5.0NaNNaNNaNNaNNaNNaNNaNTampereTuotetalossa, jonka core-bisnes on softa1.0Team leader50/505100.063750.0NaNFalseNaNNaN5312.500000
6792022-10-09 22:29:23.021Palkansaaja33mies6.0NaNNaNNaNNaNNaNNaNNaNPK-SeutuKonsulttitalossa1.0OhjelmistokehittäjäToimisto4730.061000.0Kiinteä kuukausipalkka + vuosibonus yrityksen tuloksen mukaanFalseNaNNaN5083.333333
6802022-10-10 06:26:34.080Laskuttaja33mies12.0NaNNaN170.0NaNItseSuomesta, UlkomailtaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
6812022-10-10 06:52:45.143Palkansaaja28mies2.0NaNNaNNaNNaNNaNNaNHelsingin KaupunkiPK-SeutuJulkinen tai kolmas sektori1.0Backend, devops, projektipäällikköToimisto2300.028750.0NaNFalseNaNNaN2395.833333
6822022-10-10 07:46:57.646Palkansaaja33NaN7.0NaNNaNNaNNaNNaNNaNFraktioPK-SeutuKonsulttitalossa1.0Suunnittelija50/504900.061250.0NaNTrueNaNNaN5104.166667
6832022-10-10 07:49:49.204Laskuttaja23mies7.04.0Backend, systems120.0135000.0ItseUlkomailtaNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaNNaN