diff --git a/pulkka/data_ingest.py b/pulkka/data_ingest.py index 7b45a64..7694bc5 100644 --- a/pulkka/data_ingest.py +++ b/pulkka/data_ingest.py @@ -30,20 +30,20 @@ ETATYO_MAP = { } COMPANY_MAP = { - 'Siili Solutions': 'Siili', - 'Mavericks Software': 'Mavericks', + "Siili Solutions": "Siili", + "Mavericks Software": "Mavericks", } -FULL_STACK_ROLE = 'Full-stack' +FULL_STACK_ROLE = "Full-stack" ROLE_MAP = { - 'Full-stack developer': FULL_STACK_ROLE, - 'Full-stack kehittäjä': FULL_STACK_ROLE, - 'Full-stack ohjelmistokehittäjä': FULL_STACK_ROLE, - 'Full-stack-kehittäjä': FULL_STACK_ROLE, - 'Fullstack': FULL_STACK_ROLE, - 'Ohjelmistokehittäjä (full-stack)': FULL_STACK_ROLE, - 'Ohjelmistokehittäjä, full-stack': FULL_STACK_ROLE, + "Full-stack developer": FULL_STACK_ROLE, + "Full-stack kehittäjä": FULL_STACK_ROLE, + "Full-stack ohjelmistokehittäjä": FULL_STACK_ROLE, + "Full-stack-kehittäjä": FULL_STACK_ROLE, + "Fullstack": FULL_STACK_ROLE, + "Ohjelmistokehittäjä (full-stack)": FULL_STACK_ROLE, + "Ohjelmistokehittäjä, full-stack": FULL_STACK_ROLE, } @@ -132,8 +132,8 @@ def read_data() -> pd.DataFrame: df["Vuositulot"] = df.apply(map_vuositulot, axis=1) # Fudge some known outliers - df.loc[df.Vuositulot == 912500, 'Vuositulot'] = 91250 - df.loc[df.Kuukausipalkka == 87000, 'Kuukausipalkka'] = 7250 + df.loc[df.Vuositulot == 912500, "Vuositulot"] = 91250 + df.loc[df.Kuukausipalkka == 87000, "Kuukausipalkka"] = 7250 # Synthesize kk-tulot from Vuositulot df["Kk-tulot"] = pd.to_numeric(df["Vuositulot"], errors="coerce") / 12 diff --git a/pulkka/generate_charts.py b/pulkka/generate_charts.py index 08a0cc7..5e4168d 100644 --- a/pulkka/generate_charts.py +++ b/pulkka/generate_charts.py @@ -49,7 +49,9 @@ def plot_sukupuoli_vuositulot(df: DataFrame): @plot_this def plot_kaupunki_vuositulot(df: DataFrame): - plot = get_categorical_stats_plot(df, category="Kaupunki", value="Vuositulot", line=False) + plot = get_categorical_stats_plot( + df, category="Kaupunki", value="Vuositulot", line=False + ) plot.xaxis.major_label_orientation = "vertical" return plot