diff --git a/Makefile b/Makefile index b70d5eb..cc4f64c 100644 --- a/Makefile +++ b/Makefile @@ -1,10 +1,21 @@ -.PHONY: data/results.xlsx data/results.tsv +DATA_DIR := data/2021 +OUT_DIR := out +XLSX_URL := https://docs.google.com/spreadsheets/d/1l-Zgf1HqaFGd8gRA8kQzaxJ3R7eJy29ORUS8pr5o0nk/export?format=xlsx +TSV_URL := https://docs.google.com/spreadsheets/d/1l-Zgf1HqaFGd8gRA8kQzaxJ3R7eJy29ORUS8pr5o0nk/export?format=tsv -out: all-data copy-raw-data copy-massaged-data static charts profiling +export DATA_DIR +export OUT_DIR -copy-raw-data: all-data - cp data/results.xlsx out/raw.xlsx - cp data/results.tsv out/raw.tsv +.PHONY: $(DATA_DIR)/results.xlsx $(DATA_DIR)/results.tsv + +all: all-data copy-raw-data copy-massaged-data static charts profiling + +$(OUT_DIR): + mkdir -p $(OUT_DIR) + +copy-raw-data: all-data $(OUT_DIR) + cp $(DATA_DIR)/results.xlsx $(OUT_DIR)/raw.xlsx + cp $(DATA_DIR)/results.tsv $(OUT_DIR)/raw.tsv copy-massaged-data: all-data python -m pulkka.copy_massaged_data @@ -18,10 +29,13 @@ charts: all-data profiling: all-data python -m pulkka.generate_profiling -all-data: data/results.xlsx data/results.tsv +all-data: $(DATA_DIR)/results.xlsx $(DATA_DIR)/results.tsv -data/results.xlsx: - curl -fsSL -o $@ "https://docs.google.com/spreadsheets/d/1l-Zgf1HqaFGd8gRA8kQzaxJ3R7eJy29ORUS8pr5o0nk/export?format=xlsx" +$(DATA_DIR): + mkdir -p $(DATA_DIR) -data/results.tsv: - curl -fsSL -o $@ "https://docs.google.com/spreadsheets/d/1l-Zgf1HqaFGd8gRA8kQzaxJ3R7eJy29ORUS8pr5o0nk/export?format=tsv" +$(DATA_DIR)/results.xlsx: $(DATA_DIR) + curl -fsSL -o $@ $(XLSX_URL) + +$(DATA_DIR)/results.tsv: $(DATA_DIR) + curl -fsSL -o $@ $(TSV_URL) diff --git a/data/results.tsv b/data/2021/results.tsv similarity index 98% rename from data/results.tsv rename to data/2021/results.tsv index dfb2a5b..02c12f8 100644 --- a/data/results.tsv +++ b/data/2021/results.tsv @@ -492,4 +492,11 @@ Timestamp Missä kaupungissa työpaikkasi pääasiallinen toimisto sijaitsee? Ik 2/25/2021 14:10:33 Tampere 21-25 v naisoletettu 1 Työntekijä / palkollinen 50% Systems Administrator ja firmän sisäinen 1st line -tukihessu Pääosin tai kokonaan toimistolla 1081 14000 Kyllä Kk-palkkani on varsinkin vaihteleva, koska riippuu vuorolisistä (mahdollisista pyhä- ja yövuoroista ja tuurauksista). Jonkinlaisen oletuksen nyt yritin lyödä vuositulolle, mutta taitaa jäädä todellisuudessa hivenen sen alle. 2/25/2021 21:17:36 PK-Seutu (Helsinki, Espoo, Vantaa) 31-35 v Mies 10 Työntekijä / palkollinen 100% Full-stack ohjemistokehittäjä Pääosin tai kokonaan toimistolla 4600 58000 Kyllä 2/26/2021 9:33:00 Oulu 46-50 v Mies 21 Työntekijä / palkollinen 100% Backend-koodari Pääosin tai kokonaan etätyö 5000 70000 Kyllä Nokia -2/26/2021 12:16:20 Tampere 36-40 v Mies 15 Työntekijä / palkollinen 100% Ohjelmistosuunnittelija Pääosin tai kokonaan toimistolla 4300 53750 Ei Gofore \ No newline at end of file +2/26/2021 12:16:20 Tampere 36-40 v Mies 15 Työntekijä / palkollinen 100% Ohjelmistosuunnittelija Pääosin tai kokonaan toimistolla 4300 53750 Ei Gofore +2/26/2021 12:21:52 Tampere 31-35 v Mies 11 Freelancer 100% frontend Pääosin tai kokonaan etätyö 157300 Kyllä +2/26/2021 12:46:37 PK-Seutu (Helsinki, Espoo, Vantaa) 31-35 v M 11 Työntekijä / palkollinen 100% Arkkitehti Pääosin tai kokonaan toimistolla 6500 81250 Kyllä Siili +2/26/2021 12:47:26 PK-Seutu (Helsinki, Espoo, Vantaa) 31-35 v Nainen 3 Työntekijä / palkollinen 100% Full-stack Noin 50/50 hybridimalli 3800 - Ei +2/26/2021 13:24:36 PK-Seutu (Helsinki, Espoo, Vantaa) 31-35 v Mies Työntekijä / palkollinen 100% Ohjelmistokehittäjä Noin 50/50 hybridimalli 75000 Kyllä Vincit +2/26/2021 16:28:30 Tampere 41-45 v Mies 20 Työntekijä / palkollinen 100% full-stack Pääosin tai kokonaan toimistolla 4800 61000 Kyllä +2/27/2021 12:38:01 Tampere 31-35 v Mies 9 Työntekijä / palkollinen 100% backend ja devops Pääosin tai kokonaan etätyö 4270 54000 Ei +2/27/2021 17:49:25 Kouvola 31-35 v Mies 2 Työntekijä / palkollinen 100% Full-stack Ohjelmistosuunnittelija Pääosin tai kokonaan etätyö 2800 Ei \ No newline at end of file diff --git a/data/2021/results.xlsx b/data/2021/results.xlsx new file mode 100644 index 0000000..e1e9954 Binary files /dev/null and b/data/2021/results.xlsx differ diff --git a/data/results.xlsx b/data/results.xlsx deleted file mode 100644 index 0005e3f..0000000 Binary files a/data/results.xlsx and /dev/null differ