Simulation

Author

SEOYEON CHOI

Published

April 5, 2023

Simulation Study

Import

데이터 함쳐놓기

import pandas as pd

_a = pd.read_csv('./simulation_results/a.csv')
_b = pd.read_csv('./simulation_results/b.csv')
_c = pd.read_csv('./simulation_results/STGCN_ITSTGCN_random_epoch200.csv')

_df = pd.concat([_a,_b,_c],axis=0)

_df

_df.to_csv('./simulation_results/STGCN_ITSTGCN_random_epoch200_2.csv',index=False)

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

Fivenodes

random

lags = 2
- GNAR 문서에 나온 대로 AR(2) 모형

mrate = 0.8, filter = 12, epoch = 150
mrate = 0.3, filter = 8, epoch = 50

interpolation = linear 또는 cubic, nearest 는 mse 너무 우리 방법에서 안 좋다.

block

random

df1 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_random_epoch50.csv')
df2 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_random_epoch100.csv')
df3 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_random_epoch150.csv')
df4 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_random_epoch200.csv')

df_gnar = pd.read_csv('./simulation_results/fivenodes/fivenodes_GNAR_random.csv')

data = pd.concat([df1,df2,df3,df4,df_gnar],axis=0)

data.query("method!='GNAR' and inter_method=='linear' and lags==2").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='epoch',facet_row='nof_filters',height=1200)

시뮬 예정(평균 시간, 평균mse)

0.7,0.75,0.8,0.85

12,16

150

# 1. mrate = 0.8, filter = 12, epoch = 150
data.query("mrate==0.8 and inter_method=='linear' and nof_filters==12 and epoch==150 and lags==2")['calculation_time'].mean(),data.query("mrate==0.8 and inter_method=='linear' and nof_filters==12 and epoch==150 and lags==2")['mse'].mean()

(109.59549897114435, 1.2304790377616883)

data.query("mrate==0.8 and inter_method=='linear' and nof_filters==12 and epoch==150 and lags==2").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='epoch',facet_row='nof_filters',height=400)

block

df1 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_block_node1_epoch50.csv')
df2 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_block_node1_epoch100.csv')
df3 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_block_node1_epoch150.csv')
df4 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_block_node1_epoch200.csv')
df5 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_block_node2_epoch50.csv')
df6 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_block_node2_epoch100.csv')
df7 = pd.read_csv('./simulation_results/fivenodes/fivenodes_STGCN_ITSTGCN_block_node2_epoch150.csv')
df8 = pd.read_csv('./simulation_results/fivenodes/fivenodes_GNAR_block_node1.csv')
df9 = pd.read_csv('./simulation_results/fivenodes/fivenodes_GNAR_block_node2.csv')

df1['block']=1
df2['block']=1
df3['block']=1
df4['block']=1
df5['block']=2
df6['block']=2
df7['block']=2
df8['block']=1
df9['block']=2

data2 = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9],axis=0)

data2.query("method=='GNAR' and block == 1")['mse'].mean(),data2.query("method=='GNAR' and block == 2")['mse'].mean()

(1.455923080444336, 1.5004450678825378)

data2.query("method=='GNAR' and inter_method == 'linear'")['mse'].mean(),data2.query("method=='GNAR' and inter_method == 'nearest'")['mse'].mean() # 차이 없음

(1.4813642161233085, 1.4813642161233085)

data2.query("epoch==50")['calculation_time'].mean(),data2.query("epoch==50")['calculation_time'].max()

(39.11611335332747, 56.8712797164917)

data2.query("epoch==150")['calculation_time'].mean(),data2.query("epoch==150")['calculation_time'].max()

(102.26520284502594, 152.8869686126709)

data2.query("method!='GNAR' and lags == 2 and inter_method=='nearest'").plot.box(backend='plotly',x='block',color='method',y='mse',facet_col='epoch',facet_row='nof_filters',height=800)

data2.query("inter_method=='linear' and epoch==150").plot.box(backend='plotly',x='block',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)

시뮬 예정(평균 시간, 평균mse)

block 1,2 위 세팅 그대로

랜덤ㅁ 말고 block만

# 1. block = 2 interpolation = linear, filter = 12, epoch = 150
data2.query("block==1 and inter_method=='linear' and nof_filters==12 and epoch==50 and lags==2")['calculation_time'].mean(),data2.query("block==2 and inter_method=='linear' and nof_filters==12 and epoch==50 and lags==2")['mse'].mean()

(40.18422634204229, 1.2096982955932618)

data2.query("block==1 and inter_method=='linear' and nof_filters==12 and epoch==50 and lags==2").plot.box(backend='plotly',x='block',color='method',y='mse',facet_col='epoch',facet_row='nof_filters',height=400)

fivenodes simulation result

mindex= [[],[],[],list(range(50,150)),[]] # block 1
mindex= [list(range(10,100)),[],list(range(50,80)),[],[]] # node 2 30% mmissing

block 조건

df1 = pd.read_csv('./simulation_results/2023-04-09_23-37-17.csv') # GNAR random
df2 = pd.read_csv('./simulation_results/2023-04-10_07-06-32.csv') # STGCN, ITSTGCN random 70%, 75%
df3 = pd.read_csv('./simulation_results/2023-04-10_14-54-51.csv') # STGCN, ITSTGCN random 80%, 85%
df4 = pd.read_csv('./simulation_results/2023-04-10_15-54-03.csv') # GNAR block 1
df5 = pd.read_csv('./simulation_results/2023-04-10_15-56-27.csv') # GNAR block 2
df6 = pd.read_csv('./simulation_results/2023-04-10_23-44-52.csv') # STGCN, ITSTGCN block 1
df7 = pd.read_csv('./simulation_results/2023-04-11_04-40-00.csv') # STGCN, ITSTGCN block 2
df8 = pd.read_csv('./simulation_results/2023-04-14_21-21-34.csv') # S/TGCN, ITSTGCN missing 0

data = pd.concat([df1,df2, df3, df4,df5,df6,df7,df8],axis=0);data

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	five_nodes	GNAR	0.70	rand	2	NaN	linear	NaN	1.406830	0.022885
1	five_nodes	GNAR	0.75	rand	2	NaN	linear	NaN	1.406830	0.005927
2	five_nodes	GNAR	0.80	rand	2	NaN	linear	NaN	1.406830	0.005557
3	five_nodes	GNAR	0.85	rand	2	NaN	linear	NaN	1.406830	0.010217
4	five_nodes	GNAR	0.70	rand	2	NaN	linear	NaN	1.406830	0.006891
...	...	...	...	...	...	...	...	...	...	...
235	fivenodes	STGCN	0.00	NaN	2	16.0	NaN	150.0	1.162979	117.819705
236	fivenodes	IT-STGCN	0.00	NaN	2	12.0	NaN	150.0	1.156077	122.355274
237	fivenodes	IT-STGCN	0.00	NaN	2	12.0	NaN	150.0	1.162236	122.169977
238	fivenodes	IT-STGCN	0.00	NaN	2	16.0	NaN	150.0	1.145952	123.042743
239	fivenodes	IT-STGCN	0.00	NaN	2	16.0	NaN	150.0	1.158429	124.601893

1212 rows × 10 columns

data.to_csv('./simulation_results/Real_simulation/fivedones_Simulation.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/fivedones_Simulation.csv')

data.query("method=='GNAR' and mtype == 'rand'")['mse'].mean(),data.query("method=='GNAR' and mtype != 'rand'")['mse'].mean()

(1.4068299531936646, 1.4068299531936646)

data.query("method=='STGCN' and mtype == 'rand'")['mse'].mean(),data.query("method=='STGCN' and mtype != 'rand'")['mse'].mean()

(1.256219128270944, 3.429857851266861)

data.query("method=='IT-STGCN' and mtype == 'rand'")['mse'].mean(),data.query("method=='IT-STGCN' and mtype != 'rand'")['mse'].mean()

(1.223042539258798, 2.4890875375270842)

Baseline

data.query("method!='GNAR' and mrate==0").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='nof_filters',height=600)

data.query("method!='GNAR' and mtype =='rand' and (mrate==0.7 or mrate==0.75)").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='nof_filters',facet_row='inter_method',height=600)

data.query("method!='GNAR' and mtype =='rand'  and (mrate==0.8 or mrate==0.85)").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='nof_filters',facet_row='inter_method',height=600)

data.query("method!='GNAR' and mtype =='block' and inter_method=='linear' ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='nof_filters',facet_row='inter_method',height=600)

fivenodes DCRNN result

df1 = pd.read_csv('./simulation_results/2023-05-14_19-10-37.csv')
# df2 = pd.read_csv('./simulation_results/2023-04-27_22-09-07.csv')
# df3 = pd.read_csv('./simulation_results/2023-04-28_14-40-59.csv')

data = pd.concat([df1],axis=0)

data

	dataset	RecurrentGCN	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	fivenodes	DCRNN	STGCN	0.0	NaN	2	16	NaN	150	1.250153	53.528735
1	fivenodes	DCRNN	STGCN	0.0	NaN	2	16	NaN	150	1.250808	53.318063
2	fivenodes	DCRNN	STGCN	0.3	rand	2	16	linear	150	1.230589	67.311241
3	fivenodes	DCRNN	STGCN	0.3	rand	2	16	cubic	150	1.338743	90.998801
4	fivenodes	DCRNN	STGCN	0.8	rand	2	16	linear	150	1.324748	70.249104
...	...	...	...	...	...	...	...	...	...	...	...
355	fivenodes	DCRNN	IT-STGCN	0.0	NaN	2	16	NaN	150	1.239359	80.108648
356	fivenodes	DCRNN	IT-STGCN	0.3	rand	2	16	linear	150	1.235393	75.364310
357	fivenodes	DCRNN	IT-STGCN	0.3	rand	2	16	cubic	150	1.258768	75.310456
358	fivenodes	DCRNN	IT-STGCN	0.8	rand	2	16	linear	150	1.250187	75.406565
359	fivenodes	DCRNN	IT-STGCN	0.8	rand	2	16	cubic	150	1.396425	75.428746

360 rows × 11 columns

data.to_csv('./simulation_results/DCRNN/fivenodes_DVRNN.csv',index=False)

data = pd.read_csv('./simulation_results/DCRNN/fivenodes_DVRNN.csv')

chickenpox

random

공식 패키지: lags 4 지정
mrate = 0.3
- 결측값 비율 크니까 오차 많이 커지는 경향 있어서
nof_filters = 4
- 차이 없어서
lags = 4, 8
- 클 수록 작아지는 경향 있어서
GNAR보다 MSE는 낮음
cal_time
- mean = 10
- max = 21
block 은 임의로 한 노드만 해 본 결과임

data = pd.read_csv('./simulation_results/chickenpox_random.csv').sort_values(by='lags')

data.query("method!='GNAR'")['calculation_time'].mean(),data.query("method!='GNAR'")['calculation_time'].max(),data.query("method!='GNAR'")['calculation_time'].min()

(10.42619569649299, 21.886654376983643, 7.567165851593018)

data.query("method!='GNAR' and inter_method=='cubic' and mrate==0.3").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)

data.query("method=='GNAR' and inter_method=='linear'").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',height=600)

시뮬 예정(평균 시간, 평균mse)

epoch = 50

mrate = 0.3~0.5

filter 32 공식예제로 가기 하고 샆으면 3개 정도 추가로

# 1. mrate = 0.3, filter = 4, epoch = 50, lags = 4
data.query("method !='GNAR' and mrate==0.3 and inter_method=='cubic' and nof_filters==4 and lags==2")['calculation_time'].mean(),data.query("method != 'GNAR' and mrate==0.3 and inter_method=='cubic' and nof_filters==4 and lags==2")['mse'].mean()

(10.115000387032827, 1.0320488701264063)

data.query("method !='GNAR' and mrate==0.3 and inter_method=='cubic' and nof_filters==4 and lags==2").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=400)

block

data = pd.read_csv('./simulation_results/chickenpox_block.csv')

data.query("method != 'GNAR' and lags!=4 and lags!=6 and inter_method !='linear'").plot.box(backend='plotly',x='nof_filters',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=600)

data.query("method=='GNAR'").plot.box(backend='plotly',x='mrate',color='inter_method',y='mse',facet_col='lags',height=600)

시뮬 예정(평균 시간, 평균mse)

block, rand 다

공식예제 수 따라

epoch 50

나중에 시간 남으면 100

data.query("inter_method=='cubic' and nof_filters==4 and lags==8").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=400)

chickenpox simulation result

my_list = [[] for _ in range(20)] #chickenpox
another_list = list(range(100,400))
my_list[1] = another_list
my_list[3] = another_list
my_list[5] = another_list
my_list[7] = another_list
my_list[9] = another_list
my_list[11] = another_list
my_list[13] = another_list
my_list[15] = another_list
mindex = my_list

block 30% missing을 위한 조건

df1 = pd.read_csv('./simulation_results/2023-04-11_06-56-35.csv') # GNAR random
df2 = pd.read_csv('./simulation_results/2023-04-11_07-01-42.csv') # GNAR block
df3 = pd.read_csv('./simulation_results/2023-04-11_18-20-22.csv') # STGCN, ITSTGCN random 30%
df4 = pd.read_csv('./simulation_results/2023-04-12_05-44-19.csv') # STGCN, ITSTGCN random 40%
df5 = pd.read_csv('./simulation_results/2023-04-12_17-03-28.csv') # STGCN, ITSTGCN random 50%
df6 = pd.read_csv('./simulation_results/2023-04-13_18-59-17.csv') # STGCN, ITSTGCN block cubic
df7 = pd.read_csv('./simulation_results/2023-04-14_00-57-11.csv') # STGCN, ITSTGCN block linear
df8 = pd.read_csv('./simulation_results/2023-04-14_12-55-58.csv') # STGCN, ITSTGCN 0% missing
df9 = pd.read_csv('./simulation_results/2023-05-08_01-09-23.csv')
df10 = pd.read_csv('./simulation_results/2023-05-08_05-47-08.csv')

data = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9,df10],axis=0);data

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	chickenpox	GNAR	0.3	rand	4	NaN	linear	NaN	1.427494	0.070639
1	chickenpox	GNAR	0.3	rand	4	NaN	cubic	NaN	1.427494	0.072070
2	chickenpox	GNAR	0.4	rand	4	NaN	linear	NaN	1.427494	0.087900
3	chickenpox	GNAR	0.4	rand	4	NaN	cubic	NaN	1.427494	0.094206
4	chickenpox	GNAR	0.5	rand	4	NaN	linear	NaN	1.427494	0.096730
...	...	...	...	...	...	...	...	...	...	...
115	chickenpox	GNAR	0.9	rand	4	NaN	linear	NaN	1.427494	0.042778
116	chickenpox	GNAR	0.8	rand	4	NaN	cubic	NaN	1.427494	0.041948
117	chickenpox	GNAR	0.8	rand	4	NaN	linear	NaN	1.427494	0.042717
118	chickenpox	GNAR	0.9	rand	4	NaN	cubic	NaN	1.427494	0.044451
119	chickenpox	GNAR	0.9	rand	4	NaN	linear	NaN	1.427494	0.042452

2826 rows × 10 columns

data.to_csv('./simulation_results/Real_simulation/chikenpox_Simulation.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/chikenpox_Simulation.csv')

data.query("method=='GNAR' and mtype == 'rand'")['mse'].mean(),data.query("method=='GNAR' and mtype != 'rand'")['mse'].mean()

(1.4274942874908447, 1.4274942874908447)

data.query("method=='STGCN' and mtype == 'rand'")['mse'].mean(),data.query("method=='STGCN' and mtype != 'rand'")['mse'].mean()

(1.1580357599258422, 1.0201175289021598)

data.query("method=='IT-STGCN' and mtype == 'rand'")['mse'].mean(),data.query("method=='IT-STGCN' and mtype != 'rand'")['mse'].mean()

(1.132145622505082, 1.0210112863116794)

data.query("method!='GNAR' and mrate ==0 ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='nof_filters',height=600)

data.query("method!='GNAR' and mtype =='rand' and mrate !=0.8 and mrate!=0.9 ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='nof_filters',facet_row='inter_method',height=800)

data.query("method!='GNAR' and mtype =='rand' and (mrate==0.8 or mrate==0.9)").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='nof_filters',facet_row='inter_method',height=800)

data.query("method!='GNAR' and mtype =='block' ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='nof_filters',facet_row='inter_method',height=800)

Chickenpox DCRNN result

df1 = pd.read_csv('./simulation_results/2023-05-15_05-35-30.csv')
# df2 = pd.read_csv('./simulation_results/2023-04-22_05-38-23.csv')
# df3 = pd.read_csv('./simulation_results/2023-04-22_20-41-26.csv')
# df4 = pd.read_csv('./simulation_results/2023-04-23_13-13-49.csv')
# df5 = pd.read_csv('./simulation_results/2023-04-23_18-03-50.csv')

data = pd.concat([df1],axis=0)

data.to_csv('./simulation_results/DCRNN/chickenpox_DCRNN.csv',index=False)

data = pd.read_csv('./simulation_results/DCRNN/chickenpox_DCRNN.csv')

Pedalme

데이터셋 미싱이 0.8일때

The number of derivatives at boundaries does not match: expected 1, got 0+0

해당 오류, 즉 미분되지 않는 오류가 생긴다.

공식 패키지: lags 4 지정
mrate = 0.3
nof_filters = 12
- 필터 클수록 mse 안정적으로 보임!
lags = 4, 8
- lags 클 수록 커지는 경향이 있지만,
- lags 크니까 GNAR보다 mse 평균적으로 낮게 보인다.
GNAR보다 MSE는 낮음
cal_time
- mean = 1초도 안 된다!
- max = 6초!

random

data = pd.read_csv('./simulation_results/pedalme_random.csv');data

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	pedalme	GNAR	0.0	NaN	2	NaN	NaN	NaN	1.151634	0.009696
1	pedalme	IT-STGCN	0.0	NaN	2	4.0	NaN	5.0	1.255845	1.595633
2	pedalme	IT-STGCN	0.0	NaN	2	4.0	NaN	5.0	1.216815	1.721916
3	pedalme	IT-STGCN	0.0	NaN	2	12.0	NaN	5.0	1.249243	1.420279
4	pedalme	IT-STGCN	0.0	NaN	2	12.0	NaN	5.0	1.237032	0.910204
...	...	...	...	...	...	...	...	...	...	...
2527	pedalme	STGCN	0.3	rand	8	4.0	linear	5.0	1.429247	0.560238
2528	pedalme	STGCN	0.3	rand	8	4.0	cubic	5.0	1.431005	0.564748
2529	pedalme	IT-STGCN	0.7	rand	8	12.0	linear	5.0	1.489404	0.543194
2530	pedalme	IT-STGCN	0.3	rand	8	4.0	cubic	5.0	1.372652	0.628229
2531	pedalme	GNAR	0.7	rand	8	NaN	linear	NaN	1.382030	0.020379

2532 rows × 10 columns

data.query("method!='GNAR'")['calculation_time'].mean(),data.query("method!='GNAR'")['calculation_time'].max(),data.query("method!='GNAR'")['calculation_time'].min()

(0.9260026927347537, 6.205296277999878, 0.4241352081298828)

data.query("mtype=='rand' and method!='GNAR' and lags!=4").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)

data.query("mtype=='rand' and method!='GNAR' and mrate==0.7").plot.box(backend='plotly',x='inter_method',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)

data.query("mtype=='rand' and method!='GNAR' and mrate==0.3").plot.box(backend='plotly',x='inter_method',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)

data.query("method=='GNAR'").plot.box(backend='plotly',x='mtype',color='method',y='mse',facet_col='lags',height=600)

시뮬 예정(평균 시간, 평균mse)

lags 4,8

mrate 0.3~0.6

# 1. mrate = 0.3, filter = 4, epoch = 50, lags = 4
data.query("method !='GNAR' and mrate==0.3 and inter_method=='cubic' and nof_filters==12 and lags==8")['calculation_time'].mean(),data.query("method !='GNAR' and mrate==0.3 and inter_method=='cubic' and nof_filters==12 and lags==8")['mse'].mean()

(0.8366350531578064, 1.3687758445739746)

data.query("method !='GNAR' and mrate==0.3 and inter_method=='cubic' and nof_filters==12 and lags==8").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=400)

block

data = pd.read_csv('./simulation_results/pedalme_block.csv');data

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	pedalme	IT-STGCN	0.047619	block	2	4.0	cubic	5.0	1.229210	0.758090
1	pedalme	STGCN	0.047619	block	2	12.0	linear	5.0	1.223644	0.681700
2	pedalme	STGCN	0.047619	block	2	12.0	cubic	5.0	1.237086	0.684113
3	pedalme	STGCN	0.047619	block	2	4.0	linear	5.0	1.225114	0.659210
4	pedalme	STGCN	0.047619	block	2	4.0	cubic	5.0	1.216191	0.664208
...	...	...	...	...	...	...	...	...	...	...
715	pedalme	IT-STGCN	0.045977	block	8	4.0	cubic	5.0	1.425474	0.640063
716	pedalme	STGCN	0.045977	block	8	12.0	cubic	5.0	1.302402	0.718187
717	pedalme	STGCN	0.045977	block	8	12.0	linear	5.0	1.336038	0.719500
718	pedalme	IT-STGCN	0.045977	block	8	12.0	linear	5.0	1.311962	0.831888
719	pedalme	IT-STGCN	0.045977	block	8	12.0	cubic	5.0	1.315647	0.667004

720 rows × 10 columns

missing rate 조정하기 30~50% 여러개 block 해서

data.query("method!='GNAR'").plot.box(backend='plotly',x='inter_method',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)

시뮬 예정(평균 시간, 평균mse)

data.query("inter_method=='linear' and nof_filters==12 and lags==4").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=400)

pedalme simulation result

block1

my_list = [[] for _ in range(15)] #pedalme
another_list = list(range(5,25))
my_list[1] = another_list
my_list[3] = another_list
my_list[5] = another_list
my_list[7] = another_list
my_list[9] = another_list
my_list[11] = another_list
mindex = my_list

block 30% missing을 위한 조건

block2

my_list = [[] for _ in range(15)] #pedalme
another_list = list(range(10,25))
my_list[2] = another_list
my_list[4] = another_list
my_list[5] = another_list
my_list[11] = another_list
mindex = my_list

block 30% missing을 위한 조건

df1 = pd.read_csv('./simulation_results/2023-04-13_20-37-59.csv') # STGCN, ITSTGCN random 0%,30%, 40%
df2 = pd.read_csv('./simulation_results/2023-04-13_21-29-38.csv') # STGCN, ITSTGCN random 50%, 60%
df3 = pd.read_csv('./simulation_results/2023-04-15_01-08-16.csv') # GNAR random 30%, 40%, 50%, 60%
df4 = pd.read_csv('./simulation_results/2023-04-13_21-56-36.csv') # GNAR block 30%
df5 = pd.read_csv('./simulation_results/2023-04-15_01-08-16.csv') # GNAR random 30%, 40%, 50%
df6 = pd.read_csv('./simulation_results/2023-04-15_01-38-46.csv') # STGCN, ITSTGCN block 2
df7 = pd.read_csv('./simulation_results/2023-04-23_15-17-33.csv') # GNAR 60%
df8 = pd.read_csv('./simulation_results/2023-04-23_15-25-09.csv') # GNAR block 1
df9 = pd.read_csv('./simulation_results/2023-04-23_15-41-20.csv') # GNAR block 2
df10 = pd.read_csv('./simulation_results/2023-04-23_16-25-28.csv') # STGCN,IT-STGCN block 2
df11 = pd.read_csv('./simulation_results/2023-04-19_00-13-29.csv')
df12 = pd.read_csv('./simulation_results/2023-05-14_21-01-41.csv')

data = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9,df10,df11,df12],axis=0)

data.to_csv('./simulation_results/Real_simulation/pedalme_Simulation.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/pedalme_Simulation.csv')

data.query("method=='GNAR' and mtype == 'rand'")['mse'].mean(),data.query("method=='GNAR' and mtype != 'rand'")['mse'].mean()

(1.3124752074112127, 1.34235417842865)

data.query("method=='STGCN' and mtype == 'rand'")['mse'].mean(),data.query("method=='STGCN' and mtype != 'rand'")['mse'].mean()

(1.415487505743901, 1.3771906583082107)

data.query("method=='IT-STGCN' and mtype == 'rand'")['mse'].mean(),data.query("method=='IT-STGCN' and mtype != 'rand'")['mse'].mean()

(1.4283250387758017, 1.3718502723035357)

Baseline

data.query("method!='GNAR' and mrate ==0 ").plot.box(backend='plotly',x='epoch',color='method',y='mse',facet_col='lags',height=800)

random

data.query("method!='GNAR' and mtype =='rand' ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=800)

block

data.query("method!='GNAR' and mtype =='block' and inter_method=='cubic' ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=600)

data.query("method!='GNAR' and mtype =='block' and inter_method!='cubic' ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=600)

weight matrix time, node 고려한 결과

df1 = pd.read_csv('./simulation_results/2023-04-30_13-00-12.csv')
df2 = pd.read_csv('./simulation_results/2023-04-30_13-31-32.csv')
df3 = pd.read_csv('./simulation_results/2023-04-30_14-01-49.csv')
df4 = pd.read_csv('./simulation_results/2023-04-30_14-31-56.csv')
df5 = pd.read_csv('./simulation_results/2023-04-30_15-02-23.csv')
df6 = pd.read_csv('./simulation_results/2023-04-30_15-33-03.csv')
df7 = pd.read_csv('./simulation_results/2023-04-30_16-07-43.csv')
df8 = pd.read_csv('./simulation_results/2023-04-30_16-41-35.csv')
df9 = pd.read_csv('./simulation_results/2023-04-30_17-14-51.csv')
df10 = pd.read_csv('./simulation_results/2023-04-30_17-49-34.csv')
df11 = pd.read_csv('./simulation_results/2023-04-30_18-21-29.csv')
df12 = pd.read_csv('./simulation_results/2023-04-30_18-50-24.csv')
df13 = pd.read_csv('./simulation_results/2023-04-30_20-33-28.csv')
df14 = pd.read_csv('./simulation_results/2023-05-04_16-40-05.csv')
df15 = pd.read_csv('./simulation_results/2023-05-04_17-34-00.csv')

data2 = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9,df10,df11,df12,df13,df14,df15],axis=0)

data2.to_csv('./simulation_results/Real_simulation/pedalme_Simulation_itstgcnsnd.csv',index=False)

data2 = pd.read_csv('./simulation_results/Real_simulation/pedalme_Simulation_itstgcnsnd.csv')

data2.query("mtype!='block'").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=1000)

data2.query("mtype=='block'").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=1200)

Pedalme DCRNN

df1 = pd.read_csv('./simulation_results/2023-05-14_19-04-26.csv')
# df2 = pd.read_csv('./simulation_results/2023-04-27_22-09-07.csv')
# df3 = pd.read_csv('./simulation_results/2023-04-28_14-40-59.csv')

data = pd.concat([df1],axis=0)

data

	dataset	method	RecurrentGCN	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	pedalme	STGCN	DCRNN	0.0	NaN	4	12	NaN	50	1.181104	5.895220
1	pedalme	STGCN	DCRNN	0.0	NaN	4	12	NaN	50	1.248006	5.130111
2	pedalme	STGCN	DCRNN	0.0	NaN	4	12	NaN	50	1.191690	5.466649
3	pedalme	STGCN	DCRNN	0.3	rand	4	12	linear	50	1.279097	4.442183
4	pedalme	STGCN	DCRNN	0.3	rand	4	12	cubic	50	1.160505	5.448436
...	...	...	...	...	...	...	...	...	...	...	...
895	pedalme	IT-STGCN	DCRNN	0.5	rand	4	12	cubic	50	1.276410	7.960691
896	pedalme	IT-STGCN	DCRNN	0.5	rand	4	12	nearest	50	1.254771	7.939348
897	pedalme	IT-STGCN	DCRNN	0.6	rand	4	12	linear	50	1.249204	8.023095
898	pedalme	IT-STGCN	DCRNN	0.6	rand	4	12	cubic	50	1.210001	7.810658
899	pedalme	IT-STGCN	DCRNN	0.6	rand	4	12	nearest	50	1.231929	7.955805

900 rows × 11 columns

data.to_csv('./simulation_results/DCRNN/pedalme_DVRNN.csv',index=False)

data = pd.read_csv('./simulation_results/DCRNN/pedalme_DVRNN.csv')

Wikimath

공식 패키지: lags 8 지정
오히려 cuboic 보다 linear가 더 잘 맞추는 경향
mrate = 0.3
- 크면 이상치 심하게 나와서 작게 잡기
nof_filters = 12, 16
- 필터 크니까 mse 내려감
lags = 2,
cal_time
- mean = 71s
- max = 212s

random epoch 1번

df1 = pd.read_csv('./simulation_results/2023-04-15_16-58-03.csv')
df2 = pd.read_csv('./simulation_results/2023-04-15_17-01-39.csv')
df3 = pd.read_csv('./simulation_results/2023-04-15_17-07-23.csv')
df4 = pd.read_csv('./simulation_results/2023-04-15_17-13-13.csv')
df5 = pd.read_csv('./simulation_results/2023-04-15_17-29-49.csv')

data = pd.concat([df1,df2,df3,df4,df5],axis=0)

data.query("method=='STGCN'").sort_values(['mrate','lags','nof_filters'])

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	wikimath	STGCN	0.3	rand	4	12	linear	1	0.863623	25.504817
0	wikimath	STGCN	0.3	rand	4	12	cubic	1	0.847675	27.086116
0	wikimath	STGCN	0.4	rand	2	12	linear	1	0.912734	30.048937
1	wikimath	STGCN	0.4	rand	2	12	cubic	1	0.916843	27.104823
0	wikimath	STGCN	0.4	rand	4	12	linear	1	0.907305	24.776503
1	wikimath	STGCN	0.4	rand	4	12	cubic	1	0.854127	24.608104
2	wikimath	STGCN	0.4	rand	8	12	linear	1	0.788011	24.233431
3	wikimath	STGCN	0.4	rand	8	12	cubic	1	0.795219	24.228026
0	wikimath	STGCN	0.5	rand	4	12	linear	1	0.914080	26.301605
1	wikimath	STGCN	0.5	rand	4	12	cubic	1	0.975948	27.855870

data.query("method!='STGCN'").sort_values(['mrate','lags','nof_filters'])

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
1	wikimath	IT-STGCN	0.3	rand	4	12	linear	1	0.908916	28.928112
1	wikimath	IT-STGCN	0.3	rand	4	12	cubic	1	0.856639	29.759748
4	wikimath	IT-STGCN	0.4	rand	2	12	linear	1	0.864580	29.660712
5	wikimath	IT-STGCN	0.4	rand	2	12	cubic	1	0.926426	30.838968
2	wikimath	IT-STGCN	0.4	rand	4	12	linear	1	0.871146	29.008776
3	wikimath	IT-STGCN	0.4	rand	4	12	cubic	1	0.905354	30.405766
6	wikimath	IT-STGCN	0.4	rand	8	12	linear	1	0.822462	32.329447
7	wikimath	IT-STGCN	0.4	rand	8	12	cubic	1	0.817621	29.447260
2	wikimath	IT-STGCN	0.5	rand	4	12	linear	1	0.878943	31.140878
3	wikimath	IT-STGCN	0.5	rand	4	12	cubic	1	1.002361	28.461372

Wikimath simulation result

df1 = pd.read_csv('./simulation_results/2023-04-21_14-32-44.csv')
df2 = pd.read_csv('./simulation_results/2023-04-22_05-38-23.csv')
df3 = pd.read_csv('./simulation_results/2023-04-22_20-41-26.csv')
df4 = pd.read_csv('./simulation_results/2023-04-23_13-13-49.csv')
df5 = pd.read_csv('./simulation_results/2023-04-23_18-03-50.csv')
df6 = pd.read_csv('./simulation_results/2023-04-24_18-25-09.csv')
df7 = pd.read_csv('./simulation_results/2023-04-24_03-33-57.csv')
df8 = pd.read_csv('./simulation_results/2023-04-25_11-18-21.csv')
df9 = pd.read_csv('./simulation_results/2023-04-25_22-51-21.csv')
df10 = pd.read_csv('./simulation_results/2023-04-26_07-35-21.csv')
df11 = pd.read_csv('./simulation_results/2023-04-28_18-07-23.csv')
df12 = pd.read_csv('./simulation_results/2023-04-30_04-35-07.csv')
df13 = pd.read_csv('./simulation_results/2023-05-08_12-07-28.csv')
df14 = pd.read_csv('./simulation_results/2023-05-09_02-26-26.csv')
df15 = pd.read_csv('./simulation_results/2023-05-09_09-10-12.csv')
df16 = pd.read_csv('./simulation_results/2023-05-09_15-42-43.csv')
df17 = pd.read_csv('./simulation_results/2023-05-09_21-48-31.csv')
df18 = pd.read_csv('./simulation_results/2023-05-10_02-17-07.csv')
df19 = pd.read_csv('./simulation_results/2023-05-10_06-35-14.csv')

data = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9,df10,df11,df12,df13,df14,df15,df16,df17,
                 df18,df19],axis=0)

data.to_csv('./simulation_results/Real_simulation/wikimath.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/wikimath.csv')

Baseline

data.query("mrate==0 and method!='GNAR'").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=600)

random

data.query("method=='GNAR'").groupby('mrate')['mse'].unique()

mrate
0.0    [1.2959295511245728, 1.2547194957733154]
0.3    [1.2959295511245728, 1.2547194957733154]
0.5    [1.2959295511245728, 1.2547194957733154]
Name: mse, dtype: object

data.query("mtype=='rand' and mrate !=0 and method!='GNAR'").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)

block

df1 = pd.read_csv('./simulation_results/2023-04-27_07-50-11.csv')
df2 = pd.read_csv('./simulation_results/2023-04-27_22-09-07.csv')
df3 = pd.read_csv('./simulation_results/2023-04-28_14-40-59.csv')
df4 = pd.read_csv('./simulation_results/2023-05-14_19-46-46.csv')
# df5 = pd.read_csv('./simulation_results/2023-05-14_19-46-46.csv')

data = pd.concat([df1,df2,df3,df4],axis=0)

data.to_csv('./simulation_results/Real_simulation/wikimath_block.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/wikimath_block.csv')

data.query("mtype=='block' and method!='GNAR'").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)

missing values on the same nodes

# 10%
df1 = pd.read_csv('./simulation_results/2023-04-29_03-57-07.csv') # STGCN IT-STGCN block
df2 = pd.read_csv('./simulation_results/2023-04-29_20-15-46.csv') # STGCN IT-STGCN
df3 = pd.read_csv('./simulation_results/2023-04-30_16-19-58.csv') # STGCN IT-STGCN
# 60% 확인하고 다시 돌리기
df4 = pd.read_csv('./simulation_results/2023-05-05_04-21-57.csv') # STGCN IT-STGCN 60%
df5 = pd.read_csv('./simulation_results/2023-05-06_11-34-46.csv') # STGCN IT-STGCN
df6 = pd.read_csv('./simulation_results/2023-05-06_23-43-35.csv') # STGCN IT-STGCN
df7 = pd.read_csv('./simulation_results/2023-05-07_14-06-44.csv') # STGCN IT-STGCN

data = pd.concat([df1,df2,df3,df4,df5,df6,df7],axis=0)

data.to_csv('./simulation_results/Real_simulation/wikimath_GSO_st.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/wikimath_GSO_st.csv')

data.query("method=='GNAR'")['mse'].unique()

array([], dtype=float64)

data.query("method!='GNAR' and mtype =='block' ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='inter_method',facet_row='lags',height=800)

Wikimath DCRNN result

df1 = pd.read_csv('./simulation_results/2023-05-15_00-20-42.csv')
df2 = pd.read_csv('./simulation_results/2023-05-15_05-15-48.csv')
df3 = pd.read_csv('./simulation_results/2023-05-15_08-26-11.csv')
# df4 = pd.read_csv('./simulation_results/2023-04-23_13-13-49.csv')

data = pd.concat([df1,df2,df3],axis=0)

data.to_csv('./simulation_results/DCRNN/wikimath_DCRNN.csv',index=False)

data = pd.read_csv('./simulation_results/DCRNN/wikimath_DCRNN.csv')

Windmilmedium

df1 = pd.read_csv('./simulation_results/2023-04-15_09-06-12.csv') # GNAR
df2 = pd.read_csv('./simulation_results/2023-04-15_09-19-44.csv') # STGCN IT-STGCN
df3 = pd.read_csv('./simulation_results/2023-04-15_09-28-32.csv') # STGCN IT-STGCN
df4 = pd.read_csv('./simulation_results/2023-04-15_09-36-55.csv') # STGCN IT-STGCN
df5 = pd.read_csv('./simulation_results/2023-04-15_09-54-30.csv') # STGCN IT-STGCN
df6 = pd.read_csv('./simulation_results/2023-04-15_10-03-08.csv') # STGCN IT-STGCN
df7 = pd.read_csv('./simulation_results/2023-04-15_10-15-48.csv') # STGCN IT-STGCN
df8 = pd.read_csv('./simulation_results/2023-04-15_10-25-19.csv') # STGCN IT-STGCN
df9 = pd.read_csv('./simulation_results/2023-04-15_10-34-48.csv') # STGCN IT-STGCN
df10 = pd.read_csv('./simulation_results/2023-04-15_10-43-02.csv') # STGCN IT-STGCN

data = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9,df10],axis=0)

data.query("method=='GNAR'")

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	windmilmedium	GNAR	0.1	rand	4	NaN	cubic	NaN	1.410524	3.150951
1	windmilmedium	GNAR	0.1	rand	4	NaN	cubic	NaN	1.410524	2.926645
2	windmilmedium	GNAR	0.1	rand	4	NaN	cubic	NaN	1.410524	2.406094

data.query("method!='GNAR' and method=='STGCN'").sort_values(['mrate','nof_filters'])

dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
windmilmedium	STGCN	0.1	rand	2	12.0	cubic	1.0	1.038629	85.205226
windmilmedium	STGCN	0.4	rand	2	12.0	cubic	1.0	1.325845	85.721810
windmilmedium	STGCN	0.5	rand	4	12.0	cubic	1.0	1.568322	87.435629
windmilmedium	STGCN	0.8	rand	2	4.0	linear	1.0	1.256851	79.950040
windmilmedium	STGCN	0.8	rand	2	8.0	linear	1.0	1.259840	83.667886
windmilmedium	STGCN	0.8	rand	2	12.0	cubic	1.0	1.874045	85.171979
windmilmedium	STGCN	0.8	rand	2	12.0	linear	1.0	1.427910	84.167046
windmilmedium	STGCN	0.8	rand	2	16.0	linear	1.0	1.449077	93.408642
windmilmedium	STGCN	0.8	rand	2	32.0	linear	1.0	1.339085	88.795324

data.query("method!='GNAR' and method!='STGCN'").sort_values(['mrate','nof_filters'])

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
1	windmilmedium	IT-STGCN	0.1	rand	2	12.0	cubic	1.0	0.991687	282.159899
1	windmilmedium	IT-STGCN	0.4	rand	2	12.0	cubic	1.0	1.150386	282.688800
1	windmilmedium	IT-STGCN	0.5	rand	4	12.0	cubic	1.0	1.232030	273.543777
1	windmilmedium	IT-STGCN	0.8	rand	2	4.0	linear	1.0	1.217331	295.937213
1	windmilmedium	IT-STGCN	0.8	rand	2	8.0	linear	1.0	1.162310	259.498000
1	windmilmedium	IT-STGCN	0.8	rand	2	12.0	cubic	1.0	1.772746	262.409024
1	windmilmedium	IT-STGCN	0.8	rand	2	12.0	linear	1.0	1.182181	287.886245
1	windmilmedium	IT-STGCN	0.8	rand	2	16.0	linear	1.0	1.430025	306.211073
1	windmilmedium	IT-STGCN	0.8	rand	2	32.0	linear	1.0	1.203084	309.623751

linear, 0.7~0.9, 4,8,

data.to_csv('./simulation_results/Real_simulation/windmilmedium_Simulation.csv',index=False)

data.query("method!='GNAR'")['calculation_time'].mean(),data.query("method!='GNAR'")['calculation_time'].max(),data.query("method!='GNAR'")['calculation_time'].min()

(185.19340917799207, 309.62375116348267, 79.95004034042358)

Windmillmedium simulation result

# df1 = pd.read_csv('./simulation_results/2023-05-08_02-08-10.csv')
df2 = pd.read_csv('./simulation_results/2023-05-08_14-58-04.csv')
df3 = pd.read_csv('./simulation_results/2023-05-09_03-44-04.csv')
df4 = pd.read_csv('./simulation_results/2023-05-09_19-32-04.csv') # STGCN IT-STGCN
df5 = pd.read_csv('./simulation_results/2023-05-10_01-07-21.csv') # STGCN IT-STGCN
df6 = pd.read_csv('./simulation_results/2023-05-10_06-15-13.csv') # 
df7 = pd.read_csv('./simulation_results/2023-05-10_10-15-50.csv') # STGCN IT-STGCN
df8 = pd.read_csv('./simulation_results/2023-05-10_14-09-03.csv') # STGCN IT-STGCN
df9 = pd.read_csv('./simulation_results/2023-05-10_17-09-38.csv') # GNAR
df10 = pd.read_csv('./simulation_results/2023-05-10_18-00-11.csv') # STGCN IT-STGCN
df11 = pd.read_csv('./simulation_results/2023-05-10_21-50-37.csv') # STGCN IT-STGCN
df12 = pd.read_csv('./simulation_results/2023-05-11_01-41-04.csv') # STGCN IT-STGCN
df13 = pd.read_csv('./simulation_results/2023-05-11_05-31-29.csv') # STGCN IT-STGCN
df14 = pd.read_csv('./simulation_results/2023-05-11_13-25-58.csv') # STGCN IT-STGCN
df15 = pd.read_csv('./simulation_results/2023-05-11_13-26-45.csv') # STGCN IT-STGCN
df16 = pd.read_csv('./simulation_results/2023-05-11_18-33-31.csv') # STGCN IT-STGCN
df17 = pd.read_csv('./simulation_results/2023-05-11_18-39-14.csv') # STGCN IT-STGCN
df18 = pd.read_csv('./simulation_results/2023-05-12_00-06-22.csv') # STGCN IT-STGCN
df19 = pd.read_csv('./simulation_results/2023-05-12_00-10-51.csv') # STGCN IT-STGCN
df20 = pd.read_csv('./simulation_results/2023-05-12_05-17-16.csv') # STGCN IT-STGCN
df21 = pd.read_csv('./simulation_results/2023-05-12_05-17-50.csv') # STGCN IT-STGCN
df22 = pd.read_csv('./simulation_results/2023-05-13_18-46-25.csv') # STGCN IT-STGCN
df23 = pd.read_csv('./simulation_results/2023-05-13_18-47-00.csv') # STGCN IT-STGCN
df24 = pd.read_csv('./simulation_results/2023-05-13_23-16-09.csv') # STGCN IT-STGCN
df25 = pd.read_csv('./simulation_results/2023-05-13_23-20-14.csv') # STGCN IT-STGCN
df26 = pd.read_csv('./simulation_results/2023-05-14_03-54-19.csv') # STGCN IT-STGCN
df27 = pd.read_csv('./simulation_results/2023-05-14_08-16-42.csv') # STGCN IT-STGCN
# df28 = pd.read_csv('./simulation_results/2023-05-03_13-43-11.csv') # STGCN IT-STGCN
# df29 = pd.read_csv('./simulation_results/2023-05-03_21-58-04.csv') # STGCN IT-STGCN
# df30 = pd.read_csv('./simulation_results/2023-05-04_04-39-00.csv') # STGCN IT-STGCN
# df31 = pd.read_csv('./simulation_results/2023-04-23_15-22-36.csv') # 
# df32 = pd.read_csv('./simulation_results/2023-04-29_06-54-40.csv') #  
# df33 = pd.read_csv('./simulation_results/2023-04-30_18-55-12.csv')
# df34 = pd.read_csv('./simulation_results/2023-05-01_02-55-33.csv')
# df35 = pd.read_csv('./simulation_results/2023-05-01_10-21-15.csv')
# df36 = pd.read_csv('./simulation_results/2023-05-01_19-23-57.csv')
# df37 = pd.read_csv('./simulation_results/2023-05-02_01-10-53.csv')
# df38 = pd.read_csv('./simulation_results/2023-05-02_08-26-53.csv')
# df39 = pd.read_csv('./simulation_results/2023-05-02_16-00-40.csv')
# df40 = pd.read_csv('./simulation_results/2023-05-03_00-34-09.csv')
# df41 = pd.read_csv('./simulation_results/2023-05-03_08-04-42.csv')
# df42 = pd.read_csv('./simulation_results/2023-05-03_15-50-50.csv')
# df43 = pd.read_csv('./simulation_results/2023-05-03_23-46-56.csv')
# df44 = pd.read_csv('./simulation_results/2023-05-04_05-22-59.csv')
# df45 = pd.read_csv('./simulation_results/2023-05-04_09-22-37.csv')
# df46 = pd.read_csv('./simulation_results/2023-05-04_15-00-57.csv')
# df47 = pd.read_csv('./simulation_results/2023-05-04_23-41-21.csv')
# df48 = pd.read_csv('./simulation_results/2023-05-05_07-23-04.csv')
# df49 = pd.read_csv('./simulation_results/2023-05-05_15-03-17.csv')
# df50 = pd.read_csv('./simulation_results/2023-05-06_05-18-07.csv')
# df51 = pd.read_csv('./simulation_results/2023-05-06_12-57-14.csv')
# df52 = pd.read_csv('./simulation_results/2023-05-06_19-10-23.csv')
# df53 = pd.read_csv('./simulation_results/2023-05-07_03-20-10.csv')
# df54 = pd.read_csv('./simulation_results/2023-05-07_11-26-24.csv')
# df55 = pd.read_csv('./simulation_results/2023-05-08_00-04-56.csv')
# df56 = pd.read_csv('./simulation_results/2023-05-08_04-27-01.csv')
# df57 = pd.read_csv('./simulation_results/2023-05-08_10-06-55.csv')
# df58 = pd.read_csv('./simulation_results/2023-05-08_17-50-36.csv')
# df59 = pd.read_csv('./simulation_results/2023-05-09_03-28-08.csv')
# df60 = pd.read_csv('./simulation_results/2023-05-09_11-08-10.csv')
# df61 = pd.read_csv('./simulation_results/2023-05-09_20-11-45.csv')

data = pd.concat([df2,df3,df4,df5,df6,df7,df8,df9,df10,df11,df12,df13,df14,
                 df15,df16,df17,df18,df19,df20,df21,df22,df23,df24,df25,
                 df26,df27],axis=0)

data.to_csv('./simulation_results/Real_simulation/windmillmedium.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/windmillmedium.csv')

data.query("method=='GNAR'")['mse'].unique()

array([1.41213334])

data.query("method!='GNAR' and mrate ==0").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',height=800)

data.query("method!='GNAR' and mrate !=0").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',height=800)

Windmilsmall

df1 = pd.read_csv('./simulation_results/2023-04-15_10-59-28.csv') # GNAR
df2 = pd.read_csv('./simulation_results/2023-04-15_11-15-05.csv') # STGCN IT-STGCN
df3 = pd.read_csv('./simulation_results/2023-04-15_11-30-48.csv') # STGCN IT-STGCN
df4 = pd.read_csv('./simulation_results/2023-04-15_11-46-45.csv') # STGCN IT-STGCN
df5 = pd.read_csv('./simulation_results/2023-04-15_12-02-19.csv') # STGCN IT-STGCN
df6 = pd.read_csv('./simulation_results/2023-04-15_15-00-32.csv') # STGCN IT-STGCN
# df7 = pd.read_csv('./simulation_results/2023-04-15_10-15-48.csv') # STGCN IT-STGCN
# df8 = pd.read_csv('./simulation_results/2023-04-15_10-25-19.csv') # STGCN IT-STGCN
# df9 = pd.read_csv('./simulation_results/2023-04-15_10-34-48.csv') # STGCN IT-STGCN
# df10 = pd.read_csv('./simulation_results/2023-04-15_10-43-02.csv') # STGCN IT-STGCN

data = pd.concat([df1,df2,df3,df4,df5,df6],axis=0)

data.query("method=='GNAR'").sort_values(['mrate','nof_filters'])

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	windmilsmall	GNAR	0.3	rand	4	NaN	cubic	NaN	1.640339	1.222944
1	windmilsmall	GNAR	0.3	rand	4	NaN	linear	NaN	1.640339	0.954795
6	windmilsmall	GNAR	0.3	rand	4	NaN	cubic	NaN	1.640339	0.761808
7	windmilsmall	GNAR	0.3	rand	4	NaN	linear	NaN	1.640339	0.790776
12	windmilsmall	GNAR	0.3	rand	4	NaN	cubic	NaN	1.640339	0.987039
13	windmilsmall	GNAR	0.3	rand	4	NaN	linear	NaN	1.640339	0.976644
2	windmilsmall	GNAR	0.5	rand	4	NaN	cubic	NaN	1.640339	0.901695
3	windmilsmall	GNAR	0.5	rand	4	NaN	linear	NaN	1.640339	0.939233
8	windmilsmall	GNAR	0.5	rand	4	NaN	cubic	NaN	1.640339	0.986533
9	windmilsmall	GNAR	0.5	rand	4	NaN	linear	NaN	1.640339	0.988925
14	windmilsmall	GNAR	0.5	rand	4	NaN	cubic	NaN	1.640339	0.692504
15	windmilsmall	GNAR	0.5	rand	4	NaN	linear	NaN	1.640339	0.954345
4	windmilsmall	GNAR	0.7	rand	4	NaN	cubic	NaN	1.640339	0.938546
5	windmilsmall	GNAR	0.7	rand	4	NaN	linear	NaN	1.640339	0.926433
10	windmilsmall	GNAR	0.7	rand	4	NaN	cubic	NaN	1.640339	0.830638
11	windmilsmall	GNAR	0.7	rand	4	NaN	linear	NaN	1.640339	0.947263
16	windmilsmall	GNAR	0.7	rand	4	NaN	cubic	NaN	1.640339	0.939917
17	windmilsmall	GNAR	0.7	rand	4	NaN	linear	NaN	1.640339	0.950329

data.query("method!='GNAR' and method=='STGCN'").sort_values(['mrate','nof_filters'])

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
0	windmilsmall	STGCN	0.3	rand	4	12.0	linear	1.0	1.200871	73.057425
1	windmilsmall	STGCN	0.3	rand	4	12.0	cubic	1.0	1.442769	82.757819
0	windmilsmall	STGCN	0.5	rand	4	12.0	linear	1.0	1.332673	73.738043
1	windmilsmall	STGCN	0.5	rand	4	12.0	cubic	1.0	1.935493	75.276489
0	windmilsmall	STGCN	0.5	rand	8	12.0	linear	1.0	1.287041	72.605574
1	windmilsmall	STGCN	0.5	rand	8	12.0	cubic	1.0	1.954025	72.804517
0	windmilsmall	STGCN	0.5	rand	4	32.0	linear	1.0	1.320776	74.728671
1	windmilsmall	STGCN	0.5	rand	4	32.0	cubic	1.0	1.865486	75.110273
0	windmilsmall	STGCN	0.7	rand	4	12.0	linear	1.0	1.470515	74.648811
1	windmilsmall	STGCN	0.7	rand	4	12.0	cubic	1.0	2.182147	71.730788

data.query("method!='GNAR' and method!='STGCN'").sort_values(['mrate','nof_filters'])

	dataset	method	mrate	mtype	lags	nof_filters	inter_method	epoch	mse	calculation_time
2	windmilsmall	IT-STGCN	0.3	rand	4	12.0	linear	1.0	0.997696	255.592267
3	windmilsmall	IT-STGCN	0.3	rand	4	12.0	cubic	1.0	1.049607	268.626712
2	windmilsmall	IT-STGCN	0.5	rand	4	12.0	linear	1.0	1.103726	253.085496
3	windmilsmall	IT-STGCN	0.5	rand	4	12.0	cubic	1.0	1.459947	278.678849
2	windmilsmall	IT-STGCN	0.5	rand	8	12.0	linear	1.0	1.110951	266.898954
3	windmilsmall	IT-STGCN	0.5	rand	8	12.0	cubic	1.0	1.314662	270.144128
2	windmilsmall	IT-STGCN	0.5	rand	4	32.0	linear	1.0	1.153238	259.596158
3	windmilsmall	IT-STGCN	0.5	rand	4	32.0	cubic	1.0	1.341482	253.815536
2	windmilsmall	IT-STGCN	0.7	rand	4	12.0	linear	1.0	1.215104	283.833449
3	windmilsmall	IT-STGCN	0.7	rand	4	12.0	cubic	1.0	2.141516	279.526782

linear, lags 4,8. filter 8,12

Windmillsmall simulation result

Baseline

df1 = pd.read_csv('./simulation_results/2023-04-17_06-05-37.csv') # STGCN IT-STGCN 70%
df2 = pd.read_csv('./simulation_results/2023-04-17_08-05-26.csv') # STGCN IT-STGCN
df3 = pd.read_csv('./simulation_results/2023-04-17_13-41-19.csv') # STGCN IT-STGCN
df4 = pd.read_csv('./simulation_results/2023-04-17_15-44-21.csv') # STGCN IT-STGCN
df5 = pd.read_csv('./simulation_results/2023-04-17_21-27-38.csv') # STGCN IT-STGCN
# df6 = pd.read_csv('./simulation_results/2023-04-15_15-00-32.csv') # GNAR 30%, 50%, 70% # 뭔가 일단 필요없어서 데이터셋에서 뺌
df7 = pd.read_csv('./simulation_results/2023-04-18_05-01-55.csv') # STGCN IT-STGCN
df8 = pd.read_csv('./simulation_results/2023-04-18_06-14-06.csv') # STGCN IT-STGCN
df9 = pd.read_csv('./simulation_results/2023-04-18_17-32-30.csv') # STGCN IT-STGCN
df10 = pd.read_csv('./simulation_results/2023-04-19_01-52-24.csv') # STGCN IT-STGCN
df11 = pd.read_csv('./simulation_results/2023-04-19_07-50-52.csv') # STGCN IT-STGCN
df12 = pd.read_csv('./simulation_results/2023-04-19_09-30-25.csv') # STGCN IT-STGCN
df13 = pd.read_csv('./simulation_results/2023-04-19_15-32-55.csv') # STGCN IT-STGCN
df14 = pd.read_csv('./simulation_results/2023-04-19_17-12-06.csv') # STGCN IT-STGCN
df15 = pd.read_csv('./simulation_results/2023-04-19_23-07-36.csv') # STGCN IT-STGCN
df16 = pd.read_csv('./simulation_results/2023-04-20_00-46-43.csv') # STGCN IT-STGCN
df17 = pd.read_csv('./simulation_results/2023-04-20_06-51-34.csv') # STGCN IT-STGCN
df18 = pd.read_csv('./simulation_results/2023-04-20_08-30-27.csv') # STGCN IT-STGCN
df19 = pd.read_csv('./simulation_results/2023-04-20_14-28-35.csv') # STGCN IT-STGCN
df20 = pd.read_csv('./simulation_results/2023-04-20_16-08-39.csv') # STGCN IT-STGCN
df21 = pd.read_csv('./simulation_results/2023-04-20_22-09-37.csv') # STGCN IT-STGCN
df22 = pd.read_csv('./simulation_results/2023-04-20_23-48-26.csv') # STGCN IT-STGCN
df23 = pd.read_csv('./simulation_results/2023-04-21_05-36-47.csv') # STGCN IT-STGCN
df24 = pd.read_csv('./simulation_results/2023-04-21_15-26-00.csv') # STGCN IT-STGCN
df25 = pd.read_csv('./simulation_results/2023-04-21_23-27-11.csv') # STGCN IT-STGCN
df26 = pd.read_csv('./simulation_results/2023-04-22_07-46-08.csv') # STGCN IT-STGCN
df27 = pd.read_csv('./simulation_results/2023-04-22_15-45-20.csv') # STGCN IT-STGCN
df28 = pd.read_csv('./simulation_results/2023-04-22_22-57-31.csv') # STGCN IT-STGCN
df29 = pd.read_csv('./simulation_results/2023-04-23_07-00-15.csv') # STGCN IT-STGCN
df30 = pd.read_csv('./simulation_results/2023-04-23_15-18-02.csv') # STGCN IT-STGCN
df31 = pd.read_csv('./simulation_results/2023-04-23_15-22-36.csv') # GNAR 70%
# baseline
df32 = pd.read_csv('./simulation_results/2023-04-29_06-54-40.csv') # GNAR 
df33 = pd.read_csv('./simulation_results/2023-04-30_18-55-12.csv')
df34 = pd.read_csv('./simulation_results/2023-05-01_02-55-33.csv')
df35 = pd.read_csv('./simulation_results/2023-05-01_10-21-15.csv')
df36 = pd.read_csv('./simulation_results/2023-05-01_19-23-57.csv')
df37 = pd.read_csv('./simulation_results/2023-05-02_01-10-53.csv')
df38 = pd.read_csv('./simulation_results/2023-05-02_08-26-53.csv')
df39 = pd.read_csv('./simulation_results/2023-05-02_16-00-40.csv')
df40 = pd.read_csv('./simulation_results/2023-05-03_00-34-09.csv')
df41 = pd.read_csv('./simulation_results/2023-05-03_08-04-42.csv')
df42 = pd.read_csv('./simulation_results/2023-05-03_15-50-50.csv')
df43 = pd.read_csv('./simulation_results/2023-05-03_23-46-56.csv')
df44 = pd.read_csv('./simulation_results/2023-05-04_05-22-59.csv')
df45 = pd.read_csv('./simulation_results/2023-05-04_09-22-37.csv')
df46 = pd.read_csv('./simulation_results/2023-05-04_15-00-57.csv')
df47 = pd.read_csv('./simulation_results/2023-05-04_23-41-21.csv')
df48 = pd.read_csv('./simulation_results/2023-05-05_07-23-04.csv')
df49 = pd.read_csv('./simulation_results/2023-05-05_15-03-17.csv')
df50 = pd.read_csv('./simulation_results/2023-05-06_05-18-07.csv')
df51 = pd.read_csv('./simulation_results/2023-05-06_12-57-14.csv')
df52 = pd.read_csv('./simulation_results/2023-05-06_19-10-23.csv')
df53 = pd.read_csv('./simulation_results/2023-05-07_03-20-10.csv')
df54 = pd.read_csv('./simulation_results/2023-05-07_11-26-24.csv')
df55 = pd.read_csv('./simulation_results/2023-05-08_00-04-56.csv')
df56 = pd.read_csv('./simulation_results/2023-05-08_04-27-01.csv')
df57 = pd.read_csv('./simulation_results/2023-05-08_10-06-55.csv')
df58 = pd.read_csv('./simulation_results/2023-05-08_17-50-36.csv')
df59 = pd.read_csv('./simulation_results/2023-05-09_03-28-08.csv')
df60 = pd.read_csv('./simulation_results/2023-05-09_11-08-10.csv')
df61 = pd.read_csv('./simulation_results/2023-05-09_20-11-45.csv')

data = pd.concat([df1,df2,df3,df4,df5,df7,df8,df9,df10,df11,df12,df13,df14,df15,df16,df17,df18,
                 df19,df20,df21,df22,df23,df24,df25,df26,df27,df28,df29,df30,df31,df32,df33,df34,
                 df35,df36,df37,df38,df39,df40,df41,df42,df43,df44,df45,df46,df47,df48,df49,df50,
                 df51,df52,df53,df54,df55,df56,df57,df58,df59,df60,df61],axis=0)

data.to_csv('./simulation_results/Real_simulation/windmillsmall.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/windmillsmall.csv')

data.query("method=='GNAR' and mrate ==0")['mse'].unique()

array([1.64923024])

data.query("method!='GNAR' and mrate ==0 ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',height=800)

random

data.query("method=='GNAR' and mrate !=0")['mse'].unique()

array([1.64923024])

data.query("method!='GNAR' and mtype =='rand' ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=800)

block

df1 = pd.read_csv('./simulation_results/2023-04-24_02-48-08.csv') # STGCN IT-STGCN block
df2 = pd.read_csv('./simulation_results/2023-04-24_10-57-10.csv') # STGCN IT-STGCN
df3 = pd.read_csv('./simulation_results/2023-04-24_18-53-34.csv') # STGCN IT-STGCN
df4 = pd.read_csv('./simulation_results/2023-04-25_02-30-27.csv') # STGCN IT-STGCN
df5 = pd.read_csv('./simulation_results/2023-04-25_10-48-46.csv') # STGCN IT-STGCN
df6 = pd.read_csv('./simulation_results/2023-04-25_10-53-14.csv') # GNAR 
df7 = pd.read_csv('./simulation_results/2023-04-25_18-40-53.csv') # STGCN IT-STGCN
df8 = pd.read_csv('./simulation_results/2023-04-25_23-30-08.csv') # STGCN IT-STGCN
df9 = pd.read_csv('./simulation_results/2023-04-26_04-15-00.csv') # STGCN IT-STGCN
df10 = pd.read_csv('./simulation_results/2023-04-27_07-59-36.csv') # STGCN IT-STGCN
df11 = pd.read_csv('./simulation_results/2023-04-27_15-29-00.csv') # STGCN IT-STGCN
df12 = pd.read_csv('./simulation_results/2023-04-27_23-37-18.csv') # STGCN IT-STGCN
df13 = pd.read_csv('./simulation_results/2023-04-28_08-21-54.csv') # STGCN IT-STGCN
df14 = pd.read_csv('./simulation_results/2023-04-28_16-06-55.csv') # STGCN IT-STGCN
df15 = pd.read_csv('./simulation_results/2023-04-28_21-19-37.csv') # STGCN IT-STGCN
df16 = pd.read_csv('./simulation_results/2023-04-29_03-07-03.csv') # STGCN IT-STGCN
df17 = pd.read_csv('./simulation_results/2023-04-29_09-00-42.csv') # STGCN IT-STGCN
df18 = pd.read_csv('./simulation_results/2023-04-29_19-07-49.csv') # STGCN IT-STGCN
df19 = pd.read_csv('./simulation_results/2023-04-30_05-14-07.csv') # STGCN IT-STGCN
df20 = pd.read_csv('./simulation_results/2023-04-30_15-23-16.csv') # STGCN IT-STGCN
df21 = pd.read_csv('./simulation_results/2023-05-01_00-16-37.csv') # STGCN IT-STGCN
df22 = pd.read_csv('./simulation_results/2023-05-01_07-41-52.csv') # STGCN IT-STGCN
df23 = pd.read_csv('./simulation_results/2023-05-01_16-21-41.csv') # STGCN IT-STGCN
df24 = pd.read_csv('./simulation_results/2023-05-01_23-38-23.csv') # STGCN IT-STGCN
df25 = pd.read_csv('./simulation_results/2023-05-02_13-51-13.csv') # STGCN IT-STGCN
df26 = pd.read_csv('./simulation_results/2023-05-02_21-43-26.csv') # STGCN IT-STGCN
df27 = pd.read_csv('./simulation_results/2023-05-03_06-04-32.csv') # STGCN IT-STGCN
df28 = pd.read_csv('./simulation_results/2023-05-03_13-43-11.csv') # STGCN IT-STGCN
df29 = pd.read_csv('./simulation_results/2023-05-03_21-58-04.csv') # STGCN IT-STGCN
df30 = pd.read_csv('./simulation_results/2023-05-04_04-39-00.csv') # STGCN IT-STGCN

data = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9,df10,df11,df12,df13,df14,df15,df16,
                 df17,df18,df19,df20,df21,df22,df23,df24,df25,df26,df27,df28,df29,df30],axis=0)

data.to_csv('./simulation_results/Real_simulation/windmillsmall_block.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/windmillsmall_block.csv')

data.query("method=='GNAR'")['mse'].unique()

array([1.64923024])

data.query("method!='GNAR' and mtype =='block' ").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=800)

Windmillsmall DCRNN result

df1 = pd.read_csv('./simulation_results/2023-05-15_11-59-18.csv')
# df2 = pd.read_csv('./simulation_results/2023-05-15_05-15-48.csv')
# df3 = pd.read_csv('./simulation_results/2023-05-15_08-26-11.csv')
# df4 = pd.read_csv('./simulation_results/2023-04-23_13-13-49.csv')

data = pd.concat([df1],axis=0)

data.to_csv('./simulation_results/DCRNN/windmillsmall_DCRNN.csv',index=False)

data = pd.read_csv('./simulation_results/DCRNN/windmillsmall_DCRNN.csv')

Montevideobus

df1 = pd.read_csv('./simulation_results/2023-04-30_23-28-01.csv') # lags 8
df2 = pd.read_csv('./simulation_results/2023-05-01_01-48-57.csv') # lags 8
df3 = pd.read_csv('./simulation_results/2023-05-01_04-10-06.csv') # lags 8
df4 = pd.read_csv('./simulation_results/2023-05-01_06-29-43.csv') # lags 8
df5 = pd.read_csv('./simulation_results/2023-05-01_08-56-25.csv') # lags 8
df6 = pd.read_csv('./simulation_results/2023-05-01_11-21-53.csv') # lags 8
df7 = pd.read_csv('./simulation_results/2023-05-01_14-35-28.csv') # lags 4
df8 = pd.read_csv('./simulation_results/2023-05-01_17-41-15.csv')
df9 = pd.read_csv('./simulation_results/2023-05-01_22-34-25.csv')
df10 = pd.read_csv('./simulation_results/2023-05-01_20-14-49.csv')
df11 = pd.read_csv('./simulation_results/2023-05-02_01-12-01.csv')
df12 = pd.read_csv('./simulation_results/2023-05-02_03-31-06.csv')
df13 = pd.read_csv('./simulation_results/2023-05-02_05-47-02.csv') # STGCN IT-STGCN
df14 = pd.read_csv('./simulation_results/2023-05-02_08-06-05.csv') # STGCN IT-STGCN
df15 = pd.read_csv('./simulation_results/2023-05-02_10-22-46.csv') # STGCN IT-STGCN
df16 = pd.read_csv('./simulation_results/2023-05-02_12-55-51.csv') # STGCN IT-STGCN
df17 = pd.read_csv('./simulation_results/2023-05-02_15-20-11.csv') # STGCN IT-STGCN
df18 = pd.read_csv('./simulation_results/2023-05-02_18-02-21.csv') # STGCN IT-STGCN
df19 = pd.read_csv('./simulation_results/2023-05-02_20-30-09.csv') # STGCN IT-STGCN
df20 = pd.read_csv('./simulation_results/2023-05-02_23-27-13.csv') # STGCN IT-STGCN
df21 = pd.read_csv('./simulation_results/2023-05-03_06-49-15.csv') # STGCN IT-STGCN
df22 = pd.read_csv('./simulation_results/2023-05-03_04-25-39.csv') # STGCN IT-STGCN
df23 = pd.read_csv('./simulation_results/2023-05-03_02-15-10.csv') # STGCN IT-STGCN
df24 = pd.read_csv('./simulation_results/2023-05-03_09-11-42.csv') # STGCN IT-STGCN
df25 = pd.read_csv('./simulation_results/2023-05-03_11-51-31.csv') # STGCN IT-STGCN
df26 = pd.read_csv('./simulation_results/2023-05-03_14-26-55.csv') # STGCN IT-STGCN
df27 = pd.read_csv('./simulation_results/2023-05-03_16-53-12.csv') # STGCN IT-STGCN
df28 = pd.read_csv('./simulation_results/2023-05-03_19-26-00.csv') # STGCN IT-STGCN
df29 = pd.read_csv('./simulation_results/2023-05-04_00-44-17.csv') # STGCN IT-STGCN
df30 = pd.read_csv('./simulation_results/2023-05-04_03-00-08.csv') # STGCN IT-STGCN

data = pd.concat([df1,df2,df3,df4,df5,df6,df7,df8,df9,df10,df11,df12,df13,df14,df15,df16,df17,df18,
                 df19,df20,df21,df22,df23,df24,df25,df26,df27,df28,df29,df30],axis=0)

data.to_csv('./simulation_results/Real_simulation/monte.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/monte.csv')

Baseline

data.query("mrate==0 and method!='GNAR'").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=600)

random

data.query("method=='GNAR'").groupby('mrate')['mse'].unique()

mrate
0.0    [1.0619367361068726, 1.068463921546936]
0.3    [1.0619367361068726, 1.068463921546936]
0.4    [1.0619367361068726, 1.068463921546936]
0.8    [1.0619367361068726, 1.068463921546936]
0.9    [1.0619367361068726, 1.068463921546936]
Name: mse, dtype: object

data.query("mtype=='rand' and mrate !=0 and method!='GNAR' and mrate!=0.8 and mrate!=0.9").sort_values('lags').plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=800)

data.query("mtype=='rand' and mrate !=0 and method!='GNAR' and mrate!=0.3 and mrate!=0.4").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='inter_method',height=800)

block

df1 = pd.read_csv('./simulation_results/2023-05-04_21-03-21.csv')
df2 = pd.read_csv('./simulation_results/2023-05-05_12-10-44.csv')
df3 = pd.read_csv('./simulation_results/2023-05-06_12-42-22.csv')
df4 = pd.read_csv('./simulation_results/2023-05-06_15-40-47.csv')

data = pd.concat([df1,df2,df3,df4],axis=0)

data.to_csv('./simulation_results/Real_simulation/monte_block.csv',index=False)

data = pd.read_csv('./simulation_results/Real_simulation/monte_block.csv')

data.query("mtype=='block' and method=='GNAR'")['mse'].mean()

1.0652003288269043

data.query("mtype=='block' and method!='GNAR'").plot.box(backend='plotly',x='mrate',color='method',y='mse',facet_col='lags',facet_row='nof_filters',height=1200)