Clustering_RNN_hidden_state_space/run_small_experiment.py at master · DES-Lab/Clustering_RNN_hidden_state_space · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
import warnings

warnings.simplefilter(action='ignore', category=FutureWarning)

import torch
import torch.optim as optim
from aalpy.utils import load_automaton_from_file

from PushDownAutomaton import *
from RNN import get_model, Optimization
from automata_data_generation import get_tomita, get_mqtt_mealy, generate_data_from_automaton, AutomatonDataset, \
    get_coffee_machine
from clustering_comparison import compare_clustering_methods
from methods import conformance_test

save_dir = 'rnn_data'


def print_ambiguity(amb_res):
    for x in amb_res:
        print(f'{x[0]}: ambiguity: {x[1][0]}\t, weighted ambiguity {x[1][1]}')


device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
device_type = 'gpu' if device != 'cpu' else 'cpu'

experiments = [(get_tomita(1), 'tomita1'),
               (get_tomita(3), 'tomita3'),
               (get_tomita(7), 'tomita7'),
               (get_coffee_machine(), 'coffee'),
               (get_mqtt_mealy(), 'mqtt'),
               (load_automaton_from_file('automata_models/regex_paper.dot', automaton_type='dfa'), 'regex')]

# Add some context free languages
experiments.extend([
    (pda_for_L12(), 'CFG_L_12'),
    (pda_for_L13(), 'CFG_L_13'),
])

rnn_types = ['gru', ]
num_repeats_per_config = 1

num_training_samples = 50 * 1000
num_validation_samples = 2 * 1000

total_exp_configs = len(experiments) * len(rnn_types) * num_repeats_per_config
# Include sizes
total_exp_configs = total_exp_configs
print(f'Total number of experiments: {total_exp_configs}')

current_iteration = 0

# comment out if you want to see if loading of models works
perform_training = False

accuracy_results = dict()
clustering_results = dict()

accuracy_file = 'new_accuracy_results'
ambiguity_file = 'new_ambiguity_results'

for automaton, exp_name in experiments:
    print(exp_name)
    for rnn in rnn_types:
        optimal_size = len(automaton.get_input_alphabet()) * automaton.size
        sizes = [(1, int(optimal_size * 2))]

        for layers, nodes in sizes:
            for i in range(num_repeats_per_config):
                current_iteration += 1
                print(f'Automated driver progress: {round((current_iteration / total_exp_configs) * 100, 2)}%')

                print('--------------------------------------------------')
                exp_rnn_config = f'{exp_name}_{rnn}_{layers}_{nodes}_{i + 1}_{device_type}'
                model_weights_name = f'{save_dir}/models/exp_models/{exp_rnn_config}.pt'
                print(model_weights_name)

                if "CFG" in exp_name:
                    training_data, input_al, output_al = generate_data_from_pda(automaton,
                                                                                num_examples=num_training_samples)

                    validation_data, _, _ = generate_data_from_pda(automaton, num_examples=num_validation_samples)
                else:
                    training_data, input_al, output_al = generate_data_from_automaton(automaton,
                                                                                      num_examples=num_training_samples)
                    validation_data, _, _ = generate_data_from_automaton(automaton, num_examples=num_validation_samples)

                model_type = rnn if rnn in {'gru', 'lstm'} else 'rnn'
                activation_fun = rnn
                input_dim = len(input_al)
                output_dim = len(output_al)
                layer_dim = layers
                hidden_dim = nodes
                batch_size = 128
                dropout = 0.1 if layer_dim > 1 else 0
                n_epochs = 50
                learning_rate = 0.0005
                weight_decay = 1e-6

                data_handler = AutomatonDataset(input_al, output_al, batch_size)

                train, val = data_handler.create_dataset(training_data), data_handler.create_dataset(validation_data)

                model_params = {'input_dim': input_dim,
                                'hidden_dim': hidden_dim,
                                'layer_dim': layer_dim,
                                'output_dim': output_dim,
                                'nonlinearity': activation_fun,
                                'dropout_prob': dropout,
                                'data_handler': data_handler, }

                model = get_model(model_type, model_params)
                model.model_name = model_weights_name

                optimizer = optim.Adam(model.parameters(), lr=learning_rate, weight_decay=weight_decay)
                opt = Optimization(model=model, optimizer=optimizer)

                if perform_training:
                    print('Training a network')
                    opt.train(train, val, n_epochs=n_epochs, exp_name=model_weights_name, early_stop=True,
                              verbose=True, save=True, load=True)

                    opt.save(model_weights_name)
                else:
                    load_status = opt.load(model_weights_name)
                    if not load_status:
                        print(f'Can not find weights file of: {model_weights_name}')
                        continue
                    print('Model weights loaded')

                conf_test_res = 1 - conformance_test(model, automaton)
                accuracy_results[exp_rnn_config] = conf_test_res

                print('RNN accuracy:', conf_test_res)
                if 'CFG' in exp_name:
                    print('Computing clustering functions and their ambiguities (stackless)')
                    stackless = compare_clustering_methods(automaton, model, validation_data, reduced_cf=True)
                    print('Computing clustering functions and their ambiguities (stackfull)')
                    stackful = compare_clustering_methods(automaton, model, validation_data,
                                                          pda_stack_limit=3, reduced_cf=True)

                    print('Printing stackless ambiguity values')
                    print_ambiguity(stackful)
                    print('Printing stackful ambiguity values')
                    print_ambiguity(stackful)
                else:
                    print('Computing clustering functions and their ambiguities')
                    results = compare_clustering_methods(automaton, model, validation_data, reduced_cf=True)
                    print('Printing ambiguity values')
                    print_ambiguity(results)