changes after tests

8244dce3 · kulcsar · 45536356 · 8244dce3 · 8244dce3 · 8244dce3
Commit 8244dce3 authored 2 years ago by kulcsar
--- a/Code/__pycache__/evaluation.cpython-39.pyc
+++ b/Code/__pycache__/evaluation.cpython-39.pyc
--- a/Code/__pycache__/models.cpython-39.pyc
+++ b/Code/__pycache__/models.cpython-39.pyc
--- a/Code/__pycache__/preprocess.cpython-39.pyc
+++ b/Code/__pycache__/preprocess.cpython-39.pyc
--- a/Code/__pycache__/train.cpython-39.pyc
+++ b/Code/__pycache__/train.cpython-39.pyc
--- a/Code/evaluation.py
+++ b/Code/evaluation.py
@@ -45,7 +45,7 @@ def evaluate_model(model, name,test_dataset, batch_size, imdb=False):
 		with torch.no_grad():
 			if name[0] == "b":
 				if imdb==False:
-					print("Evaluating Bert model")
+					#print("Evaluating Bert model")
 					inputs = {'input_ids': batch[0],
 							  'attention_mask': batch[1],
 							  'token_type_ids': batch[2],
@@ -53,14 +53,14 @@ def evaluate_model(model, name,test_dataset, batch_size, imdb=False):
 							  'end_position': batch[4],
 							  'labels': batch[5]}
 				elif imdb==True:
-					print("Evaluating Bert model on imdb")
+					#print("Evaluating Bert model on imdb")
 					inputs={'input_ids':batch[0],
 							'attention_mask':batch[1],
 							'token_type_ids':batch[2],
 							'labels':batch[3]}

 			if name[0] == "r":
-				print("Evaluating roberta model")
+				#print("Evaluating roberta model")
 				inputs = {'input_ids': batch[0],
 						  'attention_mask': batch[1],
 						  'start_position': batch[2],

--- a/Code/models.py
+++ b/Code/models.py
@@ -6,7 +6,7 @@ import evaluate
 import json
 import random
 import math
-import train
+import Code.train
 import copy
 from tqdm.auto import tqdm
 from transformers import BertTokenizer, RobertaTokenizer, BertModel, RobertaModel, RobertaPreTrainedModel, RobertaConfig,  BertConfig, BertPreTrainedModel, PreTrainedModel, AutoModel, AutoTokenizer, AutoConfig
@@ -117,7 +117,7 @@ class WordClassificationModel(torch.nn.Module):

        if self.tmix==True and mixepoch == True:
            outputs = (logits,) + outputs[2:]
-            loss = train.cross_entropy(logits[:math.floor((logits.size()[0]/2))], outputs[1][:math.floor((outputs[1].size()[0]/2))], lambda_value) #special CEL for soft labels 
+            loss = Code.train.cross_entropy(logits[:math.floor((logits.size()[0]/2))], outputs[1][:math.floor((outputs[1].size()[0]/2))], lambda_value) #special CEL for soft labels 
            outputs = (loss,) + outputs
        
        else:

--- a/Code/preprocess.py
+++ b/Code/preprocess.py
@@ -218,7 +218,7 @@ def tokenizer_new(tokenizer, input, max_length, masked=False, old_dataset=False,
 			else:
 				all_token_type_ids.append(context_token_type_ids)

-
+	if tokenizer.name_or_path[0] =="r":
 		print("roberta tokenizer")
 		dataset=TensorDataset(torch.tensor(all_input_ids, dtype=torch.long).to("cuda") , 
 							torch.tensor(all_attention_masks, dtype=torch.long).to("cuda") ,

--- a/Code/train.py
+++ b/Code/train.py
 import torch
 import tqdm
 import numpy as np
-import evaluation
+import Code.evaluation
 import evaluate
 import json
 import random
 import math
 from tqdm.auto import tqdm
-from transformers import BertTokenizer, RobertaTokenizer, BertModel, RobertaModel, RobertaPreTrainedModel, RobertaConfig,  BertConfig, BertPreTrainedModel, PreTrainedModel, AutoModel, AutoTokenizer
+from transformers import BertTokenizer, RobertaTokenizer, BertModel, RobertaModel, RobertaPreTrainedModel, RobertaConfig,  BertConfig, BertPreTrainedModel, PreTrainedModel, AutoModel, AutoTokenizer, Trainer, TrainingArguments
 from torch.utils.data import DataLoader, RandomSampler, SequentialSampler, TensorDataset
 from transformers import AdamW, get_scheduler
 from torch import nn
@@ -49,7 +49,7 @@ def train(model, name,train_dataset, test_dataset, seed, batch_size, test_batch_
 	Returns: Evaluation Results for train and test dataset in Accuracy, F1, Precision and Recall"""
 	model.train().to(device)
 	train_sampler = RandomSampler(train_dataset)
-	train_dataloader=DataLoader(train_dataset, sampler=train_sampler, batch_size=batch_size, shuffle=True)
+	train_dataloader=DataLoader(train_dataset, sampler=train_sampler, batch_size=batch_size)
 	num_training_steps=num_epochs*len(train_dataloader)

 	if mlp_learning_rate==None:
@@ -77,11 +77,15 @@ def train(model, name,train_dataset, test_dataset, seed, batch_size, test_batch_
 								'start_position': batch[3],
 								'end_position': batch[4],
 								'labels': batch[5]}
+						labels=batch[5]
+						start_positions=batch[3]
+						end_positions=batch[4]
 					if imdb==True:
 						inputs={'input_ids':batch[0],
 								'attention_mask': batch[1],
 								'token_type_ids': batch[2],
 								'labels': batch[3]}
+					
 				if tmix==True:
 					if imdb == False:
 						print("this is mixup epoch")
@@ -94,6 +98,9 @@ def train(model, name,train_dataset, test_dataset, seed, batch_size, test_batch_
 									'mixepoch': True,
 									'mixlayer':mixlayer,
 									'lambda_value':lambda_value}
+						labels=batch[5]
+						start_positions=batch[3]
+						end_positions=batch[4]
 					if imdb==True:
 						print("this is a mixup epoch with imdb")
 						inputs={'input_ids':batch[0],
@@ -124,7 +131,7 @@ def train(model, name,train_dataset, test_dataset, seed, batch_size, test_batch_
 			model.zero_grad()

 			if epoch==mixepoch:
-				#print("mixepoch")
+				print("mixepoch")
 				if mixup == True:
 					#calculate new last hidden states and predictions(logits)
 					new_matrix_batch, new_labels_batch = mixup_function(outputs[2], labels, lambda_value)
@@ -156,7 +163,7 @@ def train(model, name,train_dataset, test_dataset, seed, batch_size, test_batch_

 	return evaluation_test, evaluation_train

-def cross_entropy(logits, target):
+def cross_entropy(logits, target, l):
 	"""
    Computes the cross-entropy loss between the predicted logits and the target labels.
    
@@ -182,7 +189,7 @@ def cross_entropy(logits, target):
 			#calculation with indexing (- 1-label * )
 			results = torch.cat((loss_clear_labels.view(1), results), dim=0)
 		else:
-			mixed_vec = torch.tensor([value, 1-value]) #creating on-hot mixed vec.
+			mixed_vec = torch.tensor([l, 1-l]) #creating on-hot mixed vec.
 			logprobs = torch.nn.functional.log_softmax(lg, dim=1)#logits in log probabilities
 			loss_mixed_labels = -((mixed_vec[0] * logprobs[0][0]) + (mixed_vec[1] * logprobs[0][1]))
 			#calculation for mixed with indexing
@@ -220,7 +227,7 @@ def mixup_function(batch_of_matrices, batch_of_labels, l):
 	return results, result_labels

 	
-def train_salami(model, seed, train_set, test_set, batch_size, test_batch_size, learning_rate, epochs):
+def train_salami(model,name, seed, train_set, test_set, batch_size, test_batch_size, learning_rate, epochs):
 	"""Train loop of the salami group"""
 	results=[]
 	training_args = TrainingArguments(
@@ -244,7 +251,7 @@ def train_salami(model, seed, train_set, test_set, batch_size, test_batch_size,
 		train_dataset=train_set,
 		eval_dataset=test_set,
 		args=training_args,
-		compute_metrics=evaluation.evaluate_model
+		compute_metrics=Code.evaluation.compute_metrics
 		)

 	trainer.train()

--- a/main.py
+++ b/main.py
@@ -67,12 +67,12 @@ def run(raw_args):
 	if args.train_loop=="swp":
 		evaluation_test, evaluation_train = Code.train.train(model, args.architecture, train_dataset, test_dataset, args.random_seed,args.batch_size, args.test_batch_size,args.epochs,args.imdb,  args.mix_up, args.lambda_value, args.mixepoch, args.tmix, args.mixlayer,   args.learning_rate, args.second_learning_rate, args.model_save_path)
 	elif args.train_loop=="salami":
-		evaluation_test = Code.train.train_salami(model,args.random_seed, train_dataset, test_dataset, args.batch_size, args.test_batch_size, args.learning_rate, args.epochs)
+		evaluation_test = Code.train.train_salami(model,args.architecture, args.random_seed, train_dataset, test_dataset, args.batch_size, args.test_batch_size, args.learning_rate, args.epochs)
 	else:
 		print("no eligible train loop selected")
 	
-	#save
-	if isinstance(args.save_directory, str): 
+	#save 
+	if args.save_directory !=None:
 		with open(args.save_directory, "x") as f:
 			f.write(str(args))
 			f.write(str(evaluation_test))
@@ -230,7 +230,8 @@ if __name__ == "__main__":
 	parser.add_argument(
 		"-sd",
 		"--save_directory",
-		help="Destination directory for the output results of the run")
+		help="Destination directory for the output results of the run",
+		default=None)
 	
 	parser.add_argument(
 		"-msp",