Ich bin mir nicht sicher, ob nicht WSI doch einfacher wäre, da wir bei WSD ja davon ausgehen müssen, dass das gesuchte Element auch tatsächlich in unserem sense inventory vorhanden ist? Das könnte evtl zu Problemen führen
Ja, das stimmt. Andererseits, Semantic Knowledge Bases sind ziemlich groß (z.B: YAGO ca. 2 mln entities) und die Wahrscheinlichkeit, dass das gesuchte Element da vorhanden ist, ist auch relativ hoch
Baseline: sen2vec mit cosine similarity with Wikipedia/YAGO as Sense repository
Ideas for out approach: Better Embeddings (with Features) + classifier with Wikipedia Dump 2013 as Train Corpus + sense combination (simulated annealing / similarity graph)