Effects of High-Order Co-occurrences on Word Semantic Similarities

Benoît Lemaire,G. Denhière

Published 2006 in arXiv.org

ABSTRACT

Nous presentons un modele informatique de la construction de la signification des mots par l'exposition aux textes, dans le but de simuler, paragraphe apres paragraphe, les effets des valeurs de cooccurrence sur les similarites semantiques intermots. La similarite est ici consideree comme une association semantique. Les resultats montrent que la similarite entre deux mots M1 et M2 augmente fortement avec leur cooccurrence, diminue avec l'occurrence de M1 sans M2 ou de M2 sans M1, et augmente legerement avec des cooccurrences d'ordre superieur. Operationnaliser la similarite par la frequence de cooccurrence introduit donc probablement un biais : tout d'abord, il existe des cas pour lesquels il existe une similarite sans cooccurrence, et d'autre part, la frequence de cooccurrence surestime la similarite.

PUBLICATION RECORD

CITATION MAP

EXTRACTION MAP

CLAIMS

  • No claims are published for this paper.

CONCEPTS

  • No concepts are published for this paper.

REFERENCES

Showing 1-21 of 21 references · Page 1 of 1

CITED BY

Showing 1-96 of 96 citing papers · Page 1 of 1