Canadian Journal of Speech-Language Pathology and Audiology

Evidence-Based Selection of Word Frequency Lists

Author(s) Christopher J. Lee
Volume 27
Number 3
Year 2003
Page(s) 172-175
Language English
Keywords word
Abstract There are numerous corpora that list the frequency with which particular words occur in the English language. One factor guiding the selection and use of a corpus is the total number of words sampled in compiling its frequencies. Although it has been suggested that many words are used with different frequency in print than in speech, the results of confirmatory factor analyses reported in this paper provide little justification for distinguishing between written English and spoken English when selecting a word frequency list. Those concerned with the appropriateness of various corpora should give priority to the size of the sample of words rather than the source of the sample of words.

Il existe plusieurs corpus qui énumèrent la fréquence d’utilisation de certains mots dans la langue anglaise. Un des facteurs qui guide la sélection et l’utilisation d’un corpus est le nombre total de mots échantillonnés lors de la compilation de fréquence d’utilisation des mots. Même s’il a été suggéré que plusieurs mots ont une fréquence différente d’utilisation à l’écrit qu’à l’oral, les résultats de la présente étude confirmant les facteurs d’analyse fournissent très peu de raisons justifiant l’utilisation différente de listes de fréquence de mots pour l’anglais écrit et l’anglais parlé. Ceux préoccupés par le choix approprié de corpus devraient plutôt donner priorité à la grandeur de l’échantillon de mots utilisés plutôt qu’à sa source.
Record ID 833
