【2008-11-03】詹姆斯·佩內貝克(James W. Pennebaker)對單詞計數的興趣始於20多年前。當時他進行了幾項研究,結果均顯示:遭受心靈創傷後願意盡情傾訴的人往往比絕口不談的人心理更健康。他非常好奇,人們使用的每一個單詞中到底隱藏了多少信息——即便是最不起眼的「我」、「你」等詞。
原文來自紐約時報 He Counts Your Words (Even Those Pronouns)
在中文詞彙特性速描系統上除了一般的關鍵詞及語境查詢外,更提供了詞彙特性速描(word sketches) 、語法關係以及同近義詞分析等自動產生的語法知識。「中文詞彙特性速描系統」與十四億字的LDC Chinese Gigaword語料庫結合後,提供了絕大部分中文詞彙實際使用的規則性描述,可應用於辭典編撰、華語文教學、語言學研究與自然語言處理。