2014年4月12日 星期六

[Research] 文章質量計算方法


看完研究資料後的心得




文章質量 = 關鍵字數量 / 文章中所切出(包括重複)的關鍵字總數

文章涵蓋範圍 = 關鍵字數量 / 所有文章關鍵字總數


句子資訊量 = 句長/文中最長句

句子質量 = 不重複字長/句長

句子代表性 = Σ相似度(0 ~ 1) / 句子總數

文章代表性 = 重要關鍵字數量/所有關鍵字數量

沒有留言:

張貼留言