社交媒體情緒


每天從香港主流社交媒體和論壇中提取所有帖文(包括原文、留言、回覆)的文字數據, 以「自殺相關」的詞彙作配對, 統計相關帖子的總數, 來反映社會對自殺議題的關注程度。
文字數據經過處理後, 以機械學習方法分類每則帖文為: 「正面」、 「中性」和「負面」情緒。「中性」情緒是指正面和負面字句數量相等的帖文, 而篇幅過短的帖文, 則不會被分類。
另外從廣泛應用的「語文探索與字詞計算」(Linguistic Inquiry and Word Count, LIWC) 詞彙庫(中文版),加入適當的香港本土網絡用語和廣東話口語來提升準確度,整合出「憤怒」、「焦慮」、「悲傷」情緒的關鍵詞彙;再與「負面」情緒的帖文配對,從而統計憤怒, 焦慮和悲傷相關帖子的總數。
由於現時針對本地文化的自然語言處理並未成熟,因此自殺相關的情感分析仍在發展中。情感分析折線圖僅建議用作參考,以反映香港部分情況。

綱上社交評台資料及分析引擎由Meltwater提供