網絡輿情分析中,過度解讀情緒分析容易造成誤導

網絡輿情分析中,過度解讀情緒分析容易造成誤導

2018-01-02易研乾貨
現今,針對人工智能和大數據方面的關注和討論逐漸增多,尤其是在情緒分析(sentiment analysis)方面的研究和應用也逐漸增多。雖然當前可通過自動化語義判斷方法,包括人工智能機器學習算法等,結合自然語言處理技術文本挖掘技術,來判斷網民的情緒態度。但仍僅停留在情緒分析層面,即文本內容所表達的正面、負面或者中立的情緒態度,然而還不能做到判斷情緒的輕重程度。此外,因網絡用語的不規範或議題範圍廣泛,以及受眾不同的文本敘事方式和修辭方法等,給自動化情緒分析針對網絡文本的判斷增加了難度。 
澳門互聯網研究學會會長張榮顯博士對此進行了詳細解讀,強調情緒分析不等同於網民的傾向,情緒正負值不應解讀爲民意支持與反對,過度解讀會容易造成誤導,因爲它至少受到以下三種因素影響:  概念與測量從網絡文本中分析網民的情緒,無論是用正負面的模型或分類模型(例如快樂、悲傷、興奮等),在概念上,非等同於支持與否。比如說,對一個事件不滿意,但是並非等同於對其主體的不支持。對於做錯事情的明星,粉絲雖然可能不認同其某個行爲,但是對該明星還是持支持的態度。  
傳統民調中,針對具體面向的支持度,可以直接通過針對受訪者提問的方式進行點對點回答。而網絡文本中,網民的情緒態度混入了事情或者人物因素,那麽在這種非結構化的複雜表達方式和語境中,機器自動判斷出來的情緒結果與實際上的支持或者反對結果就會有偏差
  情景與語境

</section>

當前的自動化情緒分析,一方面,無法考量網絡表達的情景及語境,另一方面,難以分析語言使用方法,尤其是在中文表達中,如隱喻、反諷等修辭方法,會增加其識別的難度。 指涉對象網絡大數據中的文本分析通常以字、詞、句、段落等爲分析單位。目前,在技術上難以區分情緒態度的指涉對象。網民在表達意見時,很可能會談及多個對象,比如人物、組織機構和事件,情緒分析的結果難以和文本中的某個對象相匹配,換言之,情緒分析出的對象,是不明確的,甚至可能是沒有指涉對象。那麽這時候,機器自動分析出來的情緒態度結果就失去了意義。

發現

關於

產品

獎項

資訊

English繁體中文
退出登入