謠言止於大數據:從社群媒體數據找到資訊來源、勾勒假新聞樣貌,避免擴大成社會衝突

圖/Glen Carrie @ unsplash

 

文/Valerie Hung

聯合國 2030 年永續發展議程(2030 Agenda for Sustainable Development)強調,沒有和平就沒有永續發展,而沒有永續發展就沒有和平。

但過去支援和平與安全的傳統分析方法,如調查(survey)與焦點團體座談(focus group discussion),受到新型態戰爭與衝突的嚴峻挑戰。例如傳統分析方式產出的小數據資料無法適時反應新興、高速發展中的難題;分析人員也會受到衝突地帶的保安限制,較難與當地人互動,同時面對跨語言的語境問題等。大數據新興科技,不但能填補其中的資訊落差,更可能協助永續發展及人道救援工作者衡量專案與計畫的成效,並根據各地情況彈性的調整執行方法。

聯合國全球脈動計畫UN Global Pluse)位於烏干達首都坎帕拉(Kampala)的實驗室,就運用大數據與人工智慧技術支援非洲地區的永續發展目標。他們與合作夥伴嘗試通過索馬利亞的社群媒體與烏干達的廣播節目的數據資料,找出達成 SDG16「促進公正、和平且包容的社會」的方法。這 2 個實驗案例都被整理在《試驗大數據與人工智慧如何支持和平與安全》(Experimenting with Big Data and Artificial Intelligence to Support Peace and Security)報告中,讓我們一起來了解吧!

圖/試驗大數據與人工智慧如何支持和平與安全》(Experimenting with Big Data and Artificial Intelligence to Support Peace and Security)

從社群媒體數據找到訊息來源

社群媒體讓我們能接觸、影響,甚至大規模動員群眾,而許多公司也提供資料探勘(data mining)、即時社群媒體監測或金融市場變化監測工具,協助企業掌握品牌辨識度、活動成效及市場趨勢等資訊。聯合國團隊採類似的技術,蒐集與分析臉書上的公開資料,了解索馬利亞人對與和平及安全相關議題的看法。團隊預估索馬利亞約有 120 萬名臉書使用者(佔總人口的 8%),他們被認為大多是住在都市、具有識字能力的年輕男性,因此研究結果僅能反應出這類型人口在社群媒體上的公開行為。

資料探勘過程為──

  1. 開發軟體,串接臉書圖形化 API (Graph API)(註 1),藉以蒐集公開的臉書社團資料。
  2. 依據社團位置、名稱與成員數量等條件,電腦挑出 2300 個公開社團(註 2)進行分析。
  3. 透過人力分析其餘 200 個沒被軟體辨識出的臉書社團。
  4. 發展一套跟議題關鍵字相關的分類法,過濾公開貼文、評論與對評論的反應等 3 組資料。
  5. 依照分類法和分析時間表定義出一套查詢條件(query)。
  6. 根據查詢條件篩選評論。
  7. 將保留了個人在公開論壇發言匿名性的結果加以彙總。
  8. 將貼文分類。

實驗最後成果則透過意見領袖(influencer,此處指社群媒體上可接觸大量受眾、受這些受眾信任、且能影響他們想法的個人或非個人臉書用戶)、假新聞(fake news)和熱門話題(trending topic)3 大分析進一步呈現。

圖/Markus Spiske @ unsplash

由大數據分辨假新聞,並彙整有效資料供分析使用

隨著社群媒體成為團體散播理念與製造輿論的工具,恐怖組織也開始使用社群媒體平臺進行議題宣傳與吸收非洲的青年。研究團隊選擇「貪腐」為主題,嘗試通過社群媒體數據找到那些可能正在影響其他網路用戶意見的社群。團隊先瀏覽所有曾發布貪腐相關話題的社團,然後根據發文數、評論數、分享數等 3 項變數將社群進行排名。結果發現,2500 個公開社群中有 114 個社群曾發布貪腐相關內容,而 3 項變因中登上前 5 名的意見領袖,僅有一個「不是」新聞機構

假新聞可能影響選舉、激起社會對立,或是煽動群眾對某些目標施行暴力。即時辨識出假新聞的存在,將有助於對抗那些散播假新聞的社群。研究團隊先找出假新聞、釐清其結構,然後訓練電腦辨識假新聞及協助散播的社群。結果發現,所有的假消息貼文都提到索馬利亞政府的高階政府官員,由 3 至 4 個不同帳號,在 1 到 2 分鐘內發布超過 20 次(大多貼文包含「祕密」、「大」等字眼),且內容長度近乎整整一頁(非假消息貼文大多短短幾行)。此外,100 個發文量較大的帳號中有 15 個是假的,他們大多盜用真實存在的媒體機構名號,或政治人物、記者或社運人士的身分。例如,雖然索馬利亞前總統阿邁德(Sharif Sheikh Ahmed)沒有設置官方帳號,但研究團隊發現至少有 5 個假帳號使用他的名字。

熱門話題指的是在特定時間內受到大量社群媒體使用者關注的議題。分析熱門話題有助於與和平與安全相關的政策的調整。研究團隊開發一套基於統計方法與演算法TF-IDF)技術(註 3)的軟體, 除了能自動偵測 48 小時內最常被重複使用的字詞,例如「溝通」、「公平」,也能辨識出與特定關鍵字最相關的字群。

索馬利亞前總統阿邁德(Sharif Sheikh Ahmed)沒有設置官方帳號,但研究團隊發現至少有 5 個假帳號使用他的名字。圖/《試驗大數據與人工智慧如何支持和平與安全》(Experimenting with Big Data and Artificial Intelligence to Support Peace and Security

通過廣播節目蒐集民意,了解基層社會的想法

聯合國教科文組織(UNESCO)指出,在非洲,廣播是最可靠、可負擔的資訊擷取與分享媒介,且廣播節目是一個能改變大眾在衛生、暴力與 AIDS 等議題上的行為的溝通管道。

為了維持和平、公正且多元的社會,當民眾的行為出現可能威脅他人的轉變,就需要更好的方法即時掌握。聯合國全球脈動計畫(United Nations Global Pulse)自 3 年前起,嘗試通過烏干達廣播頻道,了解烏干達基層社會的想法,藉由分析廣播資料產生的定性資訊(qualitative information)協助建構起一套可預防暴力、衝突和社會緊張的早期預警系統

聯合國國際脈動開發一組工具包,能夠收集每天上百個小時的公開廣播內容資料、去除純音樂片段,運用卷積神經網路(Convolutional Neural Network)技術打造的自動語音辨識ASR)工具,將口語轉化為文字檔案。

圖/Jonathan Velasquez @ unsplash

謠言止於大數據:在謠言擴大成社會衝突前,提早發覺並處理

研究團隊將廣播電臺分類如下:黃金名單的廣播節目會討論基層事務並開放大眾電話參與討論;銀名單的廣播節目會討論基層、當地、國家與區域性事務,並開放民眾電話參與;銅名單包含新聞廣播節目;黑色名單則為運動、八卦娛樂、音樂等廣播節目。最後研究選定黃金名單與銀名單進行資料探勘。

本項案例將可納入早期預警系統資料庫的重要內容分成「謠言與錯誤觀念」(rumor and misconception)、「社會衝突」(social tension),以及「引發社會警報的見證」(testimonial that can cause social alarm)等 3 類。

謠言與錯誤觀念所引發的集體反應經常挑戰著社會穩定,並可能持續晉升為社會衝突,因此越早發覺,越能有效處理它們。報告舉例,2017 年 9 月政府官員指出,近期湧入烏干達的難民可能帶有疾病,考慮到大量尚未疫苗接種的兒童,可能導致疫情向外擴散;同年 10 月有廣播聽眾指出,當地的德國麻疹疫苗與抗結核病藥物已經短缺,他擔憂政府能否能負擔經費,又或是會買更多德國麻疹疫苗並分給難民。

圖/Hush Naidoo @ unsplash

社會衝突通常根源自長久的歷史、文化或宗教因素,隨著時間累積,並可能受到某些影響社會的突發性改變再次激發,甚至在集體記憶中又添上一筆帳。找出逐漸升溫的社會衝突,以及可能激發衝突的循環,對迅速反應有很大的幫助。報告舉例,廣播聽眾討論隨著難民潮湧入烏干達,他們擔憂難民除了帶來疾病、非烏干達的文化習慣,也帶著非法槍枝。

當個人見證者以負面方式碰觸到影響整個社會的基本結構性議題時,他們有可能引發社會警報。這些見證激發的集體反應有可能以和平或暴力的形式展現。如果你對這類型研究有興趣,聯合國全球脈動計畫正在開發全新工具「QataLog」,目前可讓使用者與夥伴協作,從社群媒體與廣播中提取有用的資訊,依照關心的議題進行分析,根據個人需求下註解與制定分類,同時提供翻譯、定位與文檔分類等自動化處理功能。


註解:

註 1:Graph API 是 Facebook 讓程式設計師可以用程式化的方式存取 Facebook 資料的系統化介面,舉凡使用者在 Facebook 上留下的任何資料、行為、足跡,都可以透過 Graph API 在適當的授權下存取。(資料來源:解析 Facebook 的 API 重大變更與 Cambridge Analytica 事件/AppWorks

註 2:原文使用  Group,本文譯為「社團」或「社群」,但並非單指「爆料公社」這類的臉書社團,更類似擁有大量跟蹤者(followers)的個人帳號及粉絲團。

註 3:TF-IDF 是一種用於資訊檢索與文字探勘的常用加權技術,為一種統計方法,用來評估單詞對於文件的集合或詞庫中一份文件的重要程度。(資料來源:文字探勘之前處理與 TF-IDF 介紹/臺灣大學計資中心


原文:USING BIG DATA AND AI TO SUPPORT PEACE AND SECURITY EFFORTS IN AFRICA


延伸閱讀:

司法是檢視國家的明鏡,也反應社會的包容度/SDGS-16(和平、正義與強而有力的機構)

從 MDGS 到 SDGS:強化氣候問題、追求和平、公正與包容

資安也是安全防護網的一環!日常生活中做好資訊安全管理,保障人權也保護弱勢

作者介紹

NPOst 編輯室

NPOst 公益交流站,隸屬社團法人臺灣數位文化協會,為一非營利數位媒體,專責報導臺灣公益社福動態,重視產業交流、公益發展,促進捐款人、政府、社群、企業、弱勢與社福組織之溝通,強化公益組織橫向連結,矢志成為臺灣最大公益交流平臺。另引進國際發展援助與國外組織動向,舉辦實體講座與年會,深入探究議題,激發討論與對話。其姐妹站為「泛傳媒」旗下之泛科學、泛科技、娛樂重擊等專業媒體。臉書:https://www.facebook.com/npost.tw