資料科學距離NPO並不遙遠-兩個案例看資料科學怎麼幫助街友

一個人變成街友,成因可能很複雜,如果有機會深入了解一位街友個案的生命故事,可能會發現他們所遭遇的困境是由一連串、多重的因素所造成的。如此下來,我們要如何尋找多數街友的共同點,進而從這個共同點幫助街友改善他們的處境,甚至預防這些我們不樂見的情況發生呢?

「資料科學」距離 NPO 其實並不遙遠,以下是兩個 NPO 與資料分析單位合作的真實案例,分別來自英國與美國,或許可以提供想做類似應用的 NPO 夥伴們一些靈感來源。

案例一:英國街友團體 St Mungo’s Broadway 想知道,人在流落街頭之前、和脫離街頭生活之後,會向外界尋求哪些援助?

St Mungo’s Broadway 是英國一家專門服務街友的非營利組織,他們想知道,當一個人變得「無家可歸」之前,或是在進入 St Mungo’s Broadway 的支持系統以前,最常尋求什麼類型的協助?他們有很多關於無家可歸者的資料,或是住在 St Mungo’s Broadway 庇護所裡的人的資料;但是,相對來說,他們幾乎沒有這些人變成街友以前的相關資料。

St Mungo’s Broadway 的工作團隊想要解決的問題有以下三個:

1. 在落入街頭流浪前,人們通常會尋求哪些建議?(成為街友前,人們最需要什麼樣的幫助?)
2. St Mungo’s Broadway 如何為不同族群提供協助?
3. 離開 St Mungo’s Broadway 支持系統後的人們究竟過得如何?(是否仍需要其他幫助?)

沒想到,另一家提供全國人民免費諮詢民事訴訟問題的公益組織 Citizens Advice,他們所擁有的資料可以與 St Mungo’s Broadway 的資料互補。有了資料後,第一步是比對兩個組織分別所擁有的資料,確認兩邊重疊的身份-他們共找到 1,500 個不同身份的人同時出現在兩邊的資料中,工作人員把這些人的資料提煉出來並做匿名處理。三位 DataKind UK(英國一個用資料科學解決社會問題的單位)的成員幫 St Mungo’s Broadway 幫忙把這些資料「清洗」乾淨,也確保對照組的資料量夠大,還幫 St Mungo’s Broadway 定義出這些資料可以協助回答的問題。

》推薦閱讀:St Mungo’s Broadway 與議題利害關係者合作的精神,十分符合這週「非營利組織資訊科技運用座談會」下午場智庫驅動劉嘉凱提出的「開放發展」的工作模式(詳情請見這裡)。

photo via Ed Yourdon@Flickr, cc License

然後,由 30 名志工所組成的團隊分工合作,利用一個週末的時間分析這些資料,從中找到一些有趣的現象。其中之一是他們發現接受過 St Mungo’s Broadway 幫助的人,日後比較可能向 Citizen Advice 尋求移民或是住宿相關的協助。

另一個有趣的的發現是,比起其他 Citizens Advice 服務的族群,許多來到 St Mungo’s Broadway 尋求協助的街友,都曾向 Citizens Advice 接洽過就業津貼相關的問題。失業補助津貼是英國政府提供給疾病或殘障者的福利,St Mungo’s Broadway 裡所有向 Citizens Advice 接洽的街友中,有 18% 是為失業補助津貼而來,而且這群人當中有三分之一亟需申請這項補助。

自從這個收穫滿滿的週末以後,這群志工也開始嘗試其他更有挑戰性的分析工作。舉例來說,他們試著找出曾接受 St Mungo’s Broadway 的幫助、日後過得不錯的人,他們所擁有的特質為何;也有人創造一個預測模型,分析一個曾接接受 St Mungo’s Broadway 幫助的人,第二次回來尋求協助的機率有多少,或是會需要哪些服務。有些成果會用 Gephi 這款開源軟體進行視覺化,讓 St Mungo’s 的街友向 Citizens Advice 尋求幫助的路徑可以更具體地被呈現出來。

案例二:美國社福團體 CAMBA 的躍進,脫離地址查找手工活,接觸更多需要訪視的家庭。

2014 年的夏天,美國紐約市布魯克林區一家名為 CAMBA 的社福組織,開始與另一家致力於分析資料的組織 SumAll 合作。在 SumAll 介入之前,CAMBA 的社工們用一種十分土法煉鋼的方式接觸那些住處被長期查封的家庭:社工們會定期翻閱每個月大約 5,000 筆新增的查封公告,用手動的方式找出屬於他們轄區的地址。然後,這些社工每個月會大約寄出四百封的郵件到這些他們新找到的地址,告訴這些即將被查封的家庭可以申請 CAMBA 的諮詢服務。

與 SumAll 合作以後,一切變得不一樣了。現在,他們可以先把這些被查封房子的地址資料與地理分佈對應起來,找出那些他們轄區內的的地址,這在過去用手工的方式做完需要花好多天,現在只需要幾小時。接著,他們利用 SumAll 開發的工具找出其中前 30 到 50 個高風險的個案,判斷的指標包含過去與庇護所系統合作的經驗(這裏使用的是來自紐約市遊民服務處的資料)、教育程度、就業情況、年齡,甚至會用上一些童年時的資訊,像是與領養系統打交道的狀況。(以上所使用的都是公開資料)

住家被查封、被驅離女子, photo via The Advocacy Project@Flickr, cc License

這些被過濾出來的高風險家庭會收到來自 CAMBA 依據家庭狀況客製化的信件,內文包含預約諮詢時段的熱線號碼。只有這些被鎖定的家庭會收到這支號碼,所以會打到這支電話的人,就會被視為 CAMBA 第一優先的服務對象,這大大增加了 CAMBA 提供服務的效率。 SumAll 提供技術支援的地區,CAMBA 可以聯絡上的家庭比其他鄰近沒有這套機制的地區多 50% 。換算起來,有 65 個過去拒絕接受幫助的家庭,現在可以免於餐風露宿之苦。

這種用大數據鎖定某些特定個人的方法,一直有爭議,不只攸關隱私,使用時也必須十分謹慎,以免因此排除了其他有需要的人接受資源的機會。爭議有部分來自於社會大眾期待社福組織應該盡量把網撒到所有可能有需要的人身上,但這種盡可能包含所有人的方法,不只對 CAMBA,對於許多 NPO 而言,可能都浪費了寶貴的時間與資源。

參考資料:

案例一:Sharing data to learn about homelessness(DataKind UK, Oct 2014)
案例二:Big Data Could Help Some of the 200,000 NYC Households That Get Eviction Notices This Year(Next City, JANUARY 28, 2015)

推薦閱讀:

    1. 大數據與人道援助 – 群眾標記 (crowdmapping) 應用
    2. 104年非營利組織資訊科技運用座談會|資訊人怎麼看公益新浪潮 -網絡行動&智庫驅動現身說法
    3. 資料科學讓你更了解捐款人!陳昇瑋用數據看公益|2014「創新吧!公益」年會記錄
    4. 《好心的大人》書評-經濟衰退、社福殘缺的日本,如何能在街頭生存?

【本月選書】桐野夏生:《好心的大人》(優しいおとな)

RS7076

「不曉得從什麼時候開始,從兒保中心逃走的孩子一年比一年多,已經沒有人可以掌握正確數字了… 所以我們才會從事這個工作。我說伊昂,你可以相信我嗎?我想要幫你。福利保障制度已經崩潰,就算強制把你送回兒保中心,也只會重蹈覆轍吧,你一定又會逃走,可以請你不要離開澀谷,讓我保護你,直到你長大成人嗎?」

作者:桐野夏生(きりのなつお)
譯者:王華懋
出版社:麥田出版
出版日期:2015年3月(中文翻譯版)
類型:推理/懸疑小說
ISBN:9789863441939
裝訂:平裝

孫 語辰

走入生命需要時間。現經營《脈絡》部落格:http://context.tw,希望可以把時間花在走入生命的文字上。

You may also like...