【活動現場】大數據與資料分析,如何為 NPO 與捐款人搭起信任橋樑?

0
圖/https://goo.gl/9cQoeD

名稱:從公益資料分析到聰明公益平臺的抽絲剝繭之路

時間:2017 年 5 月 9 日(星期二)

地點:青平臺基金會(臺北市中正區中華路 1 段 77 號 6 樓之 1)

主辦:網路星期二

主講:陳昇瑋(臺灣資料科學協會理事長、中央研究院資訊科學研究所研究員暨資料洞察實驗室主持人)

聰明公益資訊平臺:http://www.smartdonor.tw/

 

被媒體封為臺灣資料科學之父的的陳昇瑋博士,善於判讀資料解決難題,研究領域涵蓋大數據分析、深度學習、計算社會科學及多媒體系統等。有感於學術研究與現實社會的交集較少,他著手分析了 2014 年蘋果日報慈善基金會的公開資料,得來幾個有趣的結果,如「1、2 月捐款金額高,7、8 月則低迷。」、「週二、週三收到的捐款最多,週末收到的捐款最少。」以此發現捐款的意願與募款資訊的發表時間密切相關,清楚描繪了臺灣人民捐款的動機。

捐款多寡與日期相關。圖/講者提供

捐款多寡與月份相關。圖/講者提供

這一次,陳昇瑋再創精采之作,在「網路星期二」的分享聚會中,以「從公益資料分析到聰明公益平臺的抽絲剝繭之路」為題,介紹了團隊力作──網路購書平臺博客來客群洞察、資料分析對於 NPO 的幫助,以及自創的「聰明公益資訊平臺」,為臺灣所有的公益團體收集資料。

善用資料分析,知識寶藏挖不完

「從資料中萃取知識,就好比淘金,絕非易事,但若有『好工具』,即可得其門而入。」

陳昇瑋說,千斤的土壤,只要能淘出 5 公克的黃金,就是金礦!而機器學習(Machine Learning)就是讓大數據變身「金礦」的好工具。分析原始資料需要長時間與電腦折騰,結合數學、統計、機器學習、資料探勘與資料視覺化的專業,整理資料的邏輯,找出隱藏在數據中的含意。

一個演算法會自動從資料中學到規則,深度學習就是機器學習裡的一種,而人工智慧就是深度學習的結果。」陳昇瑋娓娓道來資料科學把價值從資料中挖掘出來的方式,其所運用的 4 大階段(如下圖),價值最高者在於最後 2 個階段,亦即「預測型」和「指示型」。

資料分析運用 4 大階段。圖/講者提供

「一本書在上架前就可以預測賣得好不好!出版者藉由『暢銷書解密』,來設計更好的商品。」

「書名裡有『養生』,在『飲食類』便能受到長輩歡迎,但在『醫療保健類』的銷量上卻沒有同樣得到大眾的青睞。」、「年收入 70 萬以上,買外遇離婚相關關鍵字內容的書最多,若收入更高的族群則買得更多。」這些結果都尚處於資料分析的「描述」與「解釋」階段,真正有意義是其實是分析的第 3 階段「預測分析」,藉由機器學習技術自動歸納出書籍銷量與各式書籍屬性的相關性,進而建立銷售表現的預測模型

陳昇瑋進一步指出,目前臺灣在資料分析的運用上大多停在描述型、解釋型;說也奇怪,為什麼即使都有在分析手上握有的資料,卻難以達到第 3 跟第 4 個層次?他解釋,難在數據的量化及經緯度的細項分類,即使是博客來也是在去年 12 月才做到預測的層次。

資料分析的 3 個層次(以分析暢銷書為例)。圖/講者提供

陳昇瑋用 2 年的博客來銷售數據示範了大數據的分析和威力,同時解釋大數據和人工智慧如何結合運作,從探討讀者背景、生活型態與購書行為的關聯,將不同購書客群之間的「差異性」數據化,再依據書名關鍵字、封面設計、上市前市場狀況等,鍵入高達 700 個變數,可設計出預測暢銷書準度高達 80% 的系統。

而要達成最後「指示型」層級的最佳化結果,比方說,讓電腦決定什麼書名最好,標題加驚嘆號、加問號,或是哪裡改個粗體、書的封面該用什麼顏色等「介入編輯的流程」,可採取的模式是讓電腦從 10 個書名或好幾張封面設計中,選出可能賣得最好的設計

利用數據分析解密暢銷書,以本書為例,暢銷指數高達 94.33%。圖/講者提供

聰明公益資訊平臺,NPO 與捐款人的信任橋樑

「全臺灣有超過 2,000 家公益團體,如何利用資料分析來為每個捐款人找到最合適、也最有效率的捐助方式及對象呢?」

話題一轉,從捐款人的角度出發,陳昇瑋詳細介紹花了 3 年時間的結晶「聰明公益資訊平臺」。

對他來說,想要讓民眾認識臺灣的公益團體,首要之事就是得為所有的團體收集資料。陳昇瑋直言,這並不容易,因為資料的收集、維護及取得並沒有一定的格式或規範,更有許多公益團體因為人力或其它因素而並未將資料公開。藉此,他與友人成立聰明公益資訊平臺,希望透過公益團體及捐款人的共同努力,一起建立及維護屬於臺灣所有公益團體及捐款人的平臺,讓捐款過程更能有所依循,更聰明有智慧,愛心捐款人也能更有憑據的來評估合適的捐款對象,也讓小型的社福團體更能被潛在捐款人看見。

聰明公益資訊平臺頁面。圖/講者提供

可在平臺上依照需求搜尋相應的組織。圖/講者提供

組織透明度分析。圖/講者提供

截至目前為止,聰明公益資訊平臺共有 2404 個公益團體登記在上,其中 1333 個(55%)團體有提供網站,122 個(5%)團體有提供公開徵信,196 個(8%)團體有提供財務報告。此外,比照維基百科的運作模式,「聰明公益資訊平臺」是由社會大眾共同維護的公益團體資料庫,人人可參與,人人可編輯,所有的資料皆公開,因此若資訊有疏漏或錯誤,登入後就可進行編輯修改,且所有的編修版本都會保留,讓每個人都知道團體的資料被修訂了什麼。陳昇瑋相信公開的力量,公開透明及人人參與是創建平臺的原則,而資料在數位化之後就可以分析、比較、排序,他的目標是完成臺灣最完善、客觀及可信的公益團體資料庫。

「重新對話、重新建立信任。」陳昇瑋談到資料分析對於 NPO 的幫助,雖然這樣的運用在臺灣還在萌芽階段,他還是希望藉由這個平臺,讓民眾看見資料科學在公益領域的潛力。等所有公益團體的資訊透明化達到某個程度、各團體都擁有同樣基礎之後,就可以進一步運用數據,進行下一個階段。「我們正著手推動這件事,聰明公益資訊平臺是一切開始的基礎。」


現在就來試試「聰明公益資訊平臺」:http://www.smartdonor.tw/

陳昇瑋

作者介紹

林郁倫

NPOst 特約記者。相信文字是有「溫度」的力量,力量累積說書的實力,「說好一件事、完整一個故事。」進而加溫社會、擁抱這塊美好的土地。