數據與法律相遇,「法扶」成為探索服務破口的引路人/ 2019 年會前導報導

法律扶助基金會范光群董事長、東吳大學潘維大校長、東吳大學趙維良副校長及SAS台灣陳愷新總經理率領專案團隊合影。圖/法扶提供

2019 NPOst 年會以「撐起一個地球的好事」為題,邀請到 AI4SG 分享如何以 AI 推動數位轉型並應用於公民社會與公益議題,法律扶助協會的數據小組嘗試將服務結合 AI 科技,獲得 2019 AI4SG「社會進步獎」的肯定,本文揭開他們跨足科技的方法與歷程。

在大數據浪潮席捲之下,資料科學成為備受關注的顯學,數據分析協助企業、政府、 NPO 在既有資料庫中挖掘新世界。當科技與人文社科產業結合時,又能扮演什麼樣的輔助角色呢?數據,能讓社福產業更好嗎?

財團法人法律扶助基金會(以下簡稱法扶)是社福領域結合大數據應用的一例,法扶由司法院捐助成立,提供需要法律服務但是無力負擔訴訟與律師費用的人,專業性、制度性的法律協助。成立 15 年來,案件量逐年攀升,法扶面對人力不足、案件負擔沉重等考驗,再加上大環境對「科技」接納度提高,讓其開始思考導入數據分析,進而優化服務、提升效能的可能性。

2017 年年底,法扶組成一個跨部門、臨時編制的數據小組。歷經創新試驗的 2 年,數據小組藉由 4 個專案,初嚐到數據分析對組織帶來的助益,但同時,也無法逃避組織數據化必然要面對的瓶頸。

面對龐雜資料庫,組成「挖礦」團隊

訴訟程序流程繁複,耗時冗長,以 2018 年為例,法扶全年收到約 21 萬件申請案,除了11萬件法律諮詢的申請案件量外,有近 9 萬件的法律扶助申請案件,經過審查後,准予扶助的案件高達 6 萬件,龐大的案件量與業務流程,再加上法扶雖有業務軟體系統,但服務十數年下來,法規多有更迭,案件登錄系統可用的資料欄位不盡相同,讓資料整理的負擔相當大,而有了想進行「數據清理」的念頭,間接促成法扶借助數據化之力,提升服務效能的契機。

圖/法扶提供

法扶自成立以來累積了數十萬筆案件,擁有龐大的資料庫。十多年來,這些資料僅作為業務上使用,法務處研究員張毓珊說:「資料庫到底呈現什麼面貌?我們的申請人長什麼樣子?這幾年來,案件屬性有什麼走向?這些問題,我們都沒有非常清楚的掌握。」她表示,法扶的資料是「礦」,但之前卻從來沒有人挖礦。

2017 年年底成立跨部門的數據小組,契機來自於一場協助 NPO 實現資料科學公益願景的「資料英雄計畫」( D4SG Felllowship ,以下簡稱 D4SG ),為了參加 2018 年初的 D4SG 計畫,法扶由會內法務處、業務處、資訊組、會計處、宣導暨國際處等跨部門職員合作,組成一個臨時編制小組,而這也成為「挖礦」的起點。

從數據清理,到發想 AI 雛形

大數據的應用在科技公司行之有年,但跨領域與 NPO 合作卻較為少見。 「 D4SG 資料英雄計畫」協助媒合 NGO 及資料科學家,運用資料科學家的數據處理專業,解決 NGO 於真實世界所遭遇的問題,以資料力來實踐公益。法扶在 D4SG 計畫中,與專業資料分析公司 SAS  聯手,以「挖掘未被滿足的法律扶助需求」為題,結合政府外部資料,剖析各地分會負責的案件覆蓋率、人口特徵以及案件屬性,希望能「撈」出潛在需要法律扶助者。

之後,數據小組又接連參加 2018 年首屆的總統盃黑客松,獲選為最終 5 組的卓越團隊獎,也參與東吳大學及 SAS 的合作專案,這一年來的成果,獲得了 2019年 AI4SG 「社會進步獎」的肯定。同年,數據小組也繼而再度參與 D4SG 計畫,並與台大法律資料分析研究室的資料英雄團隊合作。

法扶在與東吳大學、 SAS 合作的專案中,利用文字探勘技術嘗試提出「 AI 預測律師辦案心力」的雛形,舉例來說,假設在「扶養費」案件中,透過程式能解析出「家暴」、「離婚」、「安置中心老年人」找出不同種類的關鍵字詞,期望作為律師辦案耗時或其他預測,作為未來改善的基礎。

圖/法扶提供

法扶藉由資料清理,將案件的分項細目結構化,試圖找出一些關聯,期望從申請人走進分會、職員記錄資料、一對一跟審查委員諮詢、到派案予扶助律師至結案的整體流程,都能有更具體的評估,提高流程效率。

用數據比對現實經驗,找到服務缺口

對以法律服務為本的非營利基金會來說,法扶接觸數據、理解數據、想像數據的過程非一點就通,而是藉由一次一次的實驗中,揣摩數據能為組織帶來什麼。

宣導暨國際處主任葉瓊瑜說:「以前聽到『大數據』可能會覺得跟自己沒關係,但其實是有關係的。我們也不認為我們做的是真正的大數據,但嘗試去做數據分析後,資料科學開啟了基金會的想像。」

張毓珊也認同數據分析的重要性,「很多時候,我們按著主管機關的要求提供數據,可是這些數字如果沒有導向管理意涵,就會變得沒意義。」舉例來說,法扶有資料庫,數據小組與外部數據公司在資料清理的過程中,得出了數據間的關聯性,或潛在的因果關係,使得法扶能持數據跟各地分會的經驗比對。

以法扶與 D4SG 「挖掘未被滿足的法律扶助需求」為例,先透過各分會的案件數據與外部資料進行比對,找出不同弱勢族群的服務缺口,再以此資料與各分會深度訪談,經由分會在地經驗來驗證數據分析的正確與否,並以此作為分會在進行宣傳人力或是資源配置上的依據。例如,在某些地區法扶分會人力僅有 4 人,宣傳預算也很有限,透過數據分析找到某個鄉鎮服務缺口最大,就可以先往那裏進行宣傳與在地網絡聯繫。

圖/法扶提供

投入數據分析之前,既有的登載系統有其有限性;數據分析導入之後,可以作為組織佐證、思考、回頭調整業務方向的依據,尤其搭配在地經營經驗,受扶助人口的輪廓就會變得更立體。數據分析讓個案不再只是業務軟體中一個一個數字,也提供分會管理上不一樣的視角,主動尋找有需求的民眾可能在哪,法扶找到他了沒?

法務處律師吳富凱說:「以前就是單純地做資料登載,但現在開始想用數據分析指出邏輯性問題,檢驗與現實中的經驗如果不一樣,就可以去思考差異在哪。」從一開始參賽不知道要往哪個方向去,一路摸索,藉助統計學家或科技團隊的幫忙,法扶也開始釐清、優化業務。

除了透過資料比對,挖掘可能的服務缺口,有趣的是,與外部團隊合作過程中,更有機會挖出新的「礦」,對外合作讓跨組織的團隊創造新的可能。張毓珊說:「外部資料科學家運用他們的技術整理我們的資料時,我們也學習對非法律專業領域的人來說,會怎麼看資料,有哪些是他們感到興趣、可以延伸分析的資料。」

隱私個資棘手、外部資料難以嫁接

無可避免地,對法扶來說,個資保護是組織數位化最大的顧慮。吳富凱說:「低收、家暴、身心障礙等群體在我們的申請人當中佔有一定比例,如果貿然公佈,就會有標籤化的問題。」有鑑於此,法扶目前對外揭露只侷限在參加比賽的成果報告,雖然上述趨勢資料對管理有所幫助,但只要觸及地域、敏感族群,就會相當小心。

此外,負責資訊管理業務的資訊組專員巫奎澤提到,外部公開資料有其侷限,各單位在收集資料時的邏輯思維不同,資料顆粒度也無法統一,使得法扶想探討的問題難以獲得外部機構資料支撐。巫奎澤說:「我們也曾想與政府社福單位進行高風險案件資料比對,但礙於個資保護,他們也難以提供更細部資料。」

圖/法扶提供

法務處律師吳富凱也說:「政府機關有在努力開放合理、有限度的內部資料,但還沒有很精細,實質助益不大,不只是法扶,對外界也是如此。」目前,數據取得困難一事,也只能先擱置。而除了敏感數據與對外部的嫁接,組織文化亦是挑戰。

數據化的最大瓶頸:翻轉組織文化

「如果我們想成為以數據為本的組織,要做的事之一是教育整個組織、提供一種文化,就連最日常的資料登載、資料定義就需要教育。」張毓珊說,在組織內部養成數位文化不是一件容易的事,法律界相對保守,要讓科技取代一些關乎組織文化、領導的事務,涉及很多業務流程與心態的改變。

更進一步來說,NPO 要做數位導入,組織是否能接受他所關注的群體被資料科學標籤、量化?如果 NPO 要數據化,那組織就必須要去調適。張毓珊解釋:「在我們登載案件資料時,很多選項的選擇會有『其他』這個欄位,造成資料分類上的困難,『其他』經常變成整個系統中未被深究的漏洞,我覺得我們應該也反映了其他 NPO 的難處。」

很多時候,社福產業對於數位科技的接受度不如科技業或製造業,因為要在一個案件、一個人身上貼上標籤、定義並分類,社福組織本質上,可能無法認同這種哲學。同時,每個部門都有各自的文化以及關注事項,當理想走入實際作業流程後,即遇到各種瓶頸。

此外,組織領導也是關鍵,尤其在人數龐大、風氣保守的機構要數據化,必須要有由上而下的力量,帶動組織流程改變,法扶數據小組也仍在掙扎中。吳富凱說:「我們一直希望讓這個臨時編制的組合成為專責部門,延續這 2 年的成果。不過礙於金錢、人力與上級決策,目前仍無法如願。在這個狀況下,工作起來就會比較辛苦,或是找不到一個長期目標去執行。」

科技結合法律,讓工人智慧變成人工智慧 

張毓珊強調:「把業務用科技的方式呈現,不是為了展現酷炫或搭上潮流,最重要的目的還是希望受扶助人、服務使用者能更快、更有效地接觸我們,某種程度也是減輕我們的工作,我們希望翻轉業務流程,讓大家可以越來越輕鬆工作。」

數據小組目前的成果仍僅停留在清理過去的資料,雖然期待整理後的結果可以應用在「預測」,但目前距離開發出應用系統,還有很長的一段路。儘管社會科學有太多影響因素,但若能找到影響研究主題的相關因子,對於法扶服務流程的優化與效能提昇,亦會有所助益。

圖/法扶提供

近兩年的研究專案,不管協助分會找出潛在的服務缺口或是優化派案流程,數據小組漸漸看到法扶推展數據化可能的輪廓。不過,資料在各部門實務運作變數也很多,且對第一線的工作人員衝擊沒有那麼大,不是每個單位都已體驗到數據化帶來的正向回饋。因此,數據小組僅能旁敲側擊,希望讓每個部門都能分享成果,慢慢帶動數位化的意識、慢慢轉型。

張毓珊觀察到,一直以來,法律工作者所受的訓練會特別留意倫理、法規、隱私權的問題,在法律服務業內推動科技應用者,往往必須花更多時間與精力推動新的科技應用。科技能作為輔助工具,走到今天這一步,已經是很好的事情。數據小組的經驗證明,科技結合法律仍有很大的可行性,端看法扶如何定位,以及決定要開多大的門。

科技日新月異,今天所談論的願景,也許過了幾年又是新的局面,吳富凱說:「我們也只能就現在的基礎,逐漸去摸索,找到適合我們的方向。」不過,清楚可見的是,在大數據的浪潮下,蒐集並擁有數據者,將更有機會透過對於數據的清理與耙梳,累積產業的知識,作為進一步發展人工智慧的基礎。

正如同數據小組兩年來的心得,張毓珊說:「要有人工智慧前,要先有工人智慧(資料的蒐集、清理及耙梳)。這兩年的工作對我們來說,最大的啟發,就是累積這麼多資料後,工人智慧開始有機會變成人工智慧了。」


延伸閱讀

IoT、無人機來管田 元沛農坊用科學算出永續農法/2019 NPOwer 公益行動家 3

真的假的 Cofacts —— 建立 Line 機器人對抗假資訊焦慮/2019 NPOwer 公益行動家 1

作者介紹

傅觀

NPOst 特約記者╱編輯