英國皇家學會:應加大研發投入,掀起“機器學習”新浪潮
時間:2017-10-19
近日,英國皇家學會發布了一份題為《機器學習:計算機通過案例學習的能力和潛力》(“Machinelearning: the power and promise of computers that learn by example”)的報告,為機器學習技術未來發展謀篇布局。報告呼吁,英國應加大對機器學習的研發投入,掀起攻克該技術難點的新浪潮,同時要求各界加大向公眾宣傳機器學習技術的力度,營造公平合理的發展氛圍,從而保持英國在機器學習技術的前沿地位,提高國際競爭力。
報告源于英國皇家學會發起的一個針對機器學習技術的研究項目,該項目從2015年11月開始,吸引政府、學術界以及公眾廣泛參與,對未來5年到10年機器學習技術的發展潛力以及發展方式進行了調查。這是英國政府首次對機器學習技術進行如此廣泛的深入評估。調查發現,雖然大部分英國人聽說過或使用過相關應用程序,但聽過“機器學習”這一術語的比例不到9%。
報告基于調查結果認為,為促進機器學習技術的發展,未來工作的重點之一是加大公眾對機器學習發展前景的信心,并要求研究人員開展科普工作,促進機器學習研究人員和從業者與公眾之間的交流。
報告特別列出的“掀起機器學習技術新浪潮”一章指出,機器學習應被列為科學、研究和創新的優先領域進行投資。除現有投資機制外,未來應加大投入,率先攻克機器學習技術關乎社會利益的一系列新挑戰。
報告還以較大篇幅關注和論述了如何應對與公眾相關的技術挑戰:首先,增加機器學習方法的可理解性和透明度。其中最有前景的方法是創建機器學習系統與人機對話系統的界面,未來幫助人類與機器對話,通過提問來理解機器推理過程。開發深受用戶歡迎的語音界面,提高機器的解釋能力,避免產生歧義和誤解。
其次,解決數據隱私與技術應用的矛盾。機器學習以數據為基礎,而隱私是其中的重要議題。目前該領域的研究還處于初級階段,擁有極大提升空間。一方面應對隱私進行差異化分類,模糊化處理數據資料;另一方面,研發同態加密技術,使機器學習算法能在“看不見”原始數據的基礎上對加密數據進行處理。
第三,開發對真實世界數據的分析程序,以對現實世界“雜亂無章”的數據進行凈化、理解、轉變和集成的系列化處理。未來研發重點包括:開發數據處理和共享標準,提高數據評估質量;開發系統行為評估和錯誤識別的標準。
最后,設計人機學習系統,即人機交互程序。未來,許多機器學習系統要在與人類互動中學習,其來源數據并不是靜態不變的,而是在互動中產生,這將給未來研究帶來一系列新的課題。如最大化實現人類智能與機器學習的結合、設計能根據人類情感做出高效決定的支持工具等。
報告還呼吁,創建對機器學習技術嚴格監管的環境,確保該技術的利益最大化。通過對哪些人影響最大、利益如何分布及存在哪些增長點進行分析,設計有效的干預政策,幫助公眾和企業適應并利用機器學習技術,改變生活和生產方式。
為此,該報告提出了幾點建議。第一,對各階層人群進行培訓。組織對學校、大學和工人等不同人群的數字技能學習和培訓,確保不會造成性別、種族和社會經濟背景方面的差別對待;強化機器學習專業的碩士教育,為工商企業和研究機構培養一批機器學習方面的專業人才;增加博士和博士后人才培養,提前布局下一代機器學習領域的研究帶頭人。第二,創造機器學習運用新機會。將機器學習技術集成到英國工業戰略計劃中,幫助企業實現利益最大化;支持新一輪機器學習研究浪潮,特別要優先研發引起社會和倫理關注的技術熱點。第三,創建支持機器學習技術發展的數據環境。持續追蹤英國開放數據記錄,確保數據的安全共享;評估個人病例或商業敏感數據能否公開,確保在協議框架內適當分享數據。此外,營造寬松的政策環境,支持公眾對機器學習表達不同看法,并制定全新數據管理框架,既要保證數據管理與機器學習運用步調一致,又要特殊問題特殊對待,用不同方式靈活處理。
(來源:國家工業信息安全發展研究中心綜合編譯自英國皇家學會)