世界即時：微軟宣布放棄情緒識別技術，AI終究還是讀不懂人心

2022-06-28 06:50:42來源：36kr

隨著多方因素的影響，越來越多公司開始放棄這一技術。

此前在2020年末，一則“戴頭盔看房”的視頻曾在網(wǎng)絡中流傳開來，但其中的主人公并非是在搞行為藝術，而是因為彼時售樓處大規(guī)模使用人臉識別系統(tǒng)，來區(qū)分出消費者是自然到訪、還是經(jīng)過了中介。自此開始，人臉識別技術的濫用不僅讓大眾抵觸，也引發(fā)了監(jiān)管層的警惕，更是直接導致了Meta方面在去年11月下線面部識別系統(tǒng)。

而在日前，又有一家科技巨頭對于人工智能技術采集用戶生物信息作出了讓步。

【資料圖】

微軟方面在近日宣布，將停止銷售基于人臉圖像猜測用戶情緒的技術，并將不再提供不受限制訪問的人臉識別技術，以及限制其他面部識別程序的使用，以確保這些技術符合自己的人工智能道德準則。微軟Azure的AI部門首席部門產(chǎn)品經(jīng)理Sarah Bird在博客文章中表示，“這些努力引發(fā)了有關隱私的重要問題，對‘情緒’的定義缺乏共識，以及無法跨越使用案例、地區(qū)和人口統(tǒng)計學概括面部表情和情緒狀態(tài)之間的聯(lián)系?！?/p>

據(jù)悉，微軟的AI情緒識別技術可以推斷出受測者的情緒狀態(tài)、性別、年齡、情緒，以及其他個人屬性，也就是說其甚至已經(jīng)實現(xiàn)了“察言觀色”。事實上，根據(jù)英國《衛(wèi)報》在2019年的相關報道顯示，讓AI來解讀人類情緒已經(jīng)成為一個規(guī)模達到200億美元的產(chǎn)業(yè)，用AI分析消費者的情緒以及預測消費者的行為，或是用AI分析患者的心理健康等應用場景，都已經(jīng)在逐步落地。

然而為什么如此有前景的技術，微軟方面會主動選擇放棄呢？這其實是因為在AI情緒識別的實踐過程中，無論是從技術角度、還是倫理角度，都存在著不可忽視的缺陷，以至于暫時將其擱置是當下最好的解決方案。

事實上，AI能夠“察言觀色”，是以計算機視覺和面部表情識別（FER）為基礎的。其中，計算機視覺技術能夠讓機器精確識別人類的面部信息，這也是實現(xiàn)人臉識別的技術基礎；而面部表情識別，則是用來分析和解釋機器所讀取面部表情中蘊含的情緒。作為機器人的AI在覺醒、并產(chǎn)生“靈魂”前，程序依然是經(jīng)過人類設計的，這就導致AI情緒識別的理論基礎其實與人類“讀空氣”的理論基礎一樣，是融合了計算機科學與心理學的產(chǎn)物。

那么AI是如何讀懂人類的情緒，并做到知人知面又知心呢？相信許多朋友都聽過“微表情”這個名詞，而其在互聯(lián)網(wǎng)中則被描述為了一項能夠讓你“讀心”的技術，盡管這顯然是很夸張的說法，但其實并非沒有科學依據(jù)。

據(jù)悉，心理學家Paul Ekman早在1976年就基于解剖學，建立了面部表情編碼系統(tǒng)（FACS）。該系統(tǒng)按照人的面部肌肉，將人臉劃分為大約46個既相互獨立、又相互聯(lián)系的運動單元（AU），并分析了這些運動單元的運動特征以及其所控制的主要區(qū)域，與之相關的表情。

例如人在生氣時通常會皺眉、眼瞼緊張、鼻孔張大，在害怕的時候會出現(xiàn)瞳孔變大、眉毛抬起、嘴巴大開。同時，Paul Ekman等心理學家以及達爾文認為，人類存在6種與生俱來的基本情緒系統(tǒng)，即恐懼、悲傷、憤怒、愉悅、驚訝和厭惡，更復雜的情緒則是這些基本情緒的衍生。而情緒識別技術則是以各種情緒對應的表情與面部肌肉動作為素材，通過標注對于表情對應的情緒標簽來對機器進行訓練和學習。

簡而言之，通過計算機視覺技術，AI能夠識別出人類面部肌肉的動作，再基于面部表情編碼系統(tǒng)和基本情緒模型，來告訴AI這張圖片上反應的是什么樣的情緒，久而久之在海量數(shù)據(jù)的“灌溉”下，AI就能知道人類做出這個表情對應的是什么情緒。雖然看起來這套理論是自洽的，但如果基本情緒系統(tǒng)理論本身存在問題呢？

其實，基本情緒系統(tǒng)的跨文化一致性一直是學界爭論的焦點，這種忽略了背景、文化和社會因素的情緒理論，也一直都有反對的聲音。美國心理科學協(xié)會曾委托五位情感科學不同理論陣營的科學家，進行了數(shù)據(jù)收集與科學證明，以論證表情與情緒之間的關系。最終論文呈現(xiàn)出的結果，是情緒的表達方式多種多樣，很難從一組簡單的面部運動中可靠地推斷出一個人的感受，也就是表情與情緒之間并沒有可靠的科學依據(jù)，證明兩者直接關聯(lián)。

參與這一項目的美國東北大學心理學教授Lisa Feldman Barrett就表示，“他們（巨頭）能檢測到一張憤怒的臉，但這與察覺到憤怒的情緒是兩碼事”。事實上，基本情緒系統(tǒng)理論之所以被人工智能領域接納，是因為它正好契合了機器學習的能力范圍，六種固定不變情緒的框架下，大規(guī)模利用生成對抗網(wǎng)絡（GAN）來進行無監(jiān)督學習的AI情緒識別技術，當然就會迅速“成熟”。

如果僅僅是技術不成熟就罷了，在當下大眾對于個人隱私重視程度不斷加深，AI情緒識別這種不僅僅存在技術問題，而且與個人隱私關聯(lián)緊密的技術，更是挑動了許多人的神經(jīng)。畢竟大家如今對于面部識別就已經(jīng)很警惕了，情緒這種更私人化的東西自然是更加不希望被科技巨頭隨意評判。所以在針對科技巨頭的反壟斷浪潮中，微軟方面自然不想、也不愿意與大眾對著干。

在機器學習大規(guī)模普及前，傳統(tǒng)的算法技術局限于人類對于自身的表達，需要設計者明確計算機在給定條件下的給定動作，而現(xiàn)在的算法則突破了人類表達的局限性。這固然帶來了效率上的飛躍，但算法雖然是模仿人的思維方式，卻無法模仿人的倫理自主性，在算法實現(xiàn)的過程中排除了人類對于倫理邏輯與價值理性的追求。

所以這也是為什么越來越多人對于科技的觀感開始趨于負面，并認為科技正在逐漸走向“邪惡”的原因了。

【本文圖片來自網(wǎng)絡】

關鍵詞：面部表情面部識別機器學習

責任編輯：hnmd004