博客專欄

        EEPW首頁 > 博客 > 穿顏色成對的襪子,追最新的劇:這群coder正幫視障者移走身上的大山

        穿顏色成對的襪子,追最新的劇:這群coder正幫視障者移走身上的大山

        發布人:機器之心 時間:2023-01-17 來源:工程師 發布文章

        「視障是壓在身上的一座大山。你從小就是被否定的,你看不見就做不了這,做不了那,你自己也那么認為。


        在你的印象中,視障群體一般會從事哪些職業?如果被問到這個問題,大多數人想到的第一個答案可能都是推拿師、按摩師。恐怕,沒有人會想到「化妝師」。 「盲人怎么還能化妝、拍抖音、回私信呢?是騙人的吧!」抖音視頻博主「盲人美妝師肖佳」經常會受到這種質疑。
        和很多視障人士一樣,肖佳最初也從事過按摩工作,但這份工作并沒有束縛住她。北漂的經歷讓她發現了自己人生的更多可能性并找到了興趣所在。6 年間,她教會了數千名視障女性化妝。 

        圖片

        肖佳的抖音視頻截圖

        其實從肖佳的身上不難看到,隨著技術的進步,視障群體的就業范圍早就不再局限于推拿、按摩等傳統行業,越來越多的視障者渴望或正在從事和明眼人一樣的工作,比如有聲主播、云客服、數據標注師等。只是,這一人群所占的比例還比較小。 這其中的原因是多重的,包括工作機會少、無障礙支持做得還不夠等等,這導致很多視障者在「邁出家門」這一步就被卡住了。 為了改變這一群體的境遇,社會各界正從各個方向發力,科技是其中一個比較有效的方向,包括近年來已經在各行各業找到應用場景的 AI 技術。
        不過,對于技術人員來說,嘗試用 AI 幫助視障群體可能并不容易,因為這類項目的用戶調研更難開展,可借鑒的成熟模式也比較有限。就像字節跳動的一位算法工程師所說,「我們隱約覺得視障群體會因為看不見東西而面臨很多困難,但是具體有什么困難我們也不知道」。
        在 AI 技術圈,抱有相同疑惑的工程師不在少數。因此,從去年 8 月份開始,字節跳動就組織了一場以「AI 助力視障群體」為主題的大賽,即「2022 技術公益創新杯大賽」,希望助力視障群體在生活和工作上更好地融入社會
        為了確保選手對視障人群有足夠的了解,同時確保他們的創意作品有足夠的迭代時間,大賽在比賽初期就引入了肖佳等受益人評委,而且用 5 個多月的時間組織了初賽、復賽、決賽三大環節。雙方在經歷了多輪溝通、交流之后都對要解決的問題、可應用的技術有了新的認識,也為廣大想要在這一領域有所貢獻的技術人員提供了一些參考。
        關于視障需求的一些「誤解」
        哪些是「真需求」?哪些是「偽需求」?
        對于明眼人來說,生活中能夠感知到的無障礙設施其實并不多,盲道算是最為明顯的一個。很多人會吐槽盲道會導到樹上或溝里,用起來令人膽戰心驚。但受益人評委之一、北京一加一殘障公益集團合伙人傅高山卻說,這些吐槽其實并沒有抓住重點,視障者本身有辦法避開上述障礙。 比起吐槽中提到的問題,更加困擾傅高山的其實是一些開闊區域盲道的缺失,比如斑馬線。這些地方參照物少得可憐,視障者很容易走歪、進錯路,這恰恰是盲道應該發揮作用的地方。 在比賽中,選手們也經歷著類似的認知沖擊 想要做一款「助視輔具」幫助視障人群了解周邊環境的微光團隊回憶說,他們起初設計的產品包含危險物品的識別,比如提醒視障者前面有個坑,或周圍有刀具。但在進行深入的用戶訪談后,他們放棄了這個功能。因為視障者借助盲杖等工具也能探測到危險物品。在熟悉的環境中,他們甚至能把周邊物體的位置背下來。 主打「對話式視覺助手」的靈瞳團隊也遇到了需求理解不到位的問題。他們的產品邏輯是讓 AI 理解視障者拍的照片,以問答的方式告訴他們照片上的信息。在最初的版本中,他們設計了一個提醒視障者物品是否入鏡的功能,不過后來因為交互起來不夠簡潔又把這個功能刪掉了。但傅高山告訴他們,這個功能對于視障用戶還是很重要的,所以他們最后又把這個功能撿了回來,并嘗試用更簡潔的交互邏輯來實現它。

        圖片

        靈瞳團隊作品功能介紹

        視障者=盲人? 很多人在聽到「視障者」這個詞的時候,都會簡單地將其等同于「盲人」,這無疑是一種誤解。 其實,截至 2021 年,我國總共有 1750 萬視障群體,其中盲人有 875 萬,其余可以被歸為「低視力」等范疇。在傅高山身上,微光團隊看到了這兩類群體的差異。傅高山本身屬于低視力,所以他希望助視輔具不僅告訴他某個餐館在屏幕的哪個方向,還要提供一個放大鏡功能,方便他貼到眼睛上看。「這是之前沒有想到的需求,」微光的隊長坦言。 除了視力,視障群體對光的感知能力也是不同的。有光感的肖佳習慣于晚上開燈,因為那種「亮亮的感覺」讓她覺得很舒服。但沒有光感的另一位視障用戶同樣習慣于晚上開 / 關燈,因為他需要以此為信號告訴別人他是否在休息。不過,和肖佳不同,他還需要借助某種方法判斷燈是開著還是關著。在了解到這一需求后,微光團隊把將亮度檢測功能加入了自己的作品。 這種光譜式的需求點挖掘讓受益人評委深感欣慰。傅高山評價說,「我們社會并不是所有人對殘障的認知都達到了正確理解的程度。同學們的作品其實開了一個好頭,就是識別用戶。在這個用戶光譜里,還有很多處在漸變色的中間用戶,其實這部分用戶是最值得被挖掘出來的。
        眼睛不好,補兩顆智能的就能解決問題?
        在明確了視障群體的需求之后,選手們接下來面臨的問題就是怎么滿足這些需求,以什么產品形態來滿足。 普通技術人員最容易想到的品類可能就是智能眼鏡,因為這和人的眼睛在形態、功能上是最像的。這類眼鏡往往用攝像頭采集數據,然后用耳機把 AI 處理后的結果播報給用戶。這些年,傅高山已經見過不下五款智能眼鏡,設計者的想法基本都是「你眼睛不好,我就給你補兩顆智能的」。 起初,微光團隊的助視輔具也有這種傾向,但傅高山的一番解釋讓他們明白了為什么這種形式行不通。 首先,從信息采集方式來看,人的頭部在行走過程中是不穩定的。 其次,眼鏡 + 耳機的形式大量占用耳朵,而耳朵又是視障者接收周圍信息的重要感官。為了保持聽覺的靈敏,他們下雨天甚至都不怎么打傘。 最后,視障者其實希望在接受技術輔助時擁有自主權。他們不需要輔具時時刻刻工作,只想在需要的時候拿出來用一下。因此,他們希望這款輔具是方便摘取且按需播報的。 我們期望技術能解決的,就是遵循現有的方式,讓視障者的學習成本更低、便利性更高。如果想做一款設備來替代人的器官,目前來看,這種思路基本都不可行。」傅高山解釋說。 在聽取了傅高山的建議后,微光團隊把助視輔具的形態改成了頸掛式,交互方式也演變成了用揚聲器按需播報。這款設備可以滿足日常生活、出行的一些基本需求,比如物體、信息識別,建筑物內導航等。此外,該設備還支持向附近在線的人發起求助。 

        圖片

        微光團隊作品3D打印樣品
        一份「超出期待」的答卷
         「您試用過選手的作品嗎,感覺怎么樣?」在被問及這個問題時,傅高山的回答是:超出期待。 以靈瞳團隊的「對話式視覺助手」為例,傅高山對它的期待原本是:能實現一個功能就很有價值了,結果靈瞳做出了很多個。通過對話式主動智能,你既可以問視覺助手衣服的款式和價格、 襪子的顏色是否一致、薯片的口味和保質期,也可以和它聊聊文章的配圖、電商主播的穿搭……

        這種主動式的對話方式有多方便呢?在一個視頻中,肖佳曾介紹過她如何獲取****品信息:先把說明書拍下來,然后找一個 OCR 軟件進行識別,最后再借助讀屏軟件把所有信息讀出來。這種信息獲取方式是非常低效的,因此聽語速飛快的倍速語音成為了每個視障者必備的技能。但在主動式對話交互中,視障者不需要再忍受這種折磨,在接收技術輔助的時候擁有了更多自主權。

         這種超出期待的能力離不開多模態技術的支持。靈瞳團隊介紹說,目前國際學術界很多人都在嘗試用 VQA(視覺問答)等多模態方法解決視障類問題,只是還沒有實現大規模工程落地。

        圖片

        vizwiz 公開的用于解決視障類問題的 VQA-Grounding 數據集。照片由視障者拍攝。
         同樣采用了多模態技術的還有聆影聽光團隊,他們的目標是用 AI 實現視頻無對白片段的內容理解,進而為這些片段生成旁白,方便視障群體追劇、看電影、刷視頻。與傳統的人工方式相比,他們的方法會顯著降低無障礙視頻的制作成本和周期,滿足了視障者想和朋友溝通最新影視作品的愿望。

        當然,受到多模態技術發展水平和可用數據集等方面的限制,這些應用的準確率現在還達不到那么高,因此選手會擔心把這樣的產品拿給視障群體用是不負責任。但傅高山很喜歡這些作品,因為根據他自己的體驗,視障者其實對這些 AI 技術是有一定的容錯能力的,比如「你即使把 57 路公交車看成 51 路,我也能判斷車它是 57,因為我知道這個站點沒有 51 路」。

         只要是在正確的路上,有就比沒有強,」傅高山總結說。 從「面對面」到「肩并肩」,「改變」正在發生
        視障是壓在身上的一座大山。你從小就是被否定的,你看不見就做不了這,做不了那,你自己也那么認為。」肖佳這番話道出了很多人對于視障群體的刻板觀念,這也是很多視障問題遲遲難以解決的根源。
        持有這種觀念的明眼人在幫助視障群體時往往會以一種「面對面」而非「肩并肩」的態度來看待事情。「比如我們想象一個畫面,在飛機座艙里面,一個空乘背著一個肢體障礙者。可能從外界的角度,他很容易看到航空公司提供了溫暖的服務。但從障礙者的角度來看,他會想為什么飛機上沒有輪椅。作為被背著的那個人,他其實沒有那么舒服。」傅高山解釋說。
        在傅高山看來,靈瞳、微光等團隊的可貴之處在于,他們在幫助視障群體的過程中完成了從「面對面」到「肩并肩」的視角切換,真正做到了站在視障者的視角去解決問題。
        這種讓視障者更加自主的解決問題的方式對于他們建立自信也非常重要。當做很多小事的學習成本降下來之后,他們會更加愿意嘗試。就像肖佳所說,視障者學會了化妝就不會只想做按摩師,也會想嘗試主播等新興職業

        圖片


        在經歷了 5 個多月的賽程后,2022 技術公益創新杯終于在前段時間迎來了決賽。文中提到的幾個團隊均在決賽中取得了優異的成績。其中,靈瞳和聆影聽光團隊獲得了大賽一等獎,靈瞳還和微光團隊一起獲得了最受歡迎獎
        雖然比賽已經告一段落,但從更長的時間維度來看,它只是一個開始。目前,大賽的相關人員已經開始著手后續的孵化工作,希望大賽中誕生的這些 idea 能夠讓更多的視障者過上更加體面的生活。


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 县级市| 庆云县| 洞口县| 比如县| 蕉岭县| 南汇区| 通渭县| 津南区| 义乌市| 吉首市| 金阳县| 靖边县| 鄂温| 静乐县| 龙江县| 莱芜市| 紫金县| 蒙阴县| 朔州市| 永吉县| 英超| 福海县| 灵宝市| 乐昌市| 百色市| 连江县| 汪清县| 准格尔旗| 诏安县| 阳新县| 建瓯市| 曲水县| 拜城县| 澄迈县| 东乡县| 泾阳县| 富裕县| 大余县| 太白县| 丰宁| 阿巴嘎旗|