當前位置:首頁 > 科普 > 列表 > 正文

奔跑吧,讓AI做你的眼睛
2020-12-16

  “我們應該激勵更多為視障人士創(chuàng)新的技術成果,讓其盡早轉化成真正讓視障人士受益的產品,這需要構建一個良好的創(chuàng)新生態(tài)。”

  日新月異的科技力量正為視障人士“重見光明”帶來希望。

  11月底,谷歌表示,其研發(fā)的一款人工智能系統(tǒng),能夠幫助視障人士獨立參加跑步比賽。據(jù)悉,依靠該系統(tǒng),視障人士不需要依靠人類向導或導盲犬自己便可以跑完全程。那么,這款人工智能系統(tǒng)如何讓視障人士參加跑步比賽?近年來在幫助視障人士恢復視力等方面,人工智能有哪些階段性成果?目前這些產品距離應用還有多遠?

  用聲音信號為盲人引路

  現(xiàn)在很多崇尚健身的人喜歡挑戰(zhàn)馬拉松,而盲人如何參與跑完“半馬”或“全馬”呢?一位公益組織人員介紹,盲人要參加此類比賽,需陪跑者的幫助。為了方便跑步,盲人和陪跑者之間有1條牽引繩,分別套在各自的手腕上,如同牽手跑步。為了確保盲人在跑步中萬無一失,有時需要兩位陪跑者。但是,盲人平時訓練時,隨時找個陪跑者似乎不太現(xiàn)實。

  最近,不少城市開始允許導盲犬進入地鐵、公交車。然而,國內導盲犬的數(shù)量十分有限,據(jù)統(tǒng)計,截至2017年,導盲犬的數(shù)量僅為116只,比大熊貓還稀少,而需要導盲犬服務的視障人士卻多達800萬人左右。每訓練一只導盲犬需要耗費12萬元—15萬元,導盲犬的壽命約為十幾年,視障人士即使有幸排到一只,但當它退役之后,視障人士又該如何外出,也是個值得思索的問題。

  谷歌開發(fā)的這套系統(tǒng)似乎讓我們看到了希望?!斑@個系統(tǒng),不需要讓視障人士依靠人類向導或導盲犬即可自己跑完全程?!边h望智庫AI事業(yè)部部長、圖靈機器人首席戰(zhàn)略官譚茗洲說。

  據(jù)介紹,這個應用程序使用人工智能模型來識別道路上的一條畫線,并推斷出跑步者與這條線的關系。如果跑步者離線太遠,該應用程序就會向他們佩戴的骨導耳機發(fā)送信號,播放令人不快的噪音。聲音是哪只耳機發(fā)出的、音量有多大,都能讓跑步者知道他們需要移動的方向及其離終點有多遠。

  譚茗洲解釋道,這有點像汽車上使用的接近警報,當汽車離可能發(fā)生碰撞的地方越近時,警報的聲音就會越大,頻率也會越快。使用谷歌的這個系統(tǒng),跑步者需要把一部安卓手機與經設計的腰帶綁在腰上。這款應用程序不需要連接互聯(lián)網即可工作,而且還可考慮多種光照和天氣條件。顯然,若在一些社區(qū),專門為視障人士建立帶有指引標志的賽道,他們自己便可以安心愉快地奔跑健身。

  構建無障礙場景,所感如所見

  “視障人士只是眼睛看不見,聲音是可以聽到的,目前的AI科技讓他們真正看見世界不太可能,但可以讓他們體驗到‘如同看見’的效果?!弊T茗洲指出。

  如今,許多互聯(lián)網公司都通過各種方式成功讓視障人士與他們提供的服務實現(xiàn)互動,主要方法就是將文本轉變成由屏幕閱讀器發(fā)出的語音。4年前,臉譜公司(Facebook)發(fā)起“無障礙倡議”,嘗試采用人工智能技術來豐富盲人、聾人和其他殘疾人士的用戶體驗,重點工作之一是重新設計菜單和按鈕結構,運用自動口譯某些照片和視頻的算法使其能為屏幕閱讀器所用,為視障用戶提供豐富的場景描述。

  作為美國一位專業(yè)徒步旅行者,視障人士特雷弗·托馬斯時不時在臉譜上與粉絲分享其帶著愛犬到一些山徑和步道徒步旅行的照片和視頻。他感慨道:“之前因看不見照片,我對是否使用臉譜無所謂,而現(xiàn)在我無法想象沒有臉譜的日子了。”例如,對于舊金山灣落日的照片,含有人工智能技術的屏幕閱讀器會如此描述:這張照片含有自然、戶外、云朵、草地、地平線、植物或樹木;一對夫婦帶著孩子站在加州丹麥城著名風車前面的照片,屏幕閱讀器詮釋:這張照片包括了3個人,微笑,戶外。

  “顯然,這些解釋不能對照片進行全面描述,但在沒有人工幫助的前提下確實能填補某些空白,視障人士僅需點擊閱讀器來描述,而無須他人來做解釋?!弊T茗洲說。

  瑞士eyra公司專門為視障人士研發(fā)了一種助讀設備。據(jù)介紹,這個裝置由三部分組成:掛在耳朵上面的骨傳導耳機及其上面的高清攝像頭,還有AI處理器。AI處理器可以將文本轉化成有聲小說,當然也不用擔心噪音干擾的問題,因為是骨傳導,可以一定程度上減少噪音干擾,給視障人士的生活帶來便利。

  今年在拉斯維加斯舉辦的世界最大消費類電子產品展會上,一款智能手機可以通過語音講述周圍的世界,賦予視障人士和弱視用戶更豐富的視覺體驗。該應用還可適配智能眼鏡,可將用戶的智能手機攝像頭變成用戶的眼睛。據(jù)介紹,其利用人工智能識別攝像頭指向的視覺信息,包括食品包裝、海報和顯示屏,比如超市的商品信息、車站的顯示投屏、街邊的海報。此外,還可以識別記錄親朋好友的面孔,用戶可以用其掃描和尋找周圍的人和事。

  三方面發(fā)力,釋放科技的人文關懷

  據(jù)美國勞工部和美國盲人聯(lián)盟的統(tǒng)計資料表明,目前視障人士可以順利就業(yè)的職業(yè)達147種。因此,有學者提出,要想改變視障人士的就業(yè)現(xiàn)狀,教育是關鍵一步,特殊教育也需科技化。

  目前,很多專為視障人士設計的解決方案,正凸顯著人工智能應用的多樣化和人性化。那么,如何加速人工智能產品的突破性運用,讓冰冷科技釋放出人文關懷?

  譚茗洲指出,這需要三方面發(fā)力。首先要培育創(chuàng)新生態(tài)?!霸?017年德勤全國創(chuàng)新精英挑戰(zhàn)賽總決賽上,一支四川大學在校學生團隊研發(fā)的一款視障人士Kindle閱讀器獲獎。”譚茗洲說,我們應該激勵更多像這樣為視障人士創(chuàng)新的技術成果,不讓其沉睡,盡早轉化成真正讓視障人士受益的產品,這就需要構建一個良好的創(chuàng)新生態(tài)。

  此外,要解決算力和成本之間的矛盾。譚茗洲介紹,機器學習訓練往往要消耗大量的算力,操作中會出現(xiàn)時間上的延遲與信息隱私的安全隱患,這就要將AI算法中的數(shù)據(jù)上傳到云端完成。而要滿足終端AI推理運算的實時、可用性需求,就要在本地處理大量的數(shù)據(jù),但若在終端本身部署高性能的AI芯片,從成本控制上來看不大現(xiàn)實,在實體場景中部署足夠多的邊緣AI更具一定可行性。

  邊緣計算可看作是5G+AI+云計算的絕佳輔助——“神經末梢”。比如AI導盲杖要實現(xiàn)實時交互與判斷,看到紅綠燈變綠,能夠自動判斷出“可通行”的狀態(tài)。運用邊緣計算就不必將路燈信息上傳到云端,經云服務器層層判斷才發(fā)出行走的提醒。這無疑大大減少延遲帶來的行進風險,也降低云端計算的超負荷。

  最后,還需要等待產業(yè)環(huán)境的全面成熟:基礎設施的完善,軟硬件基本到位,這樣可在終端設備上更好運行深度學習算法。“加強5G智能網絡建設,保障云計算及邊緣計算的每一個節(jié)點高效可靠利用?!弊T茗洲指出。

開通會員,享受整站包年服務立即開通 >