當AI遇到世界杯:梅西的封神之路,多了一些特殊觀眾
大數據文摘授權轉載自學術頭條
梅西圓夢了。
每屆世界杯都會造就英雄,但也會有人率先離場。然而,足球場上滾動的,不僅有球員們的汗水,觀眾的歡呼,也有歷屆世界杯所迭代的科技。
自1904年FIFA國際足聯成立后,世界杯走進了人們的視線。但直至上世紀50年代,隨著電視轉播技術的出現,它才真正走向了千家萬戶。1998年的法國世界杯,電視轉播觀眾人數達到40億人次。然而,時至今日,依舊有一些人需要這樣的“聲音”。
距離卡塔爾6000多公里外,身穿紅色連衣裙、扎著馬尾辮的“主播”弋瑭,開始了她繁忙的一天,不斷向全世界傳遞著這樣的“聲音”。
圖|“主播”弋瑭為世界杯進行手語播報
從“奧運會”走向“世界杯”
來自世界衛生組織(WHO)的數據顯示,截至 2021 年 4 月 1 日,全球約有 15 億人罹患某種程度的聽力損失,其中約有 4.3 億人需要針對聽力損失的康復服務;到 2050 年,預計將有近 25 億人存在某種程度的聽力損失,至少 7 億人需要聽力康復。因此,由AI技術驅動的手語數字人屆時或將出現在各種各樣的實際場景中,是聽障人士在試圖認識世界、感受世界時必不可少的幫手。
早在今年的北京冬奧會、北京冬殘奧會上,一個同樣身穿紅色西裝的AI手語數字人,就在北京衛視《北京您早》節目中對“冬奧賽事集錦”和“一起看冬奧”進行了手語播報,不僅降低了播報工作的運營成本,還為聽障人士收看冬奧賽事提供了便利。她便是第一代手語數字人“華同學”。她源于北京市科委科技冬奧專項支持的“冬奧手語播報數字人系統”課題技術成果,經北京冬奧會、冬殘奧會期間實踐應用改進提升而來。
圖|“華同學”助力冬奧會現場
AI手語數字人華同學的數據基礎以《國家通用手語》為標準,采集大量動態數據,構建了符合國家通用手語規范的國內最大規模多模態手語語料庫。智譜AI的研發團隊基于大規模預訓練模型構建手語數字腦,通過語義蒸餾算法與手語翻譯模型,生成和原文語義高度接近、語義精簡且符合手語表達習慣的手語詞序列。最后,通過跨模態擬人生產算法,驅動AI手語數字人華同學能夠以連貫、精準的手勢動作、表情、口型,為觀眾朋友提供專業、準確的手語體育賽事解說。
而在這個冬天,華同學“學會”了更多的新知識。基于冬奧手語數字人科研成果,她新學了足球相關手語詞90個,提取了2018年世界杯8場比賽近1000分鐘的語音解說文本,進行手語翻譯詞序列的語料標注,補充12場比賽14個球隊365名球員的手語表達方式。然后,她走向了“世界杯”。
“華同學”賦能“弋瑭”
升級后的“華同學”不僅能夠為賽事提供更加連貫精準的手勢、表情以及口型動作,還能賦能給其他的數字人。此次世界杯,她便賦能“弋瑭”,倆人一同出場。她們超有感染力流暢的實時解說,帶給了觀眾們新奇的體驗。
圖|“華同學”賦能“弋瑭”聯袂播報
世界杯期間咪咕推出智能手語主播弋瑭,由智譜AI與凌云光提供技術支持。那么, “華同學”是如何賦能給“弋瑭”的呢?主要包括以下三點原因:
新增手語詞手勢數據:依據《體育和律動常用詞通用手語》以及世界杯解說高頻詞語,新增足球、足球項目裁判手勢、足球聯賽等相關手語詞,共計90個。
補充語料:為提升手語翻譯引擎在世界杯解說中的表現,項目組提取2018年俄羅斯世界杯,8場比賽近1000分鐘的語音解說文本,進行手語翻譯詞序列的語料標注。并根據手語數智人解說場次,補充12場比賽14個球隊365名球員的手語表達方式。
手語翻譯算法:足球領域屬于特定領域,通用領域的知識難以直接滿足特定的業務場景,基于這點,智譜AI選擇使用原始模型加上少量的領域數據對來獲取一個面向特定領域的手語翻譯模型。為了提高模型的泛化能力以及領域適配性,他們采用了一種新穎的正負樣本生成的對比學習方法,以區分正確的輸出和正確輸出。
讓“世界”更有“愛(AI)”
此次為世界杯加油助力的數字人技術,是借助基于深度神經網絡的自然語言處理、高逼真度3D渲染、行業手語語料庫、融合手語知識的翻譯模型等技術,讓更多人感受到了綠茵場上的賽事激情。
但AI技術需要持續不斷地發展,不能在賽事之后變為“寂靜的森林”。智譜AI也將繼續秉承著MaaS(Model as A Service/模型即服務)的理念,提供模型共訓服務、模型授權服務,以及API開放平臺,圍繞平臺形成人工智能的應用生態。在數字人技術方面,智譜AI也將持續研發技術,開放多層次的應用,包括手語播報、手語翻譯以及AI手語詞典,為殘障人士平等參與社會生活創造無障礙環境,切實提高大家的社會參與感和生活幸福指數。
讓科技服務公益,讓世界更有愛(AI)。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。