博客專欄

        EEPW首頁 > 博客 > 著眼用戶需求,vivo 致力于用 AI 實現“1001 個便利”

        著眼用戶需求,vivo 致力于用 AI 實現“1001 個便利”

        發布人:AI科技大本營 時間:2022-11-20 來源:工程師 發布文章

        當前信息技術已經進入人機物融合、萬物智能互聯的階段,人工智能作為引領新一輪科技革命和產業變革的重要戰略性技術,成為各行業數字化重構的神兵利器。與我們生活息息相關的諸如智能家居、智能汽車、智慧手機等等終端設備的“智”化發展都離不開 AI 技術的支撐。

        在移動終端設備中,人們日益攀升的通信、娛樂、辦公、出行等體驗優化需求,驅動著智能手機的不斷迭代。如今“一部手機走天下”的愿景已經逐漸照進現實,而 AI 憑借著巨大的發展潛力,以及對行業多邊應用的推動力,將成為用戶體驗提升的關鍵技術,一個新的創新感知時代已經來臨。

        聚焦 AI 創想的無限可能,國內手機大廠 vivo 基于用戶體驗需求以及對智能終端行業敏銳的感知,向大眾展示了軟硬兼具的實力與美好藍圖。


        圖片

        深耕 AI,蓄力前行


        自 2017 年起,vivo 便開始組建 AI 全球研究院,憑借著“希望幫助所有消費者享受科技帶來的美好生活”的初心,不斷攻克技術壁壘、擴充團隊規模,下沉技術深度的同時,也在探索并布局應用的多維度發展。

        vivo 高級副總裁施玉堅在 2022 vivo 開發者大會上表示,“我們堅持用戶導向,從用戶的視角出發,穿著用戶的鞋子在企業里奔跑,堅持設計驅動,通過設計驅動完成用戶導向的落地,并通過不設上限的持續研發投入,拓展消費電子行業人文與科技的邊界。”

        當 AI 重新定義世界,vivo 也在開拓邊界。經過 5 年多的努力,今天的 vivo AI 全球研究院已經有超過 1000 名 AI 工程師,在算法、數據、算力方面建立了全面的技術能力,全方位賦能了 vivo 的核心業務,覆蓋手機、互聯網、營銷等領域。


        圖片

        AI 打造 1001 個便利


        基于“AI 打造優質體驗”的技術驅動,vivo 希望依托 OriginOS 能力,以用戶使用手機的多元化場景為載體,致力于為用戶打造“1001 個便利”,讓科技照亮美好未來。

        圖片

        截至目前,OriginOS AI 已經實現了 500 多個功能,涉及諸如娛樂時聽歌識曲、AI 字幕翻譯、屏幕朗讀,生活中提醒充電、取快遞,拍照時 AI 感知引擎讓顏色識別更準確、清晰出片,工作時拍攝電腦屏幕消除摩爾紋,出行時自動彈出乘車碼通知等等使用場景,為用戶提供無處不在的驚喜。

        圖片

        vivo 不僅為普通用戶提供便利,為特殊人群也打造了諸多便捷功能。例如,針對聽障人士的日常溝通需求,vivo 整合了核心 AI 技術,聯合中國聽力醫學發展基金會發布了“聲聲有息”公益計劃,推出“無障礙通話”“vivo 聽說”及“聲音識別”等功能,為聽障人士搭建溝通的橋梁,營造更友好的信息無障礙社會環境。

        vivo 堅持以用戶為導向,持續發力技術創新,用有溫度的科技,讓每個人都能享受科技進步帶來的快樂,用科技去照亮美好未來。

        圖片

        • AI 感知引擎:通過 AI 計算攝影技術讓手機能夠像專業攝影師一樣理解世界,通過智能的白加黑減和白平衡算法,使得純色場景能夠做到精準還原。

        • 琥珀掃描:運用文檔圖像處理和 OCR 文字識別技術,讓手機化身為便攜掃描儀,辦公學習更加高效。

        • 朗讀屏幕:基于 vivo 自研的個性化語音合成系統,研發出的豐富多元的合成聲音,解放雙手雙眼,為用戶打造流暢舒適的閱讀新體驗。

        • 翻譯機:支持二十多個主流語種的互譯,跨語言溝通不再有障礙,讓用戶生活學習隨心自由。

        • Jovi 輸入法 Pro:自研拼音、語音、手寫三大輸入法 AI 內核,和 OS 深度結合,為用戶提供安全、高效的輸入體驗

        • Jovi 語音助手:智能生活助理,用戶通過可以通過與手機的語音指令交互,解放雙手,一句話搞定各種復雜操作。

        • vivo 手語識別虛擬人:既能流利地通過手語進行表達,還能快速識別手語,幫助聽障人士與他人順暢溝通。

        • ……


        圖片

        強大技術原力,創造用戶驚喜


        便捷的服務、高效的體驗往往需要強大的技術原力作為支撐。

        圖像是日常生活中 AI 最常用的場景之一,我們拍照首先要拍得清,vivo AI 通過自主研發的文檔圖像處理引擎與 OCR 文字識別技術的核心算法,實現了囊括文檔掃描、實況文本、表格識別、試卷去手寫&算式批改等在內的多重功能。

        1. 文檔圖像處理引擎:可以對文檔進行自動裁剪矯正以及超清修復,幫助用戶更便捷、更清晰的記錄好文檔。一方面通過優化檢測、分割以及邊緣線精修三個模塊來共同提升檢測框的精度,同時,通過疊加光流跟蹤模塊,進一步提升了檢測框的穩定性。優化后的檢測框做到了既準又穩,用戶在拍攝時可以享受一拍即得。此外,通過疊加全局超清模塊,不僅有效提升了文檔的色彩表現力,還能讓文字更加清晰和銳利,用戶一鍵即可自動完成之前需要多次操作才能完成的任務。通過超清修復,近距離拍屏幕可以去除摩爾紋,開會拍 PPT 能去除人頭遮擋。

        2. OCR 文字識別引擎:能夠幫助用戶智能識別圖片中的文字,即便是褶皺彎曲的手寫字也能做到準確快速的識別。在視覺模型的基礎上疊加了語言模型進行融合識別,進一步提升了模糊、手寫等低質量圖像場景下的識別準確率。同時,由于算法都是運行在手機本地不需要傳輸網絡,不僅使得體驗不受網絡穩定性影響,還更好的保障了用戶的數據隱私安全。當想要將書稿文字快速錄入筆記時,只需調起相機掃描就可以將文字實時上屏,不管是書稿還是手寫稿都可以做到又快又準,高效提取。

        圖片

        把圖像拍清之后,下一步就是要把圖像拍好,因此 vivo 團隊自 2018 年起便持續在 AI 計算攝影方面專注投入。今年,vivo 攜手蔡司基于 AI 計算攝影能力,從“智能白加黑減技術”和“智能白平衡技術”入手,還原極致色彩,讓拍攝充滿驚喜。

        1. 智能白加黑減技術:vivo 在行業內首次解決了“白加黑減”場景下曝光不準確的問題。拋棄傳統十八度中性灰曝光方法中的測光假設,通過對畫面內所有區域進行觀察取值,基于深度神經網絡模型估計最優曝光參數。曝光準確率超過行業競品 20%。

        2. 智能白平衡技術:拋棄了傳統白平衡算法中的“灰世界”假設,考慮到亞洲人色彩恒常性的視覺特點,以及拍攝場景,從地域、光源、場景等多個維度構建豐富的色彩數據集。再基于人工智能模型去實際學習人眼看到的色彩,從而獲得更準確的白平衡參數。相對于行業競品,色彩精準度提升 13%。

        除了圖像處理之外,語音處理也是 AI 的另一個重要使用場景。vivo 的 AI 語音技術包括語音合成技術以及語音識別技術, 基于自研的語音合成系統,vivo 持續地研發出了豐富多元的合成聲音,實現了多音色、多風格以及多情感的合成技術。通過端到端建模、AI 降噪以及場景化語言模型等方式,克服了口音、噪音和專業領域等導致的識別錯誤,極大提升了語音識別的準確性。

        圖片

        面對日益豐富的國際交流和文化碰撞,vivo 通過機器翻譯技術助力用戶突破語言障礙。針對翻譯的重點人群、高頻場景、便捷入口均設計了產品方案,助力高效解決翻譯需求。

        此外,Jovi 語音助手自推出以來,一直圍繞著便利的技能、豐富的知識、貼心的閑聊三個方向不斷提升。目前 Jovi 語音助手已經支持超過 100 個場景垂類,超過 600 種用戶請求意圖,很好地滿足用戶在快捷操作、信息獲取、情感陪伴方面的需求。目前手機端日活已經超過 1000 萬,每個月小 v 都會和用戶產生 18 億次對話,回答 2 億個問題。

        當然,AI 帶來的便利遠不止這些,vivo 多年來深耕于手機使用典型場景的普適性和通用性,在智能終端行業內牽頭實現應用升級與迭代,反哺著行業創新發展,共同打造極致的用戶體驗。


        圖片

        堅持用戶導向,科技照亮美好未來


        在人文關懷方面,經過不懈的研發創新,vivo 實現了手語到文本再到語音的流暢互譯,推出了手機行業首個具備手語識別能力的虛擬人。目前的算法已經可以識別 1200 個手語詞匯,準確率在 80% 以上,已經達到漢語四級的理解水平,同時在手語表達方面,目前覆蓋了國家手語通用詞典超過 8000 個詞匯。AI 手語虛擬人既能流利的通過手語進行表達,還能快速識別手語看懂手語,幫助聽障人士更便捷地獲取信息,更高效地與人溝通。


        理念牽引,實干專注。發展多年,vivo 始終深耕于科技行業,并向大眾展示了一系列布局與探索:vivo 影像戰略發布,打贏了手機攝影之戰;開啟自研芯片之路,向世界展示了 vivo 敢于向技術深水區邁進的決心;堅持長期主義,重視核心科技研發,更是 vivo 長久、健康發展的“形象標簽”。

        暢想未來,vivo 將 AI 技術作為又一個研發重點:一方面 vivo 將在計算攝影、文檔掃描、語音技術、語義技術、機器翻譯、計算加速平臺、vivo 開發者平臺 AI 專區七大方向持續發力;另一方面 vivo 計劃逐步開放這些領先的 AI 能力,攜手行業伙伴合作共創,比肩為消費者打造極致的體驗,更是展現了手機行業巨頭的格局擔當。在這條鮮有前人的道路上與開發者們同行,為 5 億多全球 vivo 用戶以及更多消費者提供方方面面、無處不在的驚喜與激動人心的體驗,打造“1001 個便利”。

        圖片

        走出方寸天地,擁抱行業變幻。如何滿足用戶體驗,技術可以下沉到何種程度,手機產品如何在激烈的市場競爭中搶得關鍵先機?我們看到,vivo 一一給出了最優解。正如施玉堅所說,“我們堅持從用戶的真實需求出發,不斷創新和優化產品、以人文理念思考解決方案,努力成為更強大、更值得信賴的平臺。”

        科技帶來美好生活,未來的 vivo 將成就怎樣的自身以及行業,讓我們拭目以待。


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 大竹县| 昌平区| 平阳县| 黄山市| 婺源县| 贵德县| 宝丰县| 兴隆县| 岑巩县| 芜湖市| 定南县| 平果县| 蓝山县| 长白| 凤山市| 清苑县| 铁岭县| 东乌珠穆沁旗| 莲花县| 青海省| 承德市| 中江县| 筠连县| 射阳县| 深州市| 明星| 东兰县| 长乐市| 双柏县| 长丰县| 兰州市| 井冈山市| 东港市| 盐边县| 华池县| 股票| 上虞市| 漯河市| 高州市| 汕尾市| 平塘县|