新聞中心

        EEPW首頁 > 消費電子 > 業界動態 > 谷歌的終極武器是機器學習與語義搜索?

        谷歌的終極武器是機器學習與語義搜索?

        作者: 時間:2016-02-18 來源:網易科技 收藏
        編者按:完全地理解人類思維所傳達的意圖和微妙語義,這會是人工智能的將來,在搜索上運用只是初步。

          過去這幾年對于搜索引擎營銷者來說是激動人心的(或者說有些駭人,如果你不那么能夠接受變化的話)。引入了一系列新技術和系統來優化其已非常出色的搜索算法,它的競爭者如必應,蘋果,微軟,甚至是Facebook也引進或升級了對應的系統來優化它們的用戶搜索體驗。

        本文引用地址:http://www.104case.com/article/201602/287035.htm

          而這些優化的核心目標則是解決計算機與人工智能歷史上最困難的問題之一:對自然語言的獲取與理解。雖然機器非常擅長程序性和邏輯性的任務(如解數學方程或識別物體數據特征),但是它們難以辨析那些僅有母語使用者才能憑直覺感受到的微妙差異。舉個例子,對我們來說「最近的漢堡店在哪里」和「我想吃漢堡」兩句話傳達了相似的意圖,但是對于基本的機器而言,兩者差距甚大:第一句話是對特定信息的檢索,與說話者的想法無關;第二句話傳達了一個明確的欲望,與信息索取無關。過去幾年中,致力于打破不同語言間的隔閡并且解決其機器算法所面臨的問題。

          語義搜索的根源和蜂鳥算法

          2013年,伴隨著蜂鳥更新(Hummingbird update)的引入,語義搜索(Semantic Search)這一概念第一次進入人們的視野。此前,通過確定搜索查詢語句的關鍵詞來檢索出相應的網頁。就上述漢堡店的例子來說,谷歌會得到「漢堡」這個關鍵詞,并返回頻繁提到該關鍵詞的網頁——但這一方法不能真正捕捉用戶的意圖,它無法區分用戶是想搜索「漢堡店」還是「如何自制漢堡」。盡管還需完善,基于用戶意圖辨析的蜂鳥算法(Hummingbird)能夠捕捉到用戶意圖的關鍵因素并且「理解」頁面的內容,而不再拘泥于頁面所包含的關鍵詞。

          個人數字助理和語音搜索

          個人數字助理,包括谷歌Now和Siri等,需要更高水準的語義理解。目前出現了一些新的障礙,包括將口頭語句翻譯成輸入文本,找到合適的搜索方式,并且以一種可理解的方式進行回復。盡管在本質上,搜索結果的獲取依然還是依靠谷歌的標準搜索算法,但人工智能算法不斷改進,這些技術已經進步到了我們今天所能看到的水平。首要的動機是讓搜索變得更易用,但第二個動機卻是要改變用戶習慣:語音搜索需要使用對話輸入和上下文提示,比起傳統的基于關鍵詞的輸入,這需要更加強大、更相關的結果。

          RankBrain的出現 去年語義領域最大的新聞是RankBrain的出現,它是一種與蜂鳥算法相結合的機器學習算法。我概括了它的目的來對其進行簡要說明:

          它的作用是幫助谷歌理解用戶輸入的各種冗長復雜或者模棱兩可的口頭的查詢語句??梢赃@樣理解,它把那些不符合語法規則的糟糕輸入語句翻譯成可以被算法邏輯解讀的形式。而且因為利用了機器學習,它能夠自行更新,從而不再依賴開發者的人工調整和升級。

          「相關問題」的興起 為了讓用戶的搜索體驗更加飽滿,谷歌正在逐漸推廣「豐富答案」(rich answers)(在傳統的搜索結果上方時而出現的簡明版「答案」)。最近,谷歌更是推出了「相關問題」,它鼓勵用戶就其搜索主題進一步進行探索。尤為有趣的的是,目前「相關問題」的答案與各自對應的作為Rich Answers的答案是不同的,也就意味著兩者是基于谷歌搜索算法的不同區塊的(比如,我們可以谷歌知識圖譜(Knowledge Graph)和RankBrain)。無論如何,似乎谷歌正致力于不僅僅理解用戶的查詢問題,并且簡潔明了的回答它們。

          三大預測 為了推測出這些觀察情況的意義,我想要提供三種預測,預測谷歌接下來十年會如何選擇接下來的發展道路:

          1.機器學習會成為新的目標。目前,機器學習僅存在于谷歌搜索算法較為優化的一部分。我猜想,它的應用將延伸至其它領域,包括網頁內容質量分析(content quality analysis)和上下文反向鏈接評估(backlink context evaluation)。

          2.谷歌將致力于把每一條搜索查詢都轉化為可回答問句的形式。隨著豐富答案及相關問題的積累,很顯然谷歌希望向用戶提供最直接的信息。我想,我們將會見證谷歌在這個方向更多的努力,包括將基本的查詢語句轉化為復雜的、可回答的問句。

          3.新涌現出的科技將會讓更多人轉向語音搜索,這自然意味著語義更加復雜的問句和直接回答這些問句的答案。越多的人使用語音搜索,對谷歌來說則意味著更多的數據,對用戶來說則是更好的搜索結果——總的來說,我們會得到更加完善的搜索系統。因此,我猜想谷歌會推動更多人在未來的幾年里使用語音搜索。

          用你覺得合適的方式將這三個預測運用起來:你可以著手采用新的內容營銷策略來回應用戶的問題;或是使用新的技術進行搜索引擎優化(Search Engine Optimization),以避免機器學習所帶來的頻繁變化;再或者,你只需等待一個更加容易、更加符合直覺的搜索方式供自己使用。我們無法對未來下定論,但是回首過去短短幾年我們取得的巨大進步,可以預想,接下來的十年將是極具開創性的十年。



        關鍵詞: 谷歌

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 佛坪县| 连云港市| 漳平市| 孝义市| 石狮市| 仙居县| 宜城市| 浠水县| 大庆市| 抚宁县| 大石桥市| 北宁市| 徐州市| 乳源| 成都市| 晋城| 大方县| 阿拉善左旗| 新宁县| 阳城县| 霍山县| 工布江达县| 新密市| 丰都县| 澳门| 正蓝旗| 秀山| 北宁市| 诸城市| 曲靖市| 东光县| 晋城| 化隆| 伊宁市| 普洱| 日喀则市| 乃东县| 武冈市| 姜堰市| 衢州市| 赤城县|