新聞中心

        EEPW首頁 > 智能計算 > 設計應用 > 超強NLP思維導圖,知識點全面覆蓋:從基礎概念到最佳模型,萌新成長必備資源

        超強NLP思維導圖,知識點全面覆蓋:從基礎概念到最佳模型,萌新成長必備資源

        作者:栗子 時間:2019-09-29 來源:量子位 收藏

        本文經AI新媒體量子位(公眾號 ID: QbitAI)授權轉載,轉載請聯系出處。

        本文引用地址:http://www.104case.com/article/201909/405420.htm

        一只萌新,想把自己修煉成一個成熟的NLP研究人員,要經過一條怎樣的路?

        有個名叫Tae-Hwan Jung的韓國小伙伴,做了一份完整的思維導圖,從基礎概念開始,到NLP的常用方法和著名算法,知識點全面覆蓋。

        可以說,從0到1,你需要的都在這里了:

        這份精致的資源剛剛上線,不到一天Reddit熱度就超過400,獲得了連篇的贊美和謝意:

        “肥腸感謝?!薄拔倚枰木褪沁@個!”“哇,真好??!”

        所以,這套豐盛的思維導圖,都包含了哪些內容?

        四大版塊

        就算你從前什么都不知道,也可以從第一個版塊開始入門:

        1 概率&統計

        從中間的灰色方塊,發散出5個方面:

        基礎 (Basic) ,采樣 (Sampling) 、信息理論 (Information Theory) 、模型 (Model) ,以及貝葉斯 (Baysian) 。

        每個方面,都有許多知識點和方法,需要你去掌握。

        畢竟,有了概率統計的基礎,才能昂首挺胸進入第二個板塊。

        2 機器學習

        這個版塊,一共有7個分支:

        線性回歸 (Linear Regression) 、邏輯回歸 (Logistic Regression) 、正則化 (Regularization) 、非概率 (Non-Probabilistic) 、聚類 (Clustering) 、降維 (Dimensionality Reduction) ,以及訓練 (Training) 。

        掌握了機器學習的基礎知識和常用方法,再正式向NLP進發。

        3 文本挖掘

        文本挖掘,是用來從文本里獲得高質量信息的方法。

        圖上有6個分支:

        基本流程 (Basic Procedure) 、圖 (Graph) 、文檔 (Document) 、詞嵌入 (Word Embedding)、序列標注 (Sequential Labeling) ,以及NLP基本假設 (NLP Basic Hypothesis)。

        匯集了NLP路上的各種必備工具。

        4 自然語言處理

        裝備齊了,就該實踐了。這也是最后一張圖的中心思想:

        雖然只有4個分支,但內容豐盛。

        一是基礎 (Basic) ,詳細梳理了NLP常用的幾類網絡:循環模型、卷積模型和遞歸模型。

        二是語言模型 (Language Model) ,包含了編碼器-解碼器模型,以及詞表征到上下文表征 (Word Representation to Contextual Representation) 這兩部分。許多著名模型,比如BERT和XLNet,都是在這里得到了充分拆解,也是你需要努力學習的內容。

        三是分布式表征 (Distributed Representation) ,許多常用的詞嵌入方法都在這里,包括GloVe和Word2Vec,它們會一個個變成你的好朋友。

        四是任務 (Task) ,機器翻譯、問答、閱讀理解、情緒分析……你已經是合格的NLP研究人員了,有什么需求,就調教AI做些什么吧。

        看完腦圖,有人問了:是不是要把各種技術都實現一下?

        韓國少年說:“不不,你不用把這些全實現一遍。找一些感覺有趣的,實現一波就好了。”

        △ 作者Tae-Hwan Jung,來自慶熙大學

        One More Thing

        Reddit樓下,許多小伙伴對這套腦圖表示膜拜,并且想知道是用什么做的。

        韓國少年說,Balsamiq Mockups。

        GitHub傳送門:https://github.com/graykode/nlp-roadmap

        Reddit傳送門:https://www.reddit.com/r/MachineLearning/comments/d8jheo/p_natural_language_processing_roadmap_and_keyword/



        關鍵詞:

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 会宁县| 蓬莱市| 库伦旗| 金堂县| 永泰县| 米林县| 伊川县| 大名县| 汉川市| 长春市| 梁平县| 中西区| 桂林市| 奈曼旗| 临邑县| 会宁县| 漳平市| 郸城县| 湘乡市| 屯门区| 原阳县| 双桥区| 梁平县| 洞头县| 梁山县| 乐山市| 怀宁县| 金乡县| 达拉特旗| 休宁县| 台南市| 贵港市| 南汇区| 喀喇沁旗| 邹城市| 永善县| 二连浩特市| 云浮市| 永德县| 鄂尔多斯市| 台山市|