博客專欄

        EEPW首頁 > 博客 > 有哪些深度學習效果不如傳統方法的經典案例?

        有哪些深度學習效果不如傳統方法的經典案例?

        發布人:計算機視覺工坊 時間:2021-04-12 來源:工程師 發布文章

        作者丨桔了個仔、莫笑傅立葉、LinT

        來源丨知乎問答

        編輯丨極市平臺

        深度學習作為目前最前沿的科技領域之一,一般都引導著科技進步,但是是否存在一些深度學習的效果反而不如傳統方法的案例呢?本文匯總了一些該問題下的優質回答,回答均來自知乎。 >>加入極市CV技術交流群,走在計算機視覺的最前沿

        1.png

        問題鏈接:https://www.zhihu.com/question/451498156

        # 回答一

        作者:桔了個仔

        來源鏈接:https://www.zhihu.com/question/451498156/answer/1802577845

        對于解釋性有要求的領域,基本深度學習是沒法和傳統方法比的。我這幾年都在做風控/反洗錢的產品,但監管要求我們的決策要可解釋性,而我們曾經嘗試深度學習,解釋性很難搞,而且,效果也不咋地。對于風控場景,數據清洗是非常重要的事,否則只會是garbage in garge out。

        在寫上面內容時,我想起前兩年看的一篇文章:《你不需要ML/AI,你需要SQL》

        https://news.ycombinator.com/item?id=17433752

        作者是尼日利亞的軟件工程師Celestine Omin,在尼日利亞最大的電商網站之一Konga工作。我們都知道,對老用戶精準營銷和個性化推薦,都是AI最為常用的領域之一。當別人在用深度學習搞推薦時,他的方法顯得異常簡單。他只是跑了一遍數據庫,篩選出所有3個月沒有登錄過的用戶,給他們推優惠券。還跑了一遍用戶購物車的商品清單,根據這些熱門商品,決定推薦什么相關聯的商品。

        結果,他這種簡單的而基于SQL的個性化推薦,大多數營銷郵件的打開率在7-10%之間,做得好時打開率接近25-30%,是行業平均打開率的三倍。

        當然,這個例子并不是告訴大家,推薦算法沒用,大家都應該用SQL,而是說,深度學習應用時,需要考慮成本,應用場景等制約因素。我在之前的回答里(算法工程師的落地能力具體指的是什么?),說到過算法落地時需要考慮實際制約因素。

        https://news.ycombinator.com/item?id=17433752

        2.jpg

        而尼日利亞的電商環境,依然出于非常落后的狀態,物流也跟不上。即使使用深度學習方法,提升了效果,實際對公司整體利潤并不會有太大影響。

        所以,算法落地時必須「因地制宜」否則,又會出現「電風扇吹香皂盒」的情況。

        某大企業引進了一條香皂包裝生產線,結果發現這條生產線有個缺陷:常常會有盒子里沒裝入香皂。總不能把空盒子賣給顧客啊,他們只得請了一個學自動化的博士后設計一個方案來分揀空的香皂盒。

        博士后拉起了一個十幾人的科研攻關小組,綜合采用了機械、微電子、自動化、X射線探測等技術,花了90萬,成功解決了問題。每當生產線上有空香皂盒通過,兩旁的探測器會檢測到,并且驅動一只機械手把空皂盒推走。

        中國南方有個鄉鎮企業也買了同樣的生產線,老板發現這個問題后大為發火,找了個小工來說“你他媽給老子把這個搞定,不然你給老子爬走。”小工很快想出了辦法他花了190塊錢在生產線旁邊放了一臺大功率電風扇猛吹,于是空皂盒都被吹走了。

        (雖然只是個段子)

        深度學習是錘子,而世間萬物不都是釘子。

        # 回答二

        作者:莫笑傅立葉

        來源鏈接:https://www.zhihu.com/question/451498156/answer/1802730183

        有兩個比較常見的場景:

        1.追求可解釋性的場景。

        深度學習非常善于解決分類和回歸問題,但對于什么影響了結果的解釋很弱,如果實際業務場景中,對于解釋性要求很高,諸如以下場景,那么深度學習往往被干翻。

        3.jpg

        2. 許多運籌優化場景

        諸如調度,規劃,分配問題,往往這類問題無法很好的轉化為監督學習格式,因此常采用優化算法。在現在研究中,在求解過程中往往融合深度學習算法更好地求解,但總體而言,模型本身還不是深度學習為主干。

        深度學習是一個非常好的求解思路,但不是唯一,甚至在落地時依舊問題很大。若將深度學習融合于優化算法,作為求解的一個部件,依舊有很大的用武之地。

        總之,

        4.png

        # 回答三

        作者:LinT

        來源鏈接:https://www.zhihu.com/question/451498156/answer/1802516688

        這個問題要分場景看。深度學習固然免去了特征工程的麻煩,但是在一些場景下應該很難應用:

        應用對時延有高要求,而對精度沒有那么高的要求,這時簡單的模型可能是更好的選擇;

        一些數據類型,例如tabular數據,可能更適合使用基于樹的模型等統計學習模型而不是深度學習模型;

        模型決策有重大影響,例如安全相關、經濟決策相關,要求模型具有可解釋性,那么線性模型或者基于樹的模型,相對深度學習是更好的選擇;

        應用場景決定了數據采集難,使用深度學習有過擬合的風險。

        真實的應用都是從需求出發的,拋開需求(精度、時延、算力消耗)談表現是不科學的。如果把問題中的『干翻』限定到某個指標上,可能討論范圍可以縮小一些。

        本文僅做學術分享,如有侵權,請聯系刪文。

        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞:

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 西乌| 五寨县| 临清市| 乌鲁木齐县| 那坡县| 闵行区| 呈贡县| 台安县| 淮南市| 上杭县| 虞城县| 新邵县| 临泉县| 罗定市| 县级市| 金塔县| 香港 | 咸宁市| 拜泉县| 安达市| 彰化市| 景洪市| 龙泉市| 秀山| 芦溪县| 灌云县| 镇坪县| 东阳市| 水城县| 吉林市| 县级市| 清河县| 江口县| 平乡县| 安图县| 靖江市| 台前县| 微山县| 监利县| 万年县| 开封县|