獨家 | 增強數據庫管理:一份簡單的綜述
翻譯:王可汗校對:趙茹萱
一個高效設計的數據庫管理系統對于企業來說是至關重要的,它的目標是最大化其分析計劃的影響,并發展到使用高效的數據和人工智能驅動的工具。但是正如我們所看到的,數據管道的數據準備階段對于數據科學家和相關專業人員來說是勞動密集型的,并且可能會引發效率問題。增強分析極大地幫助了整個過程,從數據收集到提供有深刻見解的建議,通過這些過程來影響業務決策。
那么,增強數據庫管理到底是什么呢?增強數據管理正在使用ML和AI技術來優化和改進操作。它有能力支持數據科學家手中那些通常可能由個人分析和工具手工完成,耗時多且數據密集的任務。
例如:在大型數據集中發現異常,想要解決數據質量問題,并從報告中追溯特定數據的起源。人工智能模型更復雜,專門設計用于執行這些數據管理任務,通常花費更少的時間,犯更少的錯誤,從長遠來看成本更低。
人們甚至可以改進現有的數據管理平臺和工具,以試驗增強數據管理。通過仔細觀察,增強數據管理的用例可能會支持和加速如下所述的一些事情:
元數據管理和組織:標簽、分類和搜索數據更加容易。自動收集、組織、編目和合并技術和業務元數據,包括結構化數據和非結構化數據。利用人工智能識別系統依賴關系、數據流和異常。
數據質量:識別和解決數據質量問題。基于現有數據集提出數據質量規則并運行。識別模式和異常,并模擬相關性。根據預測值和手動數據,清理建議數據清理的操作。
主數據管理:識別和評估潛在的主數據。自動生成主數據模型,映射數據實體。基于使用模式、信任分數等,建議匹配和合并的操作,以建立單一的真實來源。
一些增強數據管理工具:IBM的Cognos Analytics,微軟的AnswerRocket, Oracle Analytics Cloud, The Analytics OS (Pyramid v2020)。
顯然,增強數據管理需要一些人為的監督。在這里,人、ML和人工智能相互補充,填補彼此的缺陷,從而創造出令人印象深刻的工作系統。
增強數據管理中的機器學習使一些數據專業人員的常規手工任務自動化。這些工作包括數據庫性能調優和優化,以及其他計算密集和迭代的數據庫管理工作。
然而,一些數據分析師表示,自動化模式可能會減少入門級數據庫管理員職位的數量,但這并不會影響對數據管理人員技能和貢獻的要求。增強數據管理利用機器學習工具或人工智能程序,能夠為人們在做出最終決定時提供智能建議。
企業需要重做數據管理流程,最終目標是實現數據流通過程的自動化,推進對信息的進一步分析。使用正確的數據管理工具,能夠幫助公司通過清理信息的復雜性來升級產品。減少復雜性是任何企業努力實現商業目標的關鍵,創業公司也是如此。因此,利用增強數據管理實踐是繼續認真對待和給藍籌公司提供資金的前進道路。
感謝您閱讀這一小段內容,希望這篇文章能夠使您得到一些啟示!
原文標題:Augmented Database Management: A Brief Overview原文鏈接:https://medium.com/@jmayuresh25/augmented-database-management-a-brief-overview-514be9598012
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。