新聞中心

        EEPW首頁 > 智能計算 > 業界動態 > 騰訊開源數據組件 Fast-Causal-Inference,可用于分布式向量化統計分析及因果推算

        騰訊開源數據組件 Fast-Causal-Inference,可用于分布式向量化統計分析及因果推算

        作者: 時間:2023-09-18 來源:IT之家 收藏

        IT之家 9 月 18 日消息,在其公眾號“開源”中宣布,旗下開源分布式數據科學組件項目 Fast-Causal-Inference 目前已經在 GitHub 中公布。

        本文引用地址:http://www.104case.com/article/202309/450642.htm

        ▲ 圖源 “開源”公眾號

        據悉,這是由騰訊微信研發,采用 SQL 交互的,基于分布式向量化的統計分析、因果推斷計算庫,據稱“解決已有統計模型庫 (R / Python) 在大數據下的性能瓶頸,提供百億級數據秒級執行的 Causal inference 能力,同時通過 SQL 語言降低統計模型使用門檻,易用于生產環境中,目前已在微信視頻號、微信搜一搜等微信內部多個業務進行了應用?!?/p>

        官方介紹:

        提供海量數據秒級執行的 Causal inference 能力 

        基于向量化 OLAP 執行引擎 ClickHouse / StarRocks,速度上更益于極致化用戶體驗。


        極簡的 SQL 使用方式

        SQLGateway WebServer 通過 SQL 語言降低統計模型使用門檻,并在上層提供極簡的 SQL 使用方式,透明做引擎相關的 SQL 展開和優化。

        提供基礎算子、高階算子的因果推斷能力,及上層的應用封裝

        支持 ttest, OLS, Lasso, Tree-based model, matching, bootstrap, DML 等。

        IT之家同時得知,官方表示,首個版本已經支持如下特性:

        基礎因果推斷工具

        • 基于 deltamethod 的 ttest,支持 CUPED

        • OLS,億行數據,亞秒級

        進階因果推斷工具

        • 以 OLS 為基礎的 IV,WLS,以及其他 GLS,DID,合成控制,CUPED,mediation 正在孵化

        • uplift:千萬數據分鐘級別運算

        • bootstrap / permutation 等數據模擬框架,解決沒有顯示解的方差估計問題

        參考




        關鍵詞: 騰訊 科學計算

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 浦城县| 克拉玛依市| 镇赉县| 普定县| 桂东县| 藁城市| 龙川县| 武山县| 株洲市| 红原县| 万全县| 五寨县| 黎城县| 平潭县| 抚州市| 修武县| 湖州市| 舒兰市| 温州市| 馆陶县| 张家川| 汉中市| 班戈县| 内黄县| 鄂托克前旗| 通辽市| 柞水县| 胶州市| 邯郸市| 东源县| 西林县| 涿州市| 五指山市| 同江市| 怀集县| 博野县| 富阳市| 青川县| 玛纳斯县| 东乌| 中阳县|