新聞中心

        EEPW首頁 > 智能計算 > 業界動態 > 科技新聞機器人亮相,人工智能還能為科學交流做些什么

        科技新聞機器人亮相,人工智能還能為科學交流做些什么

        作者: 時間:2019-08-16 來源:科技日報 收藏

        近日,一款看起來挺有文化的上線了。它叫,由中國科學報社和北京大學科研團隊共同研發。

        本文引用地址:http://www.104case.com/article/201908/403811.htm

        寫的不是普通的稿子,而是中文科學新聞。據中國科學報副總編輯、項目負責人張明偉介紹,以論文英文摘要為基礎,能夠快速寫出中文科學新聞底稿,然后由專業人士和報社的編輯進行把關和信息完善,幫助科學家以中文方式快速獲取全球高水平英文論文中的最新科研進展。

        小柯的作品已經上線。的觸角,也在伸向各個領域。

        小柯:一個盡職的摘要翻譯轉寫者

        記者發現,7月5日,小柯機器人發出第一篇稿子,截止至8月14日記者統計時,小柯機器人共發稿350篇。初期更新時間距論文發表時間間隔一個月左右,現在可以做到當天或隔天更新,每天更新幾到二十幾篇左右不等。所選論文來自生命科學等領域,涉及《自然》《細胞》《新英格蘭醫學雜志》等期刊。

        記者對照分析了小柯作品《單細胞測序揭示冠狀動脈疾病保護機制》及其英文原文。新聞中,小柯先對論文主題、研究單位以及發表期刊進行簡單介紹,后接英文原文摘要的翻譯,大致反映原文內容;翻譯時會對原文進行適當的語句簡化,同時在對專業詞語的翻譯上也使用了如“血管平滑肌細胞”“保護性纖維帽”等專業表述。

        不過,這也不全是小柯的功勞,因為稿件發出前,還有人工審校這一步驟。北京大學計算機科學技術研究所研究員萬小軍團隊負責小柯的系統總體設計與聯合技術攻關。 他告訴記者,目前機器翻譯系統的性能很大程度上依賴于其所使用的訓練數據,即平行語料。目前的平行語料多為新聞語料,因此訓練得到的機器翻譯模型對于日常新聞的翻譯效果較好。但學術文獻(比如生物學術論文)與日常新聞在用詞造句等方面都有較大差別,機器翻譯系統對于學術文獻翻譯的效果并不理想。

        這一次,他們通過融合領域知識進行語句智能篩選,選擇適合大眾理解的語句,并基于語句簡化提升語句翻譯質量。“英文學術論文摘要適合專業科研人員閱讀,但摘要中的語句并不都適合寫到科學新聞中面向大眾傳播,因此需要結合科學報編輯提供的先驗知識,采用計算機算法對語句進行篩選,保留適合進行大眾新聞傳播的語句。”萬小軍說。

        涉及到語言和文字的地方,自然語言處理都能發揮作用

        研發小柯用了半年時間,萬小軍表示,和一般相比,一個好的跨語言科技新聞需要進行兩次重要的信息轉換過程:一次是不同語言的轉換,將英文文本轉換為中文文本;另一次是語言風格的轉換,將學術型文字表達轉換為大眾能夠接受的通俗文字表達。“這兩次轉換都具有較大的挑戰性,目前并沒有完全解決。后續還需要進一步積累數據,調整算法模型,才能取得更好的效果。”

        接下來,團隊還將繼續優化小柯,讓他寫出的科學新聞內容更豐富,表達更生動。

        當然,翻譯撰寫科技新聞稿件,只是自然語言處理等技術在學術交流中所能大顯身手的領域之一。

         “基本上,只要人類交流和工作過程中涉及到語言和文字的地方,自然語言處理技術都有可能發揮作用。”萬小軍說,在科研論文寫作過程中,可以借助自然語言處理技術幫助推薦參考文獻,并自動生成related work等章節的文字;業界也有工作嘗試基于自然語言處理技術自動編撰圖書。“我個人也接觸到很多很有意思也很有挑戰的應用需求,但可惜的是不少需求都無法基于目前的自然語言處理技術進行實現。自然語言處理技術還需要進一步的發展和突破,我相信在未來將有更多的用武之地。” 



        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 峨边| 儋州市| 新蔡县| 长顺县| 包头市| 中宁县| 馆陶县| 明星| 五大连池市| 舒兰市| 武乡县| 抚松县| 古田县| 灯塔市| 石屏县| 屏山县| 汽车| 南溪县| 平邑县| 疏附县| 盱眙县| 阜新市| 策勒县| 甘谷县| 通海县| 蒙自县| 陈巴尔虎旗| 云安县| 龙游县| 健康| 平乐县| 宁南县| 清徐县| 壤塘县| 淮安市| 阿城市| 博白县| 达拉特旗| 泰和县| 双牌县| 资源县|