首頁(yè)  資訊  商機(jī)   下載  拆解   高校  招聘   雜志  會(huì)展  EETV  百科   問答  電路圖  工程師手冊(cè)   Datasheet  100例   活動(dòng)中心  E周刊閱讀   樣片申請(qǐng)
        EEPW首頁(yè) >> 主題列表 >> 大語(yǔ)言模型

        大語(yǔ)言模型 文章 最新資訊

        AI 顛覆者 DeepSeek 的下一代模型因 Nvidia GPU 對(duì)中國(guó)出口限制而延遲——AI GPU 短缺阻礙開發(fā)

        • (圖片來源:英偉達(dá))DeepSeek 憑借其今年的 R1 AI 模型吸引了大量關(guān)注,但似乎下一代 R2 模型的開發(fā)因中國(guó) Nvidia H20 處理器的短缺而停滯,據(jù) 信息報(bào)道 。DeepSeek 本身尚未評(píng)論其 R2 模型的發(fā)布時(shí)間。DeepSeek 使用由其投資者 High-Flyer Capital Management 獲得的包含 50,000 個(gè) Hopper GPU 的集群——其中包括 30,000 個(gè) H20、10,000 個(gè) H800 和 10,000 個(gè) H100——
        • 關(guān)鍵字: DeepSeek  AI  大語(yǔ)言模型  GPU  英偉達(dá)  

        特朗普的 AI 顧問:中國(guó)在芯片設(shè)計(jì)方面最多落后美國(guó)兩年

        • 根據(jù)彭博社,白宮加密貨幣和人工智能負(fù)責(zé)人大衛(wèi)·薩克斯表示,中國(guó)在半導(dǎo)體設(shè)計(jì)方面最多落后美國(guó)兩年,并且越來越擅長(zhǎng)規(guī)避美國(guó)的出口管制。薩克斯警告說,美國(guó)應(yīng)該關(guān)注華為迅速縮小與全球競(jìng)爭(zhēng)對(duì)手的差距,并引用了 DeepSeek 最近突破的人工智能模型作為證據(jù),表明中國(guó)盡管受到限制,但仍在不斷進(jìn)步。正如彭博社補(bǔ)充的那樣,他指出在 DeepSeek 推出之前,人們普遍認(rèn)為中國(guó)落后了好幾年——但 DeepSeek 的崛起表明,現(xiàn)在差距可能只有幾個(gè)月。他還批評(píng)了拜登政府的人工智能擴(kuò)散規(guī)則——特朗普政府上個(gè)月已撤銷該規(guī)則——
        • 關(guān)鍵字: AI  智能計(jì)算  大語(yǔ)言模型  

        越來越多的員工在使用人工智能,但企業(yè)仍然難以使其變得有用

        • GenAI 在工作場(chǎng)所的使用正在飛速發(fā)展。蓋洛普和 Salesforce AI 研究發(fā)布了兩份新報(bào)告,描繪了組織及其員工適應(yīng)這一技術(shù)轉(zhuǎn)變時(shí)日益增長(zhǎng)的熱情和持續(xù)的挑戰(zhàn)。這些研究共同揭示了一個(gè)核心主題:雖然 AI 比以往任何時(shí)候都更廣泛地被接受,但其在承諾與實(shí)際表現(xiàn)之間的差距仍然是企業(yè)和員工共同面臨的一個(gè)重大障礙。蓋洛普最新的研究發(fā)現(xiàn),過去兩年中,美國(guó)員工使用 AI 的頻率幾乎翻了一番。2023 年,只有 21%的工人報(bào)告稱每年至少使用幾次 AI;到 2025 年,這一數(shù)字飆升至 40%。頻繁使用——定義為每
        • 關(guān)鍵字: AI  智能計(jì)算  大語(yǔ)言模型  

        分析發(fā)現(xiàn),“推理”人工智能模型的改進(jìn)可能會(huì)很快放緩

        • 非營(yíng)利性人工智能研究機(jī)構(gòu)Epoch AI的一項(xiàng)分析表明,人工智能行業(yè)可能無法通過推理人工智能模型獲得巨大的性能提升。根據(jù)報(bào)告的調(diào)查結(jié)果,在一年內(nèi),推理模型的進(jìn)展可能會(huì)放緩。近幾個(gè)月來,OpenAI的o3等推理模型在人工智能基準(zhǔn)上取得了重大收益,特別是衡量數(shù)學(xué)和編程技能的基準(zhǔn)。這些模型可以將更多的計(jì)算應(yīng)用于問題,這可以提高其性能,但缺點(diǎn)是它們比傳統(tǒng)模型需要更長(zhǎng)的時(shí)間來完成任務(wù)。推理模型是通過首先在大量數(shù)據(jù)上訓(xùn)練常規(guī)模型,然后應(yīng)用一種稱為強(qiáng)化學(xué)習(xí)的技術(shù)來開發(fā)的,這有效地為模型提供了對(duì)其難題解決方案的“反饋”。
        • 關(guān)鍵字: AI  智能計(jì)算  大語(yǔ)言模型  

        Arm平臺(tái)成功適配阿里開源模型Qwen3

        • 近日,阿里巴巴開源了新一代通義千問模型Qwen3,Arm成為首批適配該模型的計(jì)算平臺(tái)廠商。雙方的合作不僅推動(dòng)了AI技術(shù)在端側(cè)設(shè)備上的應(yīng)用,還為開發(fā)者提供了更高效的解決方案。據(jù)官方消息,Arm面向AI框架開發(fā)者的開源計(jì)算內(nèi)核KleidiAI已與阿里巴巴的輕量級(jí)深度學(xué)習(xí)框架MNN深度集成。得益于此,Qwen3系列中的三款模型(Qwen3-0.6B、Qwen3-1.7B及Qwen3-4B)能夠在搭載Arm架構(gòu)CPU的移動(dòng)設(shè)備上無縫運(yùn)行,展現(xiàn)出卓越的端側(cè)AI推理能力。作為阿里巴巴最新發(fā)布的混合推理模型,Qwen3
        • 關(guān)鍵字: 阿里巴巴  Arm  AI  大語(yǔ)言模型  

        DeepSeek大膽披露:理論利潤(rùn)率高達(dá)545%!

        • 3月1日消息,今日,DeepSeek正式在知乎平臺(tái)開設(shè)了其官方賬號(hào),并發(fā)布了一篇名為《DeepSeek-V3/R1推理系統(tǒng)概覽》的技術(shù)文章。在這篇文章中,DeepSeek首次向公眾詳細(xì)公布了其模型推理系統(tǒng)的優(yōu)化細(xì)節(jié),同時(shí)披露了成本利潤(rùn)率的關(guān)鍵信息。據(jù)文章介紹,DeepSeek在推算成本時(shí),假定GPU租賃成本為2美金/小時(shí),據(jù)此計(jì)算出總成本為87,072美金/天。而在收入方面,如果所有tokens都按照DeepSeek R1的定價(jià)進(jìn)行計(jì)算,那么理論上一天的總收入可以達(dá)到562,027美金?;谶@些數(shù)據(jù),De
        • 關(guān)鍵字: DeepSeek  AI  大語(yǔ)言模型  人工智能  

        美銀:DeepSeek可能加速中國(guó)車企自動(dòng)駕駛技術(shù)研發(fā)

        • 快科技2月17日消息,據(jù)報(bào)道,美銀證券的分析師在一份研究報(bào)告中寫道,DeepSeek可能會(huì)加速中國(guó)汽車生產(chǎn)商自動(dòng)駕駛技術(shù)的開發(fā)。他們表示,DeepSeek的開發(fā)邏輯與自動(dòng)駕駛有一定相似之處,可能對(duì)未來自動(dòng)駕駛技術(shù)的開發(fā)產(chǎn)生影響。DeepSeek的方法可以增強(qiáng)自動(dòng)駕駛解決方案公司的多模態(tài)能力,幫助這些公司更好地理解道路場(chǎng)景,并在復(fù)雜的道路條件下提供更強(qiáng)大的性能。分析師指出,這在處理復(fù)雜場(chǎng)景時(shí),所需的額外計(jì)算能力投入也減少了。一些大型汽車生產(chǎn)商已將DeepSeek納入自身的自動(dòng)駕駛模型,規(guī)模較小的公司未來也可
        • 關(guān)鍵字: DeepSeek  AI  大語(yǔ)言模型  人工智能  自動(dòng)駕駛  

        谷歌 DeepMind 發(fā)布 WebLI-100B:千億級(jí)數(shù)據(jù)集解鎖 AI 視覺語(yǔ)言模型的文化多樣性

        • 2 月 14 日消息,科技媒體 marktechpost 昨日(2 月 13 日)發(fā)布博文,報(bào)道稱谷歌 DeepMind 團(tuán)隊(duì)發(fā)布了 WebLI-100B 千億級(jí)數(shù)據(jù)集,并通過增強(qiáng)文化多樣性和多語(yǔ)言性,以及減少子組之間的性能差異來提高包容性。目前挑戰(zhàn)注:機(jī)器通過學(xué)習(xí)大型數(shù)據(jù)集來連接圖像和文本,數(shù)據(jù)越多,模型識(shí)別模式和提高準(zhǔn)確性的能力就越強(qiáng)。視覺語(yǔ)言模型 (VLMs) 依賴這些數(shù)據(jù)集執(zhí)行圖像字幕和視覺問答等任務(wù)。視覺語(yǔ)言模型目前依賴于 Conceptual Captions 和 LAION 等大型數(shù)據(jù)集,包
        • 關(guān)鍵字: AI  智能計(jì)算  大語(yǔ)言模型  

        國(guó)產(chǎn)大模型 DeepSeek-V3 開源:6710 億參數(shù)自研 MoE,性能和 GPT-4o 不分伯仲

        • 12 月 27 日消息,“深度求索”官方公眾號(hào)昨日(12 月 26 日)發(fā)布博文,宣布上線并同步開源 DeepSeek-V3 模型,用戶可以登錄官網(wǎng) chat.deepseek.com,與最新版 V3 模型對(duì)話。援引博文介紹,DeepSeek-V3 是一個(gè) 6710 億參數(shù)的專家混合(MoE,使用多個(gè)專家網(wǎng)絡(luò)將問題空間劃分為同質(zhì)區(qū)域)模型,激活參數(shù) 370 億,在 14.8 萬億 token 上進(jìn)行了預(yù)訓(xùn)練。多項(xiàng)評(píng)測(cè)成績(jī)超越 Qwen2.5-72B 和 Llama-3.1-405B 等開源模型,
        • 關(guān)鍵字: DeepSeek-V3  AI  大語(yǔ)言模型  人工智能  

        AI“軍備競(jìng)賽”再提速!亞馬遜(AMZN.US)推出全新芯片陣列和大語(yǔ)言模型

        • 智通財(cái)經(jīng)獲悉,亞馬遜(AMZN.US)正在擴(kuò)大其人工智能產(chǎn)品陣容,推出了功能強(qiáng)大的新芯片陣列和大型語(yǔ)言模型,并稱其可以與主要競(jìng)爭(zhēng)對(duì)手競(jìng)爭(zhēng)。這家總部位于西雅圖的公司正在將數(shù)十萬個(gè)Trainium2半導(dǎo)體組裝成集群,這將使合作伙伴Anthropic更容易訓(xùn)練生成式人工智能和其他機(jī)器學(xué)習(xí)任務(wù)所需的大型語(yǔ)言模型。亞馬遜表示,新陣列將使這家初創(chuàng)公司目前的處理能力提高五倍。亞馬遜在其年度re:Invent大會(huì)上表示,云服務(wù)部門AWS于周二開始向客戶提供最新芯片。另外,亞馬遜首席執(zhí)行官Andy Jassy介紹了一款名為
        • 關(guān)鍵字: AI  亞馬遜  AMZN.US  芯片陣列  大語(yǔ)言模型  

        Gartner:中國(guó)大語(yǔ)言模型價(jià)格戰(zhàn)推動(dòng)人工智能加速上云

        • Gartner研究表明,隨著時(shí)間的推移和價(jià)格的持續(xù)下降,以及云部署在敏捷性、創(chuàng)新速度和生態(tài)系統(tǒng)方面的優(yōu)勢(shì),中國(guó)企業(yè)的人工智能(AI)部署將逐步從本地轉(zhuǎn)向云端。Gartner預(yù)測(cè),到2027年,中國(guó)的全部AI推理工作負(fù)載中,基于云的工作負(fù)載占比將從前的20%上升至80%。Gartner高級(jí)研究總監(jiān)方琦表示:“多家中國(guó)生成式人工智能(GenAI)廠商,其大語(yǔ)言模型應(yīng)用編程接口(API)的推理成本已經(jīng)降低了90%以上,有力地推動(dòng)了企業(yè)地GenAI采用。企業(yè)數(shù)據(jù)和分析(D&A)領(lǐng)導(dǎo)者應(yīng)積極評(píng)估相關(guān)影響,并
        • 關(guān)鍵字: Gartner  大語(yǔ)言模型  價(jià)格戰(zhàn)  

        加速基于 Arm Neoverse N2 的大語(yǔ)言模型推理

        • 人工智能 (AI) 正在眾多行業(yè)掀起浪潮,尤其是在大語(yǔ)言模型 (LLM) 問世后,AI 發(fā)展呈現(xiàn)井噴之勢(shì)。LLM 模型不僅極大改變了我們與技術(shù)的交互方式,并且在自然語(yǔ)言理解和生成方面展現(xiàn)出了驚人的能力。雖然 GPU 在訓(xùn)練生成式 AI 模型方面發(fā)揮了重要作用,但在推理領(lǐng)域,除了 GPU 和加速器之外,還有其他可行的選擇。長(zhǎng)期以來,CPU 一直被用于傳統(tǒng)的 AI 和機(jī)器學(xué)習(xí) (ML) 用例,由于 CPU 能夠處理廣泛多樣的任務(wù)且部署起來更加靈活,因此當(dāng)企業(yè)和開發(fā)者尋求將 LLM 集成到產(chǎn)品和服務(wù)中時(shí),CPU
        • 關(guān)鍵字: Arm  Neoverse  大語(yǔ)言模型  

        口袋 AI 設(shè)備 Rabbit R1 身陷負(fù)面漩渦:API 被曝漏洞,可暴露用戶信息

        • IT之家 6 月 27 日消息,Rabbit R1 再次陷入輿論漩渦,繼 App 被批評(píng)套殼安卓,主推的大動(dòng)作模型 LAM 依賴 OpenAI 接口之外,其 API 被曝存在安全漏洞,有泄露用戶數(shù)據(jù)的風(fēng)險(xiǎn)。Rabbit R1 亮相于今年 CES 大展,其定位為口袋 AI 設(shè)備,這款產(chǎn)品擁有 2.88 英寸觸摸屏、一個(gè)可旋轉(zhuǎn)攝像頭和一個(gè)交互滾輪,搭載 Rabbit 自研操作系統(tǒng)。該設(shè)備最大的亮點(diǎn)在于內(nèi)置“大型操作模型(Large Action Model,LAM)”,堪稱“萬能應(yīng)用控制器”,無需使
        • 關(guān)鍵字: Rabbit R1  AI  大語(yǔ)言模型  

        中國(guó)電信發(fā)布全球首個(gè)單體稠密萬億參數(shù)語(yǔ)義模型 Tele-FLM-1T

        • IT之家 6 月 19 日消息,中國(guó)電信人工智能研究院(TeleAI)和智源研究院聯(lián)合發(fā)布全球首個(gè)單體稠密萬億參數(shù)語(yǔ)義模型 Tele-FLM-1T,該模型與百億級(jí)的 52B 版本,千億級(jí)的 102B 版本共同構(gòu)成 Tele-FLM 系列模型。TeleAI 和智源研究院基于模型生長(zhǎng)和損失預(yù)測(cè)等技術(shù),Tele-FLM 系列模型僅使用了業(yè)界普通訓(xùn)練方案 9% 的算力資源,基于 112 臺(tái) A800 服務(wù)器,用 4 個(gè)月完成 3 個(gè)模型總計(jì) 2.3T tokens 的訓(xùn)練。模型訓(xùn)練全程做到了零調(diào)整零重試
        • 關(guān)鍵字: LLM  AI  大語(yǔ)言模型  

        ISEDA首發(fā)!大語(yǔ)言模型生成的代碼到底好不好使

        • 在大模型席卷一切、賦能百業(yè)的浪潮里,“碼農(nóng)”也沒能獨(dú)善其身。各種代碼自動(dòng)生成的大模型,似乎描繪了一個(gè)人人都能像資深工程師一樣寫代碼的美好未來。但在這個(gè)理想成為現(xiàn)實(shí)之前,有一個(gè)不能回避的問題 — 這些自動(dòng)生成的代碼真的有效嗎?大模型也會(huì)犯錯(cuò),我們肯定不希望把看似正確的錯(cuò)誤結(jié)果交給用戶,所以需要一個(gè)能精確驗(yàn)證模型生成答案的考官。近期,芯華章提出了一種對(duì)大模型生成代碼形式化評(píng)估的方法,稱為FormalEval。它能自動(dòng)化檢査生成代碼的質(zhì)量,無需手動(dòng)編寫測(cè)試用例。經(jīng)過測(cè)試,F(xiàn)ormalEval
        • 關(guān)鍵字: ISEDA  大語(yǔ)言模型  代碼生成  芯華章  
        共22條 1/2 1 2 »

        大語(yǔ)言模型介紹

        您好,目前還沒有人創(chuàng)建詞條大語(yǔ)言模型!
        歡迎您創(chuàng)建該詞條,闡述對(duì)大語(yǔ)言模型的理解,并與今后在此搜索大語(yǔ)言模型的朋友們分享。    創(chuàng)建詞條

        大語(yǔ)言模型專欄文章

        更多

        熱門主題

        樹莓派    linux   
        關(guān)于我們 - 廣告服務(wù) - 企業(yè)會(huì)員服務(wù) - 網(wǎng)站地圖 - 聯(lián)系我們 - 征稿 - 友情鏈接 - 手機(jī)EEPW
        Copyright ?2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
        《電子產(chǎn)品世界》雜志社 版權(quán)所有 北京東曉國(guó)際技術(shù)信息咨詢有限公司
        備案 京ICP備12027778號(hào)-2 北京市公安局備案:1101082052    京公網(wǎng)安備11010802012473
        主站蜘蛛池模板: 青浦区| 堆龙德庆县| 综艺| 恩施市| 永和县| 枣阳市| 万载县| 临桂县| 璧山县| 黔西县| 宁都县| 阿坝县| 蓬溪县| 绵阳市| 罗定市| 旺苍县| 阳信县| 枞阳县| 洮南市| 泽州县| 元朗区| 米脂县| 双流县| 安远县| 疏附县| 黎川县| 二连浩特市| 西华县| 怀安县| 绥阳县| 迁安市| 彭州市| 古浪县| 当涂县| 金阳县| 永德县| 额敏县| 哈巴河县| 霍邱县| 新干县| 安宁市|