新聞中心

EEPW首頁 > 模擬技術(shù) > 設(shè)計(jì)應(yīng)用 > 數(shù)據(jù)挖掘技術(shù)在交通事故分析中的應(yīng)用

數(shù)據(jù)挖掘技術(shù)在交通事故分析中的應(yīng)用

作者：時(shí)間：2009-08-28 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

1 引言
隨著國(guó)民經(jīng)濟(jì)的快速發(fā)展和人民生活水平的不斷提高，在交通運(yùn)輸業(yè)持續(xù)發(fā)展的同時(shí)，轎車大量進(jìn)入普通百姓家庭．汽車的社會(huì)保有量快速增長(zhǎng)，使得駕駛員培訓(xùn)學(xué)校門庭若市，職業(yè)駕駛員、非職業(yè)駕駛員大量增加，汽車保險(xiǎn)業(yè)快速發(fā)展，同時(shí)交通事故的絕對(duì)數(shù)量也不斷增加。對(duì)于誘發(fā)交通事故的原因，以及各種原因的概率分布就成為交通管理部門、商業(yè)保險(xiǎn)企業(yè)、駕駛員培訓(xùn)學(xué)校等機(jī)構(gòu)普遍關(guān)心的問題。
借助計(jì)算機(jī)技術(shù)和信息處理技術(shù)的發(fā)展成果，各地交通管理部門不斷投入大量的人力物力，建設(shè)各種各樣的信息化管理系統(tǒng)，如機(jī)動(dòng)車輛信息管理系統(tǒng)、機(jī)動(dòng)車駕駛員信息管理系統(tǒng)、交通事故信息管理系統(tǒng)等。伴隨著交通管理信息系統(tǒng)的不斷建設(shè)、完善與發(fā)展，積累了大量寶貴的數(shù)據(jù)資源，這些信息化系統(tǒng)和所積累的數(shù)據(jù)資源，對(duì)提高交通管理水平起了巨大作用。目前的交通信息管理系統(tǒng)主要任務(wù)是進(jìn)行數(shù)據(jù)查詢或?qū)μ囟ǖ臄?shù)據(jù)進(jìn)行簡(jiǎn)單獨(dú)立的數(shù)字處理，沒有對(duì)這些大量的數(shù)據(jù)所包含的內(nèi)在有價(jià)值的信息有效提取。在如何利用這些海量數(shù)據(jù)資源進(jìn)行交通事故發(fā)生原因及概率分布分析方面，做的工作還很少，使得這些寶貴的數(shù)據(jù)資源沒有發(fā)揮應(yīng)有的作用。對(duì)這些進(jìn)行分析歸類和有效處理，從中挖掘出表征交通事故發(fā)生的原因及分布概率的內(nèi)在有用信息，為相關(guān)單位或機(jī)構(gòu)提供某種程度或某種方面的決策依據(jù)，如交通事故防范、商業(yè)保險(xiǎn)評(píng)估，機(jī)動(dòng)車輛駕駛員培訓(xùn)模式等等。從事物發(fā)展具有一定的內(nèi)在聯(lián)系的觀點(diǎn)出發(fā)，結(jié)合數(shù)據(jù)挖掘技術(shù)的研究成果，答案是肯定的。

2 數(shù)據(jù)挖掘技術(shù)的基本概念和方法
數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中識(shí)別出存在于數(shù)據(jù)庫中有效的、新穎的、具有潛在價(jià)值的、最終可理解的模式的非平凡知識(shí)的過程。它利用各種分析方法和分析工具在大規(guī)模的海量數(shù)據(jù)中建立模型和發(fā)現(xiàn)數(shù)據(jù)間的關(guān)系。數(shù)據(jù)挖掘的技術(shù)很多，相應(yīng)的實(shí)現(xiàn)方法也很多。一般包括下述幾種方法：決策樹方法，神經(jīng)網(wǎng)絡(luò)方法，概念樹方法，粗糙方法，遺傳算法，公式發(fā)現(xiàn)，模糊論方法，統(tǒng)計(jì)學(xué)方法．可視化技術(shù)，貝葉斯網(wǎng)絡(luò)等。在不同的領(lǐng)域，針對(duì)需要解決的具體問題，需要完成的挖掘主題，采用不同的數(shù)據(jù)挖掘技術(shù)或方法。

本文引用地址：http://www.104case.com/article/188701.htm

3 交通管理信息數(shù)據(jù)挖掘方法
3．1 需求理解
涉及到交通管理信息積累的原始數(shù)據(jù)很多，存在于不同的數(shù)據(jù)庫中，甚至有些與交通安全相關(guān)的某些數(shù)據(jù)跨行業(yè)保存在其他行業(yè)的數(shù)據(jù)庫中，如氣象部門記錄的天氣氣象數(shù)據(jù)。這些數(shù)據(jù)庫大多是事務(wù)性的數(shù)據(jù)庫，其中的數(shù)據(jù)各自獨(dú)立、互不相關(guān)。數(shù)據(jù)挖掘的主題是從這些互不相關(guān)的數(shù)據(jù)中尋找出與交通事故相關(guān)的信息，導(dǎo)致交通事故發(fā)生的各種因素以及交通事故對(duì)各種因素的概率分布。
3．2 數(shù)據(jù)準(zhǔn)備
由于機(jī)動(dòng)車輛．機(jī)動(dòng)車駕駛員、交通事故信息管理系統(tǒng)的建設(shè)都是針對(duì)特定需求建立起來的事務(wù)性數(shù)據(jù)庫，其中存放的數(shù)據(jù)往往不能直接用于挖掘主題的數(shù)據(jù)挖掘，必須進(jìn)行必要的數(shù)據(jù)預(yù)處理或數(shù)據(jù)準(zhǔn)備，包括數(shù)據(jù)選擇、凈化、轉(zhuǎn)換、數(shù)據(jù)縮減等工作，獲取與挖掘主題直接相關(guān)的有效數(shù)據(jù)。數(shù)據(jù)準(zhǔn)備是非常重要的一個(gè)步驟，將影響數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模式的有效性。
機(jī)動(dòng)車駕駛員信息管理系統(tǒng)主要記錄與駕駛員相關(guān)的信息，如駕駛員姓名、性別、年齡、學(xué)歷、駕齡、準(zhǔn)駕車輛類別、駕駛證編號(hào)、發(fā)證機(jī)關(guān)等；機(jī)動(dòng)車輛信息管理系統(tǒng)記錄車主姓名、車輛牌號(hào)、型號(hào)、類別、顏色、發(fā)動(dòng)機(jī)號(hào)、車架號(hào)、出廠時(shí)間、購(gòu)買時(shí)間、車輛用途等；交通事故信息管理系統(tǒng)記錄肇事駕駛員信息，如肇事駕駛員姓名、性別、年齡、駕齡、駕駛證編號(hào)以及肇事車輛的牌照號(hào)、型號(hào)、類別等。這些信息有些與交通事故相關(guān)，有些信息無關(guān)。車輛事故發(fā)生的概率與駕駛?cè)藛T本身有著密切的關(guān)系，影響駕駛?cè)藛T安全駕駛的主要因素包括年齡、性別、駕齡等。數(shù)據(jù)處理后可得表l所示的與交通事故密切相關(guān)的數(shù)據(jù)記錄。

3．3 數(shù)據(jù)挖掘方法設(shè)計(jì)
數(shù)據(jù)挖掘算法或數(shù)據(jù)挖掘技術(shù)的選擇，依賴于已有的原始數(shù)據(jù)資源和選定的挖掘主題，本課題所涉及的數(shù)據(jù)資源儲(chǔ)存于不同的事務(wù)性數(shù)據(jù)庫中，而確定的挖掘主題是利用數(shù)據(jù)挖掘技術(shù)，對(duì)這些大量的數(shù)據(jù)進(jìn)行宏觀的基礎(chǔ)研究，尋求導(dǎo)致各種交通事故發(fā)生諸多因素的概率分布，為交通管理部門、商業(yè)保險(xiǎn)部門、安全教育部門、機(jī)動(dòng)車駕駛員培訓(xùn)部門等行業(yè)提供決策的宏觀支持。挖掘的方法選用分類模式中的決策樹方法，這是分類模式中常用的一種分類器，通過對(duì)大量數(shù)據(jù)進(jìn)行有目的的分類，從中找到一些有價(jià)值的、潛在的信息。決策樹方法的主要優(yōu)點(diǎn)是可以生成可理解的規(guī)則，計(jì)算量小，可以處理連續(xù)和集合屬性，決策樹的輸出包括屬性重要性排序。決策樹是一個(gè)類似于流程圖的結(jié)構(gòu)，它包括決策節(jié)點(diǎn)、分枝和葉子節(jié)點(diǎn)。根據(jù)本課題的目標(biāo)，決策樹法采用ID3方法，選擇互信息最大的屬性作為根節(jié)點(diǎn)。表l中有3個(gè)決策屬性和一個(gè)分類屬性，決策屬性是駕駛員年齡、駕齡和性別，分類屬性是事故的有無。ID3算法包括信息熵的計(jì)算、屬性A條件熵的計(jì)算和互信息的計(jì)算。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 數(shù)據(jù)挖掘技術(shù) 交通事故 分析 中的應(yīng)用

新聞中心

數(shù)據(jù)挖掘技術(shù)在交通事故分析中的應(yīng)用

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)