博客專欄

        EEPW首頁 > 博客 > 聆思CSK6開發板大模型視覺識別類開源SDK介紹

        聆思CSK6開發板大模型視覺識別類開源SDK介紹

        發布人:ListenAI 時間:2024-06-17 來源:工程師 發布文章

        大模型開發板除了語音交互之外,還配套有大模型拍照識圖坐姿檢測、人臉識別、活體識別、頭肩跟隨、手勢識別、物體分類個線視覺識別方面的交互示例等。

        聯網使用

        大模型圖片分析+拍照

        離線識別

        坐姿檢測、人臉識別、活體識別、頭肩跟隨、手勢識別、物體分類


        SDK介紹

        1、  大模型語音交互+拍照識圖SDK


        SDK功能

         語音交互:支持按鍵錄音或喚醒后通過語音與大模型進行對話

         拍照識圖:支持通過攝像頭拍攝圖像并上傳給大模型進行識別,支持依據識圖內容進行提問

         圖片生成:支持通過語音交互描述畫面內容,令大模型生成圖片并顯示至套件屏幕上

        拍照識圖

        在待機頁,點擊拍照按鈕即可進入取景頁面,對準要拍照的物體,點擊右側中間的拍照鍵完成抓拍,確認畫面抓拍正常后(無晃動模糊的情況),點擊右側的 √ 進行提交識別。

        識別結果:

        2、  坐姿檢測SDK


        算法簡介

        CSK6 大模型開發套件可檢測圖像中人物的坐姿情況,并對各種不良的坐姿進行識別,當畫面中有坐姿信息時,顯示屏上將實時對人物的關鍵骨骼點進行標注并顯示該人物的包含手、身體狀態在內的坐姿檢測結果,結果包含一下內容:

         手狀態:正常/下垂/撐臉

         身體狀態:正常/趴桌/傾斜/駝背/離席

        CSK6 芯片支持運行 坐姿檢測 AI算法,具備以下特性:

         硬件上僅需配合 30W 像素鏡頭模組,性價比出色

         純離線運行算法,無需聯網,保障隱私

         檢測準確率 > 97%,響應時間 < 18ms

         識別距離:推薦 40cm ~ 60cm, 建議不超過 110cm


        3、  人臉識別SDK

        人臉識別算法簡介

        人臉識別 算法具備以下特性:

         支持檢測圖像中人臉信息,選取畫面中分值最高的人臉,返回人臉邊界框、人臉標定點、頭部姿態角度、人臉識別特征等

         人臉標定點支持68個關鍵點檢測

         頭部姿態角度支持pitch、roll、yaw三個角度

         支持特征比較:將檢測到的人臉特征值和本地存儲的人臉特征值輸入算法進行比對, 并返回比對結果

        應用場景

        離線人臉識別適用于網絡條件不穩定、無網、數據安全性要求高、人臉庫較小(20人以下)單臺設備的人臉識別場景。常見于人臉門禁、小型企業考勤機、自助終端設備等。

        算法效果指標數據

        識別效果

        在1m距離內,測試特征底庫10個,人臉識別效果分別為:

        識別能力

        識別率

        虛警率

        人臉識別

        95%

        0.1%


        人臉標定

        平均誤差(NME)約為0.04

        頭部姿態

        模型預測平均偏差約為±3°

        全流程耗時

        100ms以內



        使用介紹


        人臉識別示例工程的使用

        調用人臉識別算法,可以通過開發板上的按鍵操作進行人臉注冊、臉識別,并通過圖像預覽工具查看攝像頭的畫面與輸出結果。

        固件功能說明

        程序運行后,默認會在屏幕上顯示實時的攝像頭畫面并在畫面中使用方框實時標注出人臉,并通過方框的顏色指示不同的識別狀態。

        可以按照以下流程進行人臉識別功能的使用:

         Step1:檢測到人臉 (屏幕顯示黃色框 / 開發板LED亮黃色)

         Step2:按K1按鍵注冊當前人臉特征 (屏幕 registered參數增加1 /開發板LED閃爍藍色)

         Step3:按K2對當前人臉進行識別比對

         識別通過:屏幕顯示綠色框 / 開發板LED亮綠色

         識別未通過:屏幕顯示紅色框 / 開發板LED亮紅色

        LED指示狀態

         黃色:檢測到人臉

         綠色:人臉特征比對通過

         紅色:人臉特征比對未通過

        按鍵功能

         K1:錄入當前檢測到的人臉特征

         K2:將當然的人臉特征與之前錄入的特征進行比較

         K3:開關攝像頭紅外補光燈(安裝紅外攝像頭時)

        4、  活體識別



        功能說明

        需要搭配帶補光燈的紅外攝像頭,結合人臉識別算法,實現對活體的檢測。

        程序運行后,默認會在屏幕上顯示實時的攝像頭畫面并在畫面中使用方框實時標注出人臉,并通過方框的顏色指示不同的識別狀態。

        1.注冊人臉

        當LED為黃色時(檢測到人臉),按動K1按鍵,此時將會錄入當前檢測到的人臉特征,錄入成功后,可看到屏幕上顯示的registered 數量增加1,說明本次錄入已完成并加入人臉特征庫。

        2.比對人臉

        當LED為黃色時(檢測到人臉),按動K2按鍵,此時固件會將當前攝像頭前檢測到的人臉與已錄入的人臉特征進行比對,若對比成功(命中已錄入的人臉特征),屏幕中圈中人臉的框將變為綠色,同時開發板上的LED顏色將變為綠色,表示人臉特征比對通過,并在屏幕上顯示匹配的人臉特征序號(id)評分(score)

        若比對不通過,即當前人臉未在人臉特征庫中錄入過,屏幕中圈中人臉的框將變為紅色,同時開發板上的LED顏色將變為紅色,表示人臉特征比對通過。

        3.串口日志的查看

        本示例同樣支持串口日志的打印,可通過連接開發板上的DAP_USB 并使用串口工具打開對應的串口設備進行日志查看,默認波特率 115200,伴隨著 人臉錄入人臉比對等操作,可看到日志串口有對應的結果輸出。


        5、頭肩跟隨+手勢識別SDK

        頭肩跟隨

        頭肩算法介紹

        檢測圖像中所有人體的頭肩位置,返回每個頭肩的唯一id、位置坐標、檢測得分等;

         通過攝像頭實時獲取圖像并在屏幕上進行預覽顯示

         在屏幕展示的畫面中標注頭肩檢測和手勢識別的結果與評分

        手勢識別

        通過頭肩檢測識別用戶的手勢,返回當前目標的手勢、得分等;

        支持5種手勢,分別為LIKE(

        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。




        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 旌德县| 华池县| 灵台县| 邵阳县| 邹城市| 曲阜市| 萨嘎县| 崇礼县| 景宁| 枞阳县| 阳西县| 石屏县| 尚义县| 务川| 社会| 巍山| 日喀则市| 西盟| 渝中区| 泾阳县| 牟定县| 合川市| 全南县| 洞头县| 阜新| 保康县| 托里县| 陆良县| 沁水县| 巴塘县| 彰武县| 宜都市| 道真| 大洼县| 丹江口市| 塔城市| 平陆县| 正蓝旗| 营口市| 原阳县| 德安县|