背景技術:
1、在捕獲圖像數據(例如,靜止圖像,視頻)時,多個計算機控制的相機系統(tǒng)基于目標幀中的所標識的感興趣的區(qū)域(roi)來動態(tài)地調整捕獲參數。例如,roi經常被用于3a(自動聚焦、自動曝光、自動白平衡)捕獲參數調整,盡管它們也可以用于其他捕獲參數調整。通常,計算機系統(tǒng)采用對象檢測算法來標識視野幀內的一個或多個感興趣的對象,使用那些所檢測的(多個)對象來標識幀內的roi,并且基于至少一個(多個)roi的可視化內容來調整捕獲參數。在一個常見示例中,計算機系統(tǒng)采用軟件驅動的面部檢測技術來標識包含面部(或其部分)的roi,并且基于roi的可視化內容來調整一個或多個捕獲參數,以改進面部的捕獲。
2、在捕獲視頻饋送時,感興趣的對象的數目、大小和/或位置能夠隨著時間的進展而改變,這能夠使得所標識的一個或多個roi集不準確或者不適用。一些計算機控制的相機系統(tǒng)通過以固定間隔(例如,每200毫秒,或者一秒五次)重新運行對象檢測算法,并且在感興趣的對象改變時,調整所標識的roi集(例如,通過添加roi、通過移除roi、通過調整幀內roi的大小、通過調整幀內roi的位置)來適應這些改變。
3、本文所要求保護的主題不限于解決任何缺點或者僅在諸如上述環(huán)境中操作的實施例。相反,提供此背景僅以說明可以實踐本文中所描述的一些實施例的一個實例技術領域。
技術實現(xiàn)思路
1、在一些方面,本文描述的技術涉及用于在視頻饋送中的基于簽名的對象跟蹤的方法、系統(tǒng)和計算機產品,包括:基于視頻饋送的第一視頻幀的內容,計算針對第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內的所檢測的感興趣的對象相關聯(lián);基于視頻饋送的第二視頻幀的內容,計算針對第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內的第一視頻幀之后,第二區(qū)域與視頻饋送內的所檢測的感興趣的對象相關聯(lián);確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對象檢測。
2、在一些方面,本文描述的技術涉及用于在視頻饋送中的基于簽名的對象跟蹤的方法、系統(tǒng)和計算機產品,包括:基于視頻饋送的第一視頻幀的內容,計算針對第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內的所檢測的感興趣的對象相關聯(lián),第一簽名表征第一區(qū)域內的邊緣強度;基于視頻饋送的第二視頻幀的內容,計算針對第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內的第一視頻幀之后,第二簽名表征第二區(qū)域內的邊緣強度;確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對象檢測。
3、在一些方面,本文描述的技術涉及用于視頻饋送中的基于簽名的對象跟蹤的方法、系統(tǒng)和計算機產品,包括:基于視頻饋送的第一視頻幀的內容,計算針對第一視頻幀的第一區(qū)域的第一簽名,第一區(qū)域與視頻饋送內的所檢測的感興趣的對象相關聯(lián),其中計算第一簽名包括:將第一區(qū)域劃分為第一多個子區(qū)域;計算第一多個子區(qū)域簽名,每個子區(qū)域簽名與第一多個子區(qū)域的不同子區(qū)域相對應;以及聯(lián)接第一多個子區(qū)域簽名;基于視頻饋送的第二視頻幀的內容,計算針對第二視頻幀的第二區(qū)域的第二簽名,第二視頻幀在視頻饋送內的第一視頻幀之后,第二區(qū)域與視頻饋送內的所檢測的感興趣的對象相關聯(lián),其中計算第二簽名包括:將第二區(qū)域劃分為第二多個子區(qū)域;計算第二多個子區(qū)域簽名,每個子區(qū)域簽名與第二多個子區(qū)域中的不同子區(qū)域相對應;以及聯(lián)接第二多個子區(qū)域簽名;確定第一簽名與第二簽名之間的差異量;以及基于第一簽名與第二簽名之間的差異量超過閾值,觸發(fā)在視頻饋送上的基于簽名的對象檢測。
4、本
技術實現(xiàn)要素:
被提供以便以簡化形式介紹將在以下詳細描述中進一步描述的一些概念。本發(fā)明內容不旨在標識所要求保護的主題的關鍵特征或必要特征,也不旨在被用于幫助確定所要求保護的主題的范圍。
1.一種在處理系統(tǒng)處實現(xiàn)的方法,包括:
2.根據權利要求1所述的方法,其中計算所述第一簽名包括:
3.根據權利要求2所述的方法,針對所述多個子區(qū)域簽名的每個子區(qū)域簽名,其中計算所述多個子區(qū)域簽名包括:
4.根據權利要求3所述的方法,其中每個像素組簽名基于相對于像素的邊緣角度指示所述像素的強邊緣。
5.根據前述權利要求中的任一項所述的方法,其中所述第一區(qū)域和所述第二區(qū)域中的每個區(qū)域與所述所檢測的感興趣的對象的邊界框相對應。
6.根據權利要求1至權利要求4中的任一項所述的方法,其中所述第一區(qū)域和所述第二區(qū)域中的每個區(qū)域包括超過所述所檢測的感興趣的對象的邊界框的擴展區(qū)域。
7.根據前述權利要求中的任一項所述的方法,還包括:基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,觸發(fā)基于定向的對象檢測。
8.根據前述權利要求中的任一項所述的方法,還包括:基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,在所述視頻饋送的整個幀上生成簽名。
9.根據前述權利要求中的任一項所述的方法,其中觸發(fā)對所述視頻饋送的所述基于簽名的對象檢測包括:使用人工智能模型或者機器學習模型來觸發(fā)面部檢測。
10.根據前述權利要求中的任一項所述的方法,還包括:在觸發(fā)在所述視頻饋送上的所述基于簽名的對象檢測之后,觸發(fā)在所述視頻饋送上的基于間隔的對象檢測。
11.一種計算機系統(tǒng),包括:
12.根據權利要求11的所述的計算機系統(tǒng),其中計算所述第一簽名包括:
13.根據權利要求11或者權利要求12所述的計算機系統(tǒng),其中所述第一區(qū)域和所述第二區(qū)域中的每個區(qū)域與所述所檢測的感興趣的對象的邊界框相對應。
14.根據權利要求11或者權利要求12所述的計算機系統(tǒng),其中所述第一區(qū)域和所述第二區(qū)域中的每個區(qū)域包括超過所述所檢測的感興趣的對象的邊界框的擴展區(qū)域。
15.根據權利要求11至權利要求14中的任一項所述的計算機系統(tǒng),所述計算機可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,觸發(fā)基于定向的對象檢測。
16.根據權利要求11至權利要求15中的任一項所述的計算機系統(tǒng),所述計算機可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,在所述視頻饋送的整個幀上生成簽名。
17.根據權利要求11至權利要求16中的任一項所述的計算機系統(tǒng),其中觸發(fā)對所述視頻饋送的所述基于簽名的對象檢測包括:使用人工智能模型或者機器學習模型來觸發(fā)面部檢測。
18.一種計算機程序產品,包括存儲計算機可執(zhí)行指令的計算機存儲介質,所述計算機可執(zhí)行指令由處理系統(tǒng)可執(zhí)行以至少:
19.根據權利要求18所述的計算機程序產品,所述計算機可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少:基于在所述視頻饋送上的對象檢測未能定位感興趣的對象,觸發(fā)基于定向的對象檢測。
20.根據權利要求18或者權利要求19所述的計算機程序產品,所述計算機可執(zhí)行指令還由所述處理系統(tǒng)可執(zhí)行以至少:在觸發(fā)對所述視頻饋送上所述基于簽名的對象檢測之后,觸發(fā)在所述視頻饋送上的基于間隔的對象檢測。