av网站播放,国产一级特黄毛片在线毛片,久久精品国产99精品丝袜,天天干夜夜要,伊人影院久久,av大全免费在线观看,国产第一区在线

一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配方法

文檔序號(hào):42887505發(fā)布日期:2025-08-29 19:35閱讀:9來(lái)源:國(guó)知局

本發(fā)明屬于數(shù)據(jù)處理,自適應(yīng)處理,具體涉及一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配方法。


背景技術(shù):

1、遠(yuǎn)洋養(yǎng)殖是在遠(yuǎn)離近海岸線的海域開(kāi)展的養(yǎng)殖活動(dòng),能有效解決近岸資源的高度競(jìng)爭(zhēng)現(xiàn)狀問(wèn)題,同時(shí)對(duì)自然生態(tài)具有更環(huán)保和沖擊緩和的優(yōu)勢(shì),對(duì)養(yǎng)殖水產(chǎn)的生存環(huán)境也具有水交換更強(qiáng)和污染擴(kuò)散能力高的天然優(yōu)勢(shì)。盡管如此遠(yuǎn)洋養(yǎng)殖的網(wǎng)箱布置仍然存在水交換和污染擴(kuò)散能力的功效穩(wěn)定性不足問(wèn)題,這種功效穩(wěn)定性缺陷與網(wǎng)箱群的布局有關(guān),網(wǎng)箱群漂浮在開(kāi)放海域中受海流、風(fēng)浪或者污染擴(kuò)散等影響非常大,這個(gè)過(guò)程中網(wǎng)箱距離過(guò)近會(huì)限制水體流動(dòng)導(dǎo)致局部缺氧和污染堆積,而網(wǎng)箱距離過(guò)大則會(huì)增大網(wǎng)箱群管控難度,尤其是投喂系統(tǒng)的管線或投喂路徑過(guò)大使得投喂量和投喂時(shí)機(jī)的精確性下降,這個(gè)過(guò)程會(huì)進(jìn)一步帶來(lái)飼料浪費(fèi)和能源消耗增加。強(qiáng)化學(xué)習(xí)的核心目標(biāo)是通過(guò)大數(shù)據(jù)訓(xùn)練一個(gè)策略使得能夠在給定環(huán)境中最大化累積回報(bào),利用強(qiáng)化學(xué)習(xí)調(diào)控網(wǎng)箱位置能大大提升網(wǎng)箱群的能耗表現(xiàn)和養(yǎng)殖表現(xiàn)。但是在實(shí)際應(yīng)用過(guò)程中很容易出現(xiàn)策略模糊狀態(tài),這種策略模糊狀態(tài)會(huì)導(dǎo)致遠(yuǎn)洋養(yǎng)殖系統(tǒng)的控制穩(wěn)定性下降,主要包括網(wǎng)箱位置調(diào)動(dòng)頻繁,以及自動(dòng)化投喂系統(tǒng)損耗增大,對(duì)遠(yuǎn)洋養(yǎng)殖中的維護(hù)成本和運(yùn)營(yíng)成本居高不下。這種策略模糊狀態(tài)是由于強(qiáng)化學(xué)習(xí)的策略設(shè)定本身具有多重目標(biāo)導(dǎo)致的,多目標(biāo)強(qiáng)化學(xué)習(xí)模型中不同目標(biāo)之間的固有沖突,多個(gè)目標(biāo)方向不一致使得實(shí)時(shí)獲得的策略部署具有巨大的選擇空間,這時(shí)選擇策略動(dòng)作的隨機(jī)性增大并且訓(xùn)練收斂速度下降。例如當(dāng)前網(wǎng)箱位置間距較小時(shí)水體交換能力較差,因此強(qiáng)化學(xué)習(xí)下的策略趨向網(wǎng)箱位置之間的距離增大,而投喂路徑增長(zhǎng)會(huì)使得策略趨向網(wǎng)箱位置之間的距離縮減,這兩個(gè)策略之間對(duì)相同的分配機(jī)制具有抵消性,因此策略模糊狀態(tài)會(huì)在這個(gè)區(qū)間中無(wú)法建立快速收斂的決策輸出。

2、而在這種遠(yuǎn)洋環(huán)境中往往具有顯著的趨勢(shì)演進(jìn)與突變干擾共存的特性,即常規(guī)洋流背景下海域水體參數(shù)中溶氧、鹽度以及溫度等會(huì)呈現(xiàn)沿著相對(duì)穩(wěn)定趨勢(shì)的緩變機(jī)制,與此同時(shí)突發(fā)事件,包括臺(tái)風(fēng)和赤潮等會(huì)使海域狀態(tài)在短時(shí)間內(nèi)發(fā)生劇烈跳變,而使得緩變機(jī)制下的海域水體參數(shù)出現(xiàn)驟變,這類突變將打破系統(tǒng)原有的資源使用平衡,使得強(qiáng)化學(xué)習(xí)在已學(xué)策略中面臨失效斷層問(wèn)題,因此這種遠(yuǎn)洋環(huán)境系統(tǒng)呈現(xiàn)出明顯的時(shí)空分層和耦合反饋特性,所構(gòu)建的資源規(guī)劃方法主要由各類資源之間的協(xié)同調(diào)度關(guān)系主導(dǎo),一方面需要顧及多目標(biāo)之間的權(quán)衡與穩(wěn)定性控制,另一方面在突變擾動(dòng)條件發(fā)生的時(shí)候以風(fēng)險(xiǎn)規(guī)避與生存保障為主導(dǎo)目標(biāo),而將原本處于次要地位的指標(biāo),如緊急供電和局部排污等臨時(shí)策略獲得最高優(yōu)先級(jí)。這種主導(dǎo)目標(biāo)的突變會(huì)使原先以協(xié)同均衡為基礎(chǔ)訓(xùn)練的強(qiáng)化學(xué)習(xí)模型出現(xiàn)顯著偏差甚至策略崩潰。因此該兩類問(wèn)題并非彼此孤立,而是在自然調(diào)控周期中交替主導(dǎo)強(qiáng)化學(xué)習(xí)系統(tǒng)的策略生成過(guò)程,尤其是在臨近突變前后的過(guò)渡態(tài)階段,系統(tǒng)必須具備從多目標(biāo)均衡調(diào)度向風(fēng)險(xiǎn)主導(dǎo)控制靈活及時(shí)切換的能力,并在突變結(jié)束后實(shí)現(xiàn)策略的自恢復(fù)與重回協(xié)同軌道。因此亟需一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配方法。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提出一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配方法,以解決現(xiàn)有技術(shù)中所存在的一個(gè)或多個(gè)技術(shù)問(wèn)題,至少提供一種有益的選擇或創(chuàng)造條件。

2、為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一方面,提供一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配方法,所述方法包括以下步驟:

3、s100,初始化海洋漁業(yè)資源數(shù)據(jù)場(chǎng)景并進(jìn)行漁業(yè)數(shù)據(jù)采集;

4、s200,通過(guò)漁業(yè)數(shù)據(jù)構(gòu)建多目標(biāo)協(xié)同調(diào)度的緩變強(qiáng)化學(xué)習(xí)模型;

5、s201,從緩變強(qiáng)化學(xué)習(xí)模型獲取控制策略進(jìn)行漁業(yè)資源分配;

6、s300,對(duì)緩變強(qiáng)化學(xué)習(xí)模型運(yùn)行過(guò)程實(shí)時(shí)生成適應(yīng)表征值;

7、s400,根據(jù)適應(yīng)表征值構(gòu)建臨變過(guò)渡模型,獲取臨變過(guò)渡階值;

8、s500,通過(guò)臨變過(guò)渡階值進(jìn)行自適應(yīng)決策。

9、進(jìn)一步地,在步驟s100中,初始化海洋漁業(yè)資源數(shù)據(jù)場(chǎng)景并進(jìn)行漁業(yè)數(shù)據(jù)采集的方法是:在遠(yuǎn)洋養(yǎng)殖場(chǎng)區(qū)域內(nèi)布設(shè)用于海洋環(huán)境監(jiān)測(cè)與資源使用感知的傳感系統(tǒng)和控制裝置,通過(guò)傳感系統(tǒng)和控制裝置采集的數(shù)據(jù)作為漁業(yè)數(shù)據(jù);其中傳感系統(tǒng)包括至少一個(gè)水質(zhì)傳感器、溶解氧傳感器、鹽度計(jì)、溫度計(jì)、風(fēng)浪測(cè)量?jī)x、能耗傳感器和位置定位裝置;傳感系統(tǒng)用于實(shí)時(shí)采集漁業(yè)養(yǎng)殖環(huán)境的時(shí)空狀態(tài)信息、電力使用狀態(tài)及養(yǎng)殖單元分布情況;控制裝置包括網(wǎng)箱位置控制單元、自動(dòng)投喂單元、能量分配執(zhí)行模塊及數(shù)據(jù)通信模塊,控制裝置用于接收調(diào)度指令并執(zhí)行網(wǎng)箱布局調(diào)整、能量供應(yīng)與投喂操作。

10、進(jìn)一步地,在步驟s200中,通過(guò)漁業(yè)數(shù)據(jù)構(gòu)建多目標(biāo)協(xié)同調(diào)度的緩變強(qiáng)化學(xué)習(xí)模型的方法是:通過(guò)漁業(yè)數(shù)據(jù)構(gòu)建強(qiáng)化學(xué)習(xí)模型,所述模型采用狀態(tài)壓縮機(jī)制對(duì)原始海洋環(huán)境數(shù)據(jù)進(jìn)行降維處理;

11、設(shè)定強(qiáng)化學(xué)習(xí)模型的優(yōu)化目標(biāo)為電能消耗、網(wǎng)箱間距、水體交換效率以及投喂路徑長(zhǎng)度,結(jié)合多目標(biāo)獎(jiǎng)勵(lì)結(jié)構(gòu)構(gòu)建強(qiáng)化學(xué)習(xí)損失函數(shù),多目標(biāo)獎(jiǎng)勵(lì)結(jié)構(gòu)包括單位資源使用的投喂精度,網(wǎng)箱間距對(duì)水體交換能力的提升度以及單位資源對(duì)投喂系統(tǒng)覆蓋度,?所得強(qiáng)化學(xué)習(xí)模型記為緩變強(qiáng)化學(xué)習(xí)模型。

12、進(jìn)一步地,在步驟s200中,通過(guò)漁業(yè)數(shù)據(jù)構(gòu)建多目標(biāo)協(xié)同調(diào)度的緩變強(qiáng)化學(xué)習(xí)模型的方法還包括:在緩變強(qiáng)化學(xué)習(xí)模型中引入目標(biāo)沖突識(shí)別函數(shù),用于檢測(cè)各優(yōu)化目標(biāo)之間的實(shí)時(shí)方向性偏差,方向性偏差通過(guò)計(jì)算各目標(biāo)子獎(jiǎng)勵(lì)項(xiàng)的梯度向量夾角獲得,當(dāng)檢測(cè)到任意兩個(gè)目標(biāo)子獎(jiǎng)勵(lì)項(xiàng)之間的方向性偏差超過(guò)預(yù)設(shè)沖突閾值時(shí),根據(jù)所處海洋環(huán)境狀態(tài)動(dòng)態(tài)調(diào)整各目標(biāo)在緩變強(qiáng)化學(xué)習(xí)模型中對(duì)應(yīng)的獎(jiǎng)勵(lì)權(quán)重系數(shù)。

13、盡管本方法的目標(biāo)沖突識(shí)別與權(quán)重調(diào)節(jié)機(jī)制并不直接作用于策略網(wǎng)絡(luò)的最終動(dòng)作輸出,但其在訓(xùn)練過(guò)程中通過(guò)調(diào)節(jié)各目標(biāo)子獎(jiǎng)勵(lì)的占比與梯度方向從而實(shí)質(zhì)上改變策略更新路徑,間接優(yōu)化強(qiáng)化學(xué)習(xí)模型在多目標(biāo)條件下所形成的動(dòng)作選擇傾向與輸出穩(wěn)定性。

14、有益效果:考慮了遠(yuǎn)洋海洋漁業(yè)系統(tǒng)中資源調(diào)控任務(wù)具有多目標(biāo)多擾動(dòng)的復(fù)雜特征,通過(guò)引入梯度方向性評(píng)估與環(huán)境狀態(tài)驅(qū)動(dòng)的獎(jiǎng)勵(lì)權(quán)重自適應(yīng)調(diào)整策略,實(shí)現(xiàn)了對(duì)強(qiáng)化學(xué)習(xí)模型在策略模糊狀態(tài)下的關(guān)鍵性優(yōu)化控制:在傳統(tǒng)多目標(biāo)強(qiáng)化學(xué)習(xí)中,海洋環(huán)境特性中的多擾動(dòng)帶來(lái)的目標(biāo)方向不一致出現(xiàn)非線性變化,策略更新路徑會(huì)在梯度空間中反復(fù)震蕩而難以收斂到穩(wěn)定控制策略,所以本方法通過(guò)動(dòng)態(tài)權(quán)重協(xié)調(diào)機(jī)制,使策略在沖突區(qū)間中獲得明確方向主導(dǎo),從而消除策略空間的模糊性與不確定性,構(gòu)建具有資源優(yōu)先級(jí)適應(yīng)性的動(dòng)態(tài)策略調(diào)度能力。

15、進(jìn)一步地,在步驟s201中,從緩變強(qiáng)化學(xué)習(xí)模型獲取控制策略進(jìn)行漁業(yè)資源分配的方法是:將緩變強(qiáng)化學(xué)習(xí)模型輸出的控制策略用于對(duì)海洋漁業(yè)場(chǎng)景中的關(guān)鍵控制單元進(jìn)行動(dòng)態(tài)調(diào)節(jié),所述關(guān)鍵控制單元包括但不限于投喂系統(tǒng)、電力分配裝置及網(wǎng)箱間距調(diào)整機(jī)構(gòu)。

16、緩變強(qiáng)化學(xué)習(xí)模型根據(jù)當(dāng)前環(huán)境狀態(tài)和多目標(biāo)獎(jiǎng)勵(lì)函數(shù)的計(jì)算結(jié)果生成具體控制策略,控制策略作為模型輸出信號(hào)用于控制遠(yuǎn)洋漁業(yè)場(chǎng)景中多個(gè)關(guān)鍵設(shè)備的調(diào)節(jié)行為,例如自動(dòng)投喂量的精細(xì)控制、電能分配的空間優(yōu)先級(jí)排序以及網(wǎng)箱漂浮位置的調(diào)整等。該過(guò)程基于強(qiáng)化學(xué)習(xí)的策略網(wǎng)絡(luò)輸出的最優(yōu)動(dòng)作序列,可實(shí)現(xiàn)資源使用效率與養(yǎng)殖效益之間的平衡,避免冗余調(diào)節(jié)或能耗浪費(fèi);

17、進(jìn)一步地,在步驟s300中,對(duì)緩變強(qiáng)化學(xué)習(xí)模型運(yùn)行過(guò)程實(shí)時(shí)生成適應(yīng)表征值的方法是:獲取當(dāng)前強(qiáng)化學(xué)習(xí)模型的獎(jiǎng)勵(lì)值、策略輸出結(jié)果與策略熵狀態(tài),并分別與上一時(shí)刻對(duì)應(yīng)值進(jìn)行差異度量:分別獲得獎(jiǎng)勵(lì)值的變化幅度,策略輸出概率分布的差異程度,以及策略熵的波動(dòng),并且作為適應(yīng)性衡量的三個(gè)維度;對(duì)上述三個(gè)維度進(jìn)行加權(quán)組合形成可隨時(shí)間連續(xù)更新的適應(yīng)表征值,用于表示當(dāng)前策略對(duì)環(huán)境狀態(tài)變化的響應(yīng)能力。

18、其中當(dāng)前強(qiáng)化學(xué)習(xí)模型指的是最后一次或者最新一次執(zhí)行的緩變強(qiáng)化學(xué)習(xí)模型,而與上一時(shí)刻指的是沿逆時(shí)間方向的再前一次執(zhí)行的緩變強(qiáng)化學(xué)習(xí)模型的時(shí)機(jī)或時(shí)刻。

19、有益效果:適應(yīng)表征值是該強(qiáng)化學(xué)習(xí)策略運(yùn)行過(guò)程中動(dòng)態(tài)生成的狀態(tài)感知指標(biāo),承擔(dān)承上啟下的關(guān)鍵作用。能通過(guò)協(xié)同強(qiáng)化學(xué)習(xí)模型捕捉獎(jiǎng)勵(lì)變化、策略輸出穩(wěn)定性與策略熵波動(dòng)等多維度反饋,實(shí)時(shí)反映緩變場(chǎng)景中策略對(duì)當(dāng)前海洋環(huán)境變化的響應(yīng)能力,同時(shí)作為輸入數(shù)據(jù)對(duì)進(jìn)一步臨變過(guò)渡識(shí)別的過(guò)程,提供波動(dòng)趨勢(shì)判斷系統(tǒng)是否處于突變前后的不穩(wěn)定過(guò)渡階段的數(shù)理支撐。由于在遠(yuǎn)洋漁業(yè)環(huán)境狀態(tài)往往呈現(xiàn)緩變與突變交替的耦合特性,通常單一的策略指標(biāo)難以應(yīng)對(duì)復(fù)雜動(dòng)態(tài)場(chǎng)景,因此適應(yīng)表征值作為強(qiáng)化學(xué)習(xí)模型的獎(jiǎng)勵(lì)值、策略輸出結(jié)果與策略熵狀態(tài)的綜合反饋信號(hào)能夠有效感知策略魯棒性的臨界變化點(diǎn),從而在策略模糊狀態(tài)尚未演化為策略失效前啟動(dòng)響應(yīng)機(jī)制。所以適應(yīng)表征值是打通協(xié)同優(yōu)化與風(fēng)險(xiǎn)防御之間動(dòng)態(tài)靈活轉(zhuǎn)換的核心特征。

20、進(jìn)一步地,在步驟s400中,根據(jù)適應(yīng)表征值構(gòu)建臨變過(guò)渡模型,獲取臨變過(guò)渡階值的方法是:將任一次獲得控制策略的時(shí)刻作為建模點(diǎn);預(yù)設(shè)一個(gè)整數(shù)值為回測(cè)值st,其取值范圍為st∈[3,10];任一建模點(diǎn)至其前st個(gè)和前2×st個(gè)建模點(diǎn)對(duì)應(yīng)適應(yīng)表征值的指數(shù)平均值,分別記為短期基準(zhǔn)值stema和長(zhǎng)期基準(zhǔn)值ltema;將短期基準(zhǔn)值和長(zhǎng)期基準(zhǔn)值的差的絕對(duì)值記為絕對(duì)偏離量;計(jì)算該絕對(duì)偏離量相對(duì)于長(zhǎng)期基準(zhǔn)值的比例得到波動(dòng)響應(yīng)度dt;

21、通過(guò)對(duì)波動(dòng)響應(yīng)度進(jìn)行非線性映射構(gòu)建基于sigmoid函數(shù)的臨變過(guò)渡模型獲得臨變過(guò)渡階值。

22、為有效處理波動(dòng)響應(yīng)度dt并最大限度地放大其在特定范圍內(nèi)的影響,本步驟設(shè)計(jì)了基于sigmoid函數(shù)的臨變過(guò)渡模型對(duì)其進(jìn)行非線性映射,從而得到當(dāng)前時(shí)刻的臨變過(guò)渡階值lt;

23、其中atcvt表示當(dāng)前建模點(diǎn)對(duì)應(yīng)的適應(yīng)表征值,用于對(duì)波動(dòng)響應(yīng)度進(jìn)行非線性變換;而將atcvt進(jìn)行雙曲正切變換,使海洋漁業(yè)環(huán)境的當(dāng)前狀態(tài)轉(zhuǎn)換為一個(gè)更適合臨變過(guò)渡模型處理的范圍,從而使對(duì)當(dāng)前條件的量化更加靈活和有效;

24、該臨變過(guò)渡模型通過(guò)將適應(yīng)表征值?atcvt施加雙曲正切函數(shù)進(jìn)行非線性壓縮,使其數(shù)值分布更加貼近海洋漁業(yè)環(huán)境中資源響應(yīng)的實(shí)際感知邊界。此處理機(jī)制模擬真實(shí)海域中資源調(diào)度系統(tǒng)對(duì)異常信號(hào)的漸進(jìn)感知過(guò)程,避免邊緣極值對(duì)策略系統(tǒng)造成過(guò)度響應(yīng)的風(fēng)險(xiǎn)。通過(guò)將該值再引入指數(shù)函數(shù)形式,與動(dòng)態(tài)因子?dt差值形成組合,強(qiáng)化了模型對(duì)輕微擾動(dòng)的放大能力。這種靈敏放大機(jī)制符合海洋系統(tǒng)初變先現(xiàn)微擾的物理特性,能夠提前捕捉環(huán)境進(jìn)入不穩(wěn)定區(qū)域的信號(hào),實(shí)現(xiàn)對(duì)潛在突變態(tài)勢(shì)的前置感知。經(jīng)sigmoid函數(shù)映射輸出的臨變過(guò)渡階值lt被控制在0到1之間以實(shí)現(xiàn)與策略控制系統(tǒng)進(jìn)行直接數(shù)值對(duì)接,并提高模型的解釋性與穩(wěn)定性。從而極大增強(qiáng)資源分配系統(tǒng)在劇烈環(huán)境擾動(dòng)下的韌性與策略前瞻性。

25、由于現(xiàn)有方法中基于短期基準(zhǔn)值與長(zhǎng)期基準(zhǔn)值對(duì)適應(yīng)表征值進(jìn)行非線性映射,進(jìn)而直接生成臨變過(guò)渡階值的處理路徑,在面對(duì)遠(yuǎn)洋海域中緩變趨勢(shì)與短時(shí)擾動(dòng)疊加共存的動(dòng)態(tài)環(huán)境背景時(shí),存在響應(yīng)機(jī)制單一、判別靈敏度不均的問(wèn)題,難以有效刻畫系統(tǒng)由穩(wěn)定態(tài)向突變態(tài)轉(zhuǎn)移過(guò)程中的過(guò)渡演化特性。尤其是在海況調(diào)控敏感區(qū),如風(fēng)浪增幅初期或污染擴(kuò)散臨界點(diǎn)附近,該方法極易出現(xiàn)過(guò)度響應(yīng)或響應(yīng)滯后,從而降低資源控制策略的時(shí)效性與適配性?,F(xiàn)有技術(shù)缺乏一種能夠?qū)_動(dòng)結(jié)構(gòu)在多時(shí)間尺度下進(jìn)行分解分析的指標(biāo)體系,也無(wú)法實(shí)現(xiàn)對(duì)擾動(dòng)驅(qū)動(dòng)源的精準(zhǔn)識(shí)別與演化趨勢(shì)的量化表達(dá),難以滿足遠(yuǎn)洋養(yǎng)殖系統(tǒng)中風(fēng)險(xiǎn)預(yù)警前置與資源調(diào)度魯棒雙重目標(biāo)的實(shí)踐需求。

26、為此本發(fā)明提出一種優(yōu)化路徑:通過(guò)引入三類時(shí)間維度差異化的動(dòng)態(tài)特征因子,分別表征擾動(dòng)強(qiáng)度、趨勢(shì)變化速率以及多輪異常積累行為,并構(gòu)建具有層級(jí)嵌套邏輯的動(dòng)態(tài)加權(quán)融合機(jī)制,使得模型能夠在不同尺度下主動(dòng)識(shí)別關(guān)鍵擾動(dòng)特征,實(shí)現(xiàn)突變風(fēng)險(xiǎn)的自適應(yīng)辨識(shí)與響應(yīng)等級(jí)調(diào)整。該策略在保留模型敏感度的同時(shí)增強(qiáng)其選擇性響應(yīng)能力,從而顯著提升系統(tǒng)對(duì)突變前兆的洞察能力與策略容錯(cuò)邊界,為遠(yuǎn)洋漁業(yè)資源管控提供具備生態(tài)彈性與風(fēng)險(xiǎn)規(guī)避特性的智能支撐。

27、優(yōu)選地,在步驟s400中,根據(jù)適應(yīng)表征值構(gòu)建臨變過(guò)渡模型,獲取臨變過(guò)渡階值的方法是:將任一次獲得控制策略的時(shí)刻作為建模點(diǎn),將任一建模點(diǎn)及其前num個(gè)建模點(diǎn)作為其動(dòng)態(tài)建模窗口,動(dòng)態(tài)建模窗口對(duì)應(yīng)適應(yīng)表征值構(gòu)建成窗口征值序列;num為當(dāng)前12-48小時(shí)內(nèi)的建模點(diǎn)數(shù)量;

28、通過(guò)動(dòng)態(tài)建模窗口計(jì)算海域擾動(dòng)因子αt,環(huán)境驟變因子βt以及風(fēng)險(xiǎn)積壓因子γt,并將上述因子帶入臨變過(guò)渡模型中進(jìn)行計(jì)算得到臨變過(guò)渡階值lt:lt=max(|αt|,|βt|)×exp(γt);其中海域擾動(dòng)因子用于判斷當(dāng)前環(huán)境中傳感系統(tǒng)獲得的參數(shù)存在非穩(wěn)定性的劇烈變化程度,其數(shù)學(xué)表達(dá)為窗口征值序列的標(biāo)準(zhǔn)差;

29、但是由于臨變過(guò)渡模型在實(shí)際應(yīng)用會(huì)出現(xiàn)對(duì)極端值敏感且無(wú)法有效捕捉數(shù)據(jù)的動(dòng)態(tài)變化的問(wèn)題,導(dǎo)致這個(gè)海域擾動(dòng)因子往往具有對(duì)極端值靈敏性不足的問(wèn)題,因此還提供其另一種解決思路,實(shí)現(xiàn)過(guò)程是:定義當(dāng)前建模點(diǎn)的窗口幅度為對(duì)應(yīng)窗口征值序列的極差,則幅度穩(wěn)定系數(shù)psi為動(dòng)態(tài)建模窗口內(nèi)各個(gè)建模點(diǎn)對(duì)應(yīng)窗口幅度的最小值與窗口幅度的比值;

30、逐個(gè)計(jì)算窗口征值序列內(nèi)每個(gè)適應(yīng)表征值與atcv1的差值,將所有差值進(jìn)行平方運(yùn)算和加權(quán)處理,將加權(quán)結(jié)果與psi相乘后進(jìn)行累加;將累加結(jié)果除以時(shí)間步數(shù)量num后取平方根,最終輸出值即為海域擾動(dòng)因子。該因子作用為量化適應(yīng)表征值偏離平均水平的震蕩幅度,反映環(huán)境參數(shù)的異常波動(dòng)強(qiáng)度。

31、環(huán)境驟變因子是模型提前識(shí)別趨勢(shì)失穩(wěn)的風(fēng)險(xiǎn)梯度:將當(dāng)前建模點(diǎn)與其前一個(gè)建模點(diǎn)之間適應(yīng)表征值步差值的差取絕對(duì)值作為差分變化量,差分變化量與建模時(shí)間距離的比值為環(huán)境驟變因子;

32、其中適應(yīng)表征值步差值是指任一建模點(diǎn)與其前一個(gè)建模點(diǎn)適應(yīng)表征值的差值;建模時(shí)間距離為當(dāng)前建模點(diǎn)與其前一個(gè)建模點(diǎn)之間的時(shí)間距離,單位為分鐘。

33、環(huán)境驟變因子作用為捕捉適應(yīng)表征值變化速率的加速或減速現(xiàn)象,識(shí)別環(huán)境惡化趨勢(shì)的演變動(dòng)能;

34、計(jì)算動(dòng)態(tài)建模窗口內(nèi)超過(guò)閾值的適應(yīng)表征值的超出累加量記為風(fēng)險(xiǎn)積壓因子,量化局部異常狀態(tài)長(zhǎng)期性的存在程度。

35、其計(jì)算方法具體為:獲取限定歷史數(shù)據(jù)中適應(yīng)表征值90%分位數(shù)作為異常閾值τ,遍歷動(dòng)態(tài)建模窗口內(nèi)每個(gè)適應(yīng)表征值,若適應(yīng)表征值大于閾值τ則將其標(biāo)記為異常點(diǎn)并計(jì)算其閾值超出量,即該適應(yīng)表征值與τ的差值;若值小于等于τ忽略該點(diǎn);將所有異常點(diǎn)的超出值進(jìn)行累加得到風(fēng)險(xiǎn)積壓因子。該因子作用為量化環(huán)境狀態(tài)持續(xù)偏離正常范圍的累積效應(yīng),表征系統(tǒng)性風(fēng)險(xiǎn)的能量?jī)?chǔ)備。其數(shù)學(xué)表達(dá)為:

36、;其中限定歷史數(shù)據(jù)的時(shí)間約束條件為當(dāng)前至少1個(gè)月的時(shí)間長(zhǎng)度,因?yàn)檫h(yuǎn)洋數(shù)據(jù)通常需要適應(yīng)潮汐現(xiàn)象的數(shù)據(jù),所以30個(gè)自然日是比較完整的回測(cè)周期,根據(jù)模型實(shí)際建模應(yīng)用方向可以調(diào)整為更長(zhǎng)的時(shí)間長(zhǎng)度,例如一個(gè)季度或者一年。

37、該模型通過(guò)滑動(dòng)窗口機(jī)制捕捉適應(yīng)表征值的時(shí)序演化特征,有效表征環(huán)境狀態(tài)的不穩(wěn)定性程度。其中海域擾動(dòng)因子反映環(huán)境參數(shù)的異常波動(dòng)幅度,環(huán)境驟變因子檢測(cè)惡化趨勢(shì)的加速現(xiàn)象,風(fēng)險(xiǎn)積壓因子量化持續(xù)偏離正常狀態(tài)的程度。三者通過(guò)非線性組合模型形成具備高靈敏度感知能力的臨變過(guò)渡階值,該模型可為后續(xù)突變風(fēng)險(xiǎn)決策提供量化依據(jù)。

38、有益效果:通過(guò)引入臨變過(guò)渡階值的建模機(jī)制,在遠(yuǎn)洋漁業(yè)資源調(diào)控場(chǎng)景下建立了一種面向趨勢(shì)演化與風(fēng)險(xiǎn)突變耦合響應(yīng)的分層量化框架實(shí)現(xiàn)對(duì)漁業(yè)資源動(dòng)態(tài)環(huán)境中多維擾動(dòng)信號(hào)的結(jié)構(gòu)化感知與語(yǔ)義解讀。臨變過(guò)渡階值不僅作為策略切換的核心判斷依據(jù),其更深層的量化意義還在于在連續(xù)時(shí)間域內(nèi)以適應(yīng)表征值為動(dòng)態(tài)驅(qū)動(dòng)變量,對(duì)環(huán)境狀態(tài)演化路徑中緩變,臨界和突變?nèi)齻€(gè)階段的響應(yīng)軌跡進(jìn)行區(qū)間投影與函數(shù)映射,使得系統(tǒng)能夠基于擾動(dòng)源強(qiáng)度、頻率與加速度等多個(gè)隱性變化因子的耦合結(jié)果在擾動(dòng)初步呈現(xiàn)的情況下,能實(shí)時(shí)量化當(dāng)前狀態(tài)對(duì)未來(lái)突變趨勢(shì)的敏感響應(yīng)程度,從而構(gòu)建起強(qiáng)化學(xué)習(xí)策略網(wǎng)絡(luò)與真實(shí)環(huán)境反饋之間的中介判斷橋梁,在保障策略穩(wěn)定性的同時(shí),增強(qiáng)了系統(tǒng)對(duì)環(huán)境非平穩(wěn)過(guò)程的分辨與適應(yīng)能力。進(jìn)而使得強(qiáng)化學(xué)習(xí)控制模型具備自我感知環(huán)境風(fēng)險(xiǎn)變化并主動(dòng)調(diào)整決策路徑的能力,推動(dòng)基于ai的漁業(yè)資源管控方法由被動(dòng)響應(yīng)向預(yù)判調(diào)控的范式躍遷,為遠(yuǎn)洋養(yǎng)殖場(chǎng)景下的電能調(diào)配、投喂路徑規(guī)整、網(wǎng)箱布局等提供了更加高效、可控與生態(tài)協(xié)調(diào)的解決方案。

39、進(jìn)一步地,在步驟s500中,通過(guò)臨變過(guò)渡階值進(jìn)行自適應(yīng)決策的方法是:設(shè)定5-15個(gè)自然日作為參考時(shí)間段,獲取參考時(shí)間段內(nèi)所有臨變過(guò)渡階值作為階值數(shù)集;如果當(dāng)前臨變過(guò)渡階值小于階值數(shù)集的下四分位則定義出現(xiàn)過(guò)渡標(biāo)記;當(dāng)一個(gè)自然日中過(guò)渡標(biāo)記出現(xiàn)比例過(guò)半則定義當(dāng)前環(huán)境處于突變風(fēng)險(xiǎn)狀態(tài),暫停模型控制輸出并觸發(fā)預(yù)警,或執(zhí)行預(yù)設(shè)的安全控制策略。

40、在突變風(fēng)險(xiǎn)狀態(tài)下系統(tǒng)自動(dòng)暫停緩變強(qiáng)化學(xué)習(xí)模型的控制輸出,以防模型因策略失配導(dǎo)致資源分配失衡。同時(shí)觸發(fā)兩類干預(yù)措施之一:其一為遠(yuǎn)程人工預(yù)警,提示運(yùn)維人員及時(shí)接管;其二為系統(tǒng)執(zhí)行預(yù)設(shè)的安全控制策略,優(yōu)先保障供氧、限流、維持基礎(chǔ)投喂等生存關(guān)鍵動(dòng)作,限制高能耗和精度要求高的操作,維持系統(tǒng)最小穩(wěn)定運(yùn)行狀態(tài)。此機(jī)制有效避免在突發(fā)風(fēng)險(xiǎn)下強(qiáng)化學(xué)習(xí)策略出現(xiàn)失控決策,提高系統(tǒng)運(yùn)行的韌性與安全性。

41、優(yōu)選地,其中,本發(fā)明中所有未定義的變量,若未有明確定義,均可為人工設(shè)置的閾值。

42、本發(fā)明還提供了一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配系統(tǒng),所述一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配系統(tǒng)包括:處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配方法中的步驟,所述一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配系統(tǒng)可以運(yùn)行于桌上型計(jì)算機(jī)、筆記本電腦、掌上電腦及云端數(shù)據(jù)中心等計(jì)算設(shè)備中,可運(yùn)行的系統(tǒng)可包括,但不僅限于,處理器、存儲(chǔ)器、服務(wù)器集群,所述處理器執(zhí)行所述計(jì)算機(jī)程序運(yùn)行在以下系統(tǒng)的單元中:

43、遠(yuǎn)洋場(chǎng)景初始化單元,用于初始化海洋漁業(yè)資源數(shù)據(jù)場(chǎng)景并進(jìn)行漁業(yè)數(shù)據(jù)采集;

44、強(qiáng)化學(xué)習(xí)模型構(gòu)建單元,用于通過(guò)漁業(yè)數(shù)據(jù)構(gòu)建多目標(biāo)協(xié)同調(diào)度的緩變強(qiáng)化學(xué)習(xí)模型;

45、適應(yīng)表征計(jì)算單元,用于對(duì)緩變強(qiáng)化學(xué)習(xí)模型運(yùn)行過(guò)程實(shí)時(shí)生成適應(yīng)表征值;

46、臨變過(guò)渡識(shí)別單元,用于根據(jù)適應(yīng)表征值構(gòu)建臨變過(guò)渡模型,獲取臨變過(guò)渡階值。

47、模型執(zhí)行決策單元,用于通過(guò)臨變過(guò)渡階值進(jìn)行自適應(yīng)決策。

48、本發(fā)明的有益效果為:本發(fā)明提供一種基于強(qiáng)化學(xué)習(xí)的海洋漁業(yè)資源大數(shù)據(jù)動(dòng)態(tài)分配方法,通過(guò)引入臨變過(guò)渡階值的建模機(jī)制,在遠(yuǎn)洋漁業(yè)資源調(diào)控場(chǎng)景下建立了一種面向趨勢(shì)演化與風(fēng)險(xiǎn)突變耦合響應(yīng)的分層量化框架實(shí)現(xiàn)對(duì)漁業(yè)資源動(dòng)態(tài)環(huán)境中多維擾動(dòng)信號(hào)的結(jié)構(gòu)化感知與語(yǔ)義解讀,在連續(xù)時(shí)間域內(nèi)以適應(yīng)表征值為動(dòng)態(tài)驅(qū)動(dòng)變量,對(duì)環(huán)境狀態(tài)演化路徑中緩變,臨界和突變?nèi)齻€(gè)階段的響應(yīng)軌跡進(jìn)行區(qū)間投影與函數(shù)映射,使得系統(tǒng)能夠基于擾動(dòng)源強(qiáng)度、頻率與加速度等多個(gè)隱性變化因子的耦合結(jié)果在擾動(dòng)初步呈現(xiàn)的情況下,能實(shí)時(shí)量化當(dāng)前狀態(tài)對(duì)未來(lái)突變趨勢(shì)的敏感響應(yīng)程度,從而構(gòu)建起強(qiáng)化學(xué)習(xí)策略網(wǎng)絡(luò)與真實(shí)環(huán)境反饋之間的中介判斷橋梁,在保障策略穩(wěn)定性的同時(shí),增強(qiáng)了系統(tǒng)對(duì)環(huán)境非平穩(wěn)過(guò)程的分辨與適應(yīng)能力。進(jìn)而使得強(qiáng)化學(xué)習(xí)控制模型具備自我感知環(huán)境風(fēng)險(xiǎn)變化并主動(dòng)調(diào)整決策路徑的能力,推動(dòng)基于ai的漁業(yè)資源管控方法由被動(dòng)響應(yīng)向預(yù)判調(diào)控的范式躍遷,為遠(yuǎn)洋養(yǎng)殖場(chǎng)景下的電能調(diào)配、投喂路徑規(guī)整、網(wǎng)箱布局等提供了更加高效、可控與生態(tài)協(xié)調(diào)的解決方案。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1