本發(fā)明屬于醫(yī)療信息處理,具體來說,特別涉及基于知識圖譜的血液腫瘤患者臨床數(shù)據(jù)分析方法及系統(tǒng)。
背景技術(shù):
1、當前血液腫瘤診療面臨高度復雜性;疾病亞型多樣、治療方案需結(jié)合基因突變動態(tài)調(diào)整,且治療過程中骨髓抑制、感染等并發(fā)癥風險實時變化。當前臨床決策依賴醫(yī)生經(jīng)驗,而多源異構(gòu)醫(yī)療數(shù)據(jù)存在信息孤島,非結(jié)構(gòu)化文本解析困難,關(guān)鍵實體難以標準化整合。傳統(tǒng)臨床決策支持系統(tǒng)多基于靜態(tài)規(guī)則庫,無法建模治療時序動態(tài)及個體化風險預警,導致治療方案優(yōu)化滯后,患者安全監(jiān)控存在盲區(qū)。
2、現(xiàn)有技術(shù)中存在數(shù)據(jù)整合不足、知識表示僵化以及決策支持滯后的問題。
技術(shù)實現(xiàn)思路
1、(一)解決的技術(shù)問題
2、針對相關(guān)技術(shù)中的問題,本發(fā)明提供基于知識圖譜的血液腫瘤患者臨床數(shù)據(jù)分析方法,以克服現(xiàn)有相關(guān)技術(shù)所存在的上述技術(shù)問題。
3、(二)技術(shù)方案
4、為解決上述技術(shù)問題,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
5、s1、收集血液腫瘤患者臨床數(shù)據(jù)并處理,得到標準化實體集合和標注治療階段的時間軸數(shù)據(jù)集;
6、s2、基于血液腫瘤本體模型文件結(jié)合標準化實體集合,并根據(jù)臨床因果關(guān)系和時序路徑,得到動態(tài)全局血液腫瘤知識圖譜;
7、s3、基于實時患者數(shù)據(jù),判斷是否在動態(tài)全局血液腫瘤知識圖譜中構(gòu)建預警實體節(jié)點;基于時間軸標記的治療階段數(shù)據(jù)集,構(gòu)建實時患者階段子圖譜;
8、s4、基于實時患者階段子圖譜,在動態(tài)全局血液腫瘤知識圖譜中進行檢索,得到最優(yōu)候選治療方案集;
9、s5、在所述動態(tài)全局血液腫瘤知識圖譜中收集歷史患者的子圖譜,得到帶并發(fā)癥標注的歷史患者子圖譜;通過帶并發(fā)癥標注的歷史患者子圖譜結(jié)合優(yōu)化算法對圖神經(jīng)網(wǎng)絡(luò)進行訓練,得到最終圖神經(jīng)網(wǎng)絡(luò);
10、s6、將最優(yōu)候選治療方案集結(jié)合實時患者子圖譜輸入至最終圖神經(jīng)網(wǎng)絡(luò),得到并發(fā)癥預警結(jié)果集;
11、根據(jù)并發(fā)癥預警結(jié)果集從最優(yōu)候選治療方案集中選擇最終治療方案;
12、本發(fā)明通過對接醫(yī)院多源系統(tǒng),通過nlp技術(shù)解析文本構(gòu)建標準化實體集,并以確診日為原點聚合實驗室指標形成時間軸數(shù)據(jù)集;基于血液腫瘤本體模型整合實體,結(jié)合臨床因果與時序路徑構(gòu)建動態(tài)知識圖譜,實現(xiàn)治療事件錨定及劑量效應預警;基于實時患者子圖譜檢索同分子特征歷史成功案例生成候選方案集;利用帶并發(fā)癥標注的歷史子圖譜訓練圖神經(jīng)網(wǎng)絡(luò),預測各方案并發(fā)癥風險;最終根據(jù)風險-獲益評估選擇最優(yōu)治療方案;本方法打破數(shù)據(jù)孤島,實現(xiàn)超前預警與個性化安全治療,提升療效并降低并發(fā)癥風險。
13、優(yōu)選地,所述s1包括以下步驟:
14、s11、收集電子病歷中的疾病診斷記錄、實驗室信息系統(tǒng)的檢驗報告、影像歸檔系統(tǒng)的文本描述,得到醫(yī)院多源異構(gòu)數(shù)據(jù)庫;
15、通過醫(yī)療行業(yè)標準協(xié)議對接醫(yī)院多源異構(gòu)數(shù)據(jù)庫,自動提取結(jié)構(gòu)化數(shù)據(jù)中檢驗指標和用藥記錄,采用自然語言處理模型解析醫(yī)院多源異構(gòu)數(shù)據(jù)庫中的非結(jié)構(gòu)化文本,識別關(guān)鍵醫(yī)學實體,得到標準化實體集合;所述標準化實體集合包括疾病分型、基因突變以及具體用藥方案;
16、s12、從醫(yī)院多源異構(gòu)數(shù)據(jù)庫中收集藥物使用的時間戳、實驗室檢測指標的時間序列,得到時序數(shù)據(jù);以患者確診日為時間原點,統(tǒng)一校準時序數(shù)據(jù)中所有臨床事件時間點,根據(jù)動態(tài)窗口聚合實驗室檢測指標,得到標注治療階段的時間軸數(shù)據(jù)集;
17、本發(fā)明通過采用醫(yī)療標準協(xié)議自動提取結(jié)構(gòu)化用藥及檢驗數(shù)據(jù),并利用nlp模型精準解析非結(jié)構(gòu)化文本,識別疾病分型、基因突變、用藥方案等標準化實體集合;以確診日為時間原點,通過動態(tài)窗口聚合實驗室指標,構(gòu)建標注治療階段的時間軸數(shù)據(jù)集;打破了醫(yī)院數(shù)據(jù)孤島,實現(xiàn)關(guān)鍵醫(yī)學實體的深度整合與標準化,為后續(xù)精準分析提供高質(zhì)量時序數(shù)據(jù)基礎(chǔ)。
18、優(yōu)選地,所述s2包括以下步驟:
19、s21、定義血液腫瘤領(lǐng)域的語義規(guī)則和分類體系,確保知識圖譜符合醫(yī)學邏輯,得到血液腫瘤本體模型文件;所述血液腫瘤本體模型包括實體層、關(guān)系層以及規(guī)則層;所述實體層包括疾病亞型、基因突變以及治療方案;所述關(guān)系層包括誘導治療-包含-治療方案和flt3-導致-靶向藥敏感;所述規(guī)則層包括復發(fā)預警規(guī)則;
20、提取血液腫瘤本體模型文件中的類、屬性以及關(guān)系約束,得到血液腫瘤本體語義定義;
21、s22、基于標準化實體集合以及血液腫瘤本體語義定義,將標準化實體關(guān)聯(lián)至本體類,并依據(jù)本體屬性定義實體間關(guān)系,得到靜態(tài)血液腫瘤知識圖譜框架;
22、s23、基于標注治療階段的時間軸數(shù)據(jù)集和靜態(tài)血液腫瘤知識圖譜框架,通過規(guī)則引擎檢測臨床因果關(guān)系,并根據(jù)治療響應生成時序路徑,得到動態(tài)全局血液腫瘤知識圖譜;
23、本發(fā)明基于血液腫瘤本體模型,將標準化實體映射為知識節(jié)點,構(gòu)建靜態(tài)圖譜框架;結(jié)合時間軸數(shù)據(jù)集,通過規(guī)則引擎檢測臨床因果關(guān)系并生成時序路徑,形成動態(tài)全局知識圖譜;實現(xiàn)治療邏輯推演與劑量效應預警,為精準決策提供醫(yī)學邏輯保障。
24、優(yōu)選地,所述s3包括以下步驟:
25、s31、收集實時實驗室流數(shù)據(jù)以及當前用藥記錄,得到實時患者數(shù)據(jù);
26、s32、根據(jù)實時患者數(shù)據(jù)以及時效性規(guī)則集,在動態(tài)全局血液腫瘤知識圖譜中構(gòu)建預警實體節(jié)點及關(guān)聯(lián)關(guān)系;當識別到預警實體節(jié)點發(fā)出預警,并根據(jù)關(guān)系應對;
27、s33、基于實時患者數(shù)據(jù),結(jié)合時間軸標記的治療階段數(shù)據(jù)集,按臨床路徑劃分離散階段并基于醫(yī)學邏輯判斷階段轉(zhuǎn)換,得到階段子圖譜;
28、本發(fā)明通過實時流數(shù)據(jù)匹配時效性規(guī)則,在知識圖譜動態(tài)創(chuàng)建預警節(jié)點;同時基于醫(yī)學邏輯自動劃分治療階段,生成含當前用藥及指標趨勢的階段子圖譜;實現(xiàn)并發(fā)癥超前干預與治療全程精準管理。
29、優(yōu)選地,所述s32包括以下步驟:
30、s321、將藥物暴露時間與實驗室指標變化進行精確對齊;計算藥物劑量與血細胞下降速率的劑量-效應關(guān)系;基于劑量-效應關(guān)系建立的鏈式反應模型;
31、s322、基于鏈式反應模型構(gòu)建時效性規(guī)則集;
32、s323、將實時患者數(shù)據(jù)與時效性規(guī)則集中的時效性規(guī)則進行匹配,若實時患者數(shù)據(jù)中存在數(shù)據(jù)超出時效性規(guī)則中的閾值,則在動態(tài)血液腫瘤知識圖譜中自動創(chuàng)建臨床事件節(jié)點,并關(guān)聯(lián)至當前治療周期,得到包含預警實體及關(guān)聯(lián)關(guān)系的動態(tài)血液腫瘤知識圖譜,否則不創(chuàng)建預警實體;
33、本發(fā)明通過建立藥物劑量-血細胞下降速率的劑量-效應模型,構(gòu)建如"藥物→骨髓抑制→感染"的鏈式預警規(guī)則集,實現(xiàn)實時流數(shù)據(jù)與規(guī)則的毫秒級匹配。當超閾值時自動在知識圖譜中創(chuàng)建預警節(jié)點并關(guān)聯(lián)治療周期,形成動態(tài)風險映射,提升了臨床驗證的響應速度,降低了嚴重感染發(fā)生率。
34、優(yōu)選地,所述s4包括以下步驟:
35、s41、基于實時患者階段子圖譜,提取患者當前基因突變特征,得到實時患者分子特征;在知識圖譜中檢索具有相同分子特征的歷史患者群體,篩選達到完全緩解治療目標的成功病例,得到成功案例集;
36、s42、分析成功案例集中的成功病例使用的治療方案,根據(jù)完全緩解持續(xù)時間、微小殘留病灶清除深度以及治療相關(guān)毒性發(fā)生率對成功病例使用的治療方案進行療效評分,得到最優(yōu)候選治療方案集;
37、本發(fā)明通過實時患者基因特征在知識圖譜中精準匹配歷史成功案例,并綜合完全緩解持續(xù)時間、微小殘留病灶清除深度及治療毒性發(fā)生率三大維度進行療效量化評分,生成最優(yōu)候選方案集;提升了患者首次誘導緩解率,且降低了方案相關(guān)嚴重毒性事件。
38、優(yōu)選地,所述s5包括以下步驟:
39、s51、從動態(tài)全局血液腫瘤知識圖譜中收集歷史患者的子圖譜,得到帶并發(fā)癥標注的歷史患者子圖譜;
40、s52、構(gòu)建圖神經(jīng)網(wǎng)絡(luò);使用帶并發(fā)癥標注的歷史患者子圖譜對圖神經(jīng)網(wǎng)絡(luò)進行訓練,訓練過程中結(jié)合優(yōu)化算法尋找圖神經(jīng)網(wǎng)絡(luò)的學習率,得到最優(yōu)解;將最優(yōu)解作為圖神經(jīng)網(wǎng)絡(luò)的學習率,得到最終圖神經(jīng)網(wǎng)絡(luò);
41、本發(fā)明利用帶并發(fā)癥標注的歷史患者子圖譜訓練圖神經(jīng)網(wǎng)絡(luò),并通過優(yōu)化算法自動確定最佳學習率;提升了并發(fā)癥預測準確率,縮短了預測時間,為治療方案風險量化提供核心支持。
42、優(yōu)選地,所述s52中訓練過程中結(jié)合優(yōu)化算法尋找圖神經(jīng)網(wǎng)絡(luò)的學習率,得到最優(yōu)解包括以下步驟:
43、s521、設(shè)定參數(shù)搜尋空間,最大隨機搜索次數(shù),設(shè)定交叉驗證折數(shù)為 c;
44、s522、根據(jù)所述參數(shù)搜尋空間 ,定義學習率集;
45、初始化最優(yōu)學習率為 f,初始化最佳性能為 g,從候選學習率集中隨機選擇學習率為 h,將帶并發(fā)癥標注的歷史患者子圖譜分為 c折,對于每一折 c,;使用除第 c折外的所有帶并發(fā)癥標注的歷史患者子圖譜,訓練所述圖神經(jīng)網(wǎng)絡(luò),使用第 c折的帶并發(fā)癥標注的歷史患者子圖譜評估模型,得到性能指標集;計算所有折的性能指標的均值,得到平均性能 p;
46、如果平均性能 p>最佳性能 g,則更新最佳性能為 p,更新最優(yōu)學習率為 h;反之則保持原來的最佳性能、最優(yōu)學習率;
47、s523、重復s522,當達到最大隨機搜索次數(shù),停止迭代,得到最終圖神經(jīng)網(wǎng)絡(luò);
48、本發(fā)明通過隨機搜索算法在預設(shè)學習率空間內(nèi)迭代優(yōu)化;通過劃分歷史患者子圖譜為c折進行交叉驗證,每輪隨機選擇學習率訓練圖神經(jīng)網(wǎng)絡(luò),用驗證折評估性能并計算平均性能指標p;當p超過當前最佳性能g時更新最優(yōu)學習率,直至達到最大搜索次數(shù)停止;實現(xiàn)了學習率自適應優(yōu)化,使模型訓練效率提升,提升了并發(fā)癥預測準確率,且避免人工調(diào)參的盲目性。
49、優(yōu)選地,所述s6包括以下步驟:
50、s61、通過動態(tài)全局血液腫瘤知識圖譜,得到實時患者子圖譜;將最優(yōu)候選治療方案集中的候選治療方案分別結(jié)合實時患者子圖譜,并依次輸入最終圖神經(jīng)網(wǎng)絡(luò),得到并發(fā)癥預警結(jié)果集;所述并發(fā)癥預警結(jié)果集包含每種候選治療方案對實時患者進行治療后的并發(fā)癥預測結(jié)果;
51、s62、根據(jù)并發(fā)癥預警結(jié)果集從最優(yōu)候選治療方案集中選擇最終治療方案對實時患者進行治療;
52、本發(fā)明通過將最優(yōu)候選治療方案與實時患者子圖譜輸入訓練好的圖神經(jīng)網(wǎng)絡(luò),動態(tài)預測各方案下并發(fā)癥發(fā)生風險,生成并發(fā)癥預警結(jié)果集;基于該結(jié)果集量化評估風險-獲益比,選擇并發(fā)癥風險最低且療效最優(yōu)的方案作為最終治療方案;實現(xiàn)治療決策的安全優(yōu)化,顯著降低臨床風險并提升患者耐受性。
53、基于知識圖譜的血液腫瘤患者臨床數(shù)據(jù)分析系統(tǒng),用于實現(xiàn)上述基于知識圖譜的血液腫瘤患者臨床數(shù)據(jù)分析方法,包括多源醫(yī)療數(shù)據(jù)集成與標準化模塊、動態(tài)知識圖譜構(gòu)建模塊、實時患者監(jiān)測與預警模塊、治療方案智能匹配模塊、圖神經(jīng)網(wǎng)絡(luò)優(yōu)化訓練模塊以及并發(fā)癥預測與決策模塊;
54、所述多源醫(yī)療數(shù)據(jù)集成與標準化模塊用于對接醫(yī)院電子病歷、實驗室信息系統(tǒng)及影像歸檔系統(tǒng),通過hl7/fhir協(xié)議自動抽取結(jié)構(gòu)化數(shù)據(jù),并利用自然語言處理技術(shù)解析非結(jié)構(gòu)化文本,識別疾病分型、基因突變、用藥方案等關(guān)鍵醫(yī)學實體,構(gòu)建包含時間戳的標準化實體集合;同時以患者確診日為時間原點,動態(tài)聚合窗口內(nèi)的實驗室指標,生成標注治療階段的時間軸數(shù)據(jù)集;
55、所述動態(tài)知識圖譜構(gòu)建模塊基于預定義的血液腫瘤本體模型,將標準化實體映射至本體類,建立靜態(tài)知識圖譜框架。隨后通過規(guī)則引擎注入臨床因果關(guān)系與治療響應時序路徑,結(jié)合時間軸數(shù)據(jù)生成動態(tài)全局知識圖譜,支持疾病演進邏輯推演與預警規(guī)則執(zhí)行;
56、所述實時患者監(jiān)測與預警模塊通過接收實時流數(shù)據(jù),通過時效性規(guī)則集進行動態(tài)風險判定;當檢測到閾值越界時,自動在知識圖譜中創(chuàng)建預警節(jié)點并關(guān)聯(lián)治療階段,實現(xiàn)預警;同時,依據(jù)臨床路徑規(guī)則劃分患者當前治療階段,構(gòu)建階段特異性子圖譜;
57、所述治療方案智能匹配模塊基于實時患者分子特征,在知識圖譜中檢索具有相同特征的歷史成功病例,提取其治療方案并綜合療效指標進行評分,生成最優(yōu)候選治療方案集,為個體化治療提供數(shù)據(jù)驅(qū)動的決策依據(jù);
58、所述圖神經(jīng)網(wǎng)絡(luò)優(yōu)化訓練模塊收集歷史患者子圖譜(含并發(fā)癥標注),構(gòu)建圖神經(jīng)網(wǎng)絡(luò)模型,采用隨機搜索優(yōu)化算法在預設(shè)參數(shù)空間內(nèi)迭代尋找最優(yōu)學習率;通過交叉驗證評估模型性能,以平均性能為指標動態(tài)更新學習率,最終訓練出可精準建模治療-并發(fā)癥關(guān)聯(lián)的圖神經(jīng)網(wǎng)絡(luò);
59、所述并發(fā)癥預測與決策模塊將候選治療方案與實時患者子圖譜輸入訓練后的圖神經(jīng)網(wǎng)絡(luò),預測各方案可能引發(fā)的并發(fā)癥,生成并發(fā)癥預警結(jié)果集;臨床醫(yī)生據(jù)此結(jié)合療效評分與并發(fā)癥概率從候選方案中選擇最終治療方案,實現(xiàn)風險可控的個體化治療決策。
60、(三)有益效果
61、本發(fā)明具有以下有益效果:
62、本發(fā)明通過深度融合多源異構(gòu)數(shù)據(jù)、構(gòu)建具備時序邏輯與因果推理能力的動態(tài)知識圖譜、實現(xiàn)基于分子特征與并發(fā)癥風險預測的個性化方案智能推薦,以及自動化診療流程管理,構(gòu)建了一套閉環(huán)的血液腫瘤精準化、智能化臨床決策支持系統(tǒng);顯著提升診療效率與規(guī)范性、實現(xiàn)超前精準風險預警、優(yōu)化治療方案選擇以最大化療效同時最小化并發(fā)癥風險,最終改善患者生存質(zhì)量與預后,并有效提升醫(yī)療資源利用效率。
63、本發(fā)明通過對接醫(yī)院內(nèi)部的異構(gòu)系統(tǒng),并運用nlp模型精準解析非結(jié)構(gòu)化文本,打破了醫(yī)院內(nèi)部的數(shù)據(jù)孤島;通過自動化提取了用藥記錄、診斷編碼等結(jié)構(gòu)化數(shù)據(jù),并從自由文本中高精度識別并標準化了關(guān)鍵醫(yī)學實體;這種深度整合與標準化處理,為后續(xù)構(gòu)建高質(zhì)量知識圖譜和開展精準分析奠定了堅實、統(tǒng)一的數(shù)據(jù)基礎(chǔ),顯著提升了臨床數(shù)據(jù)的可利用性和內(nèi)在價值密度。
64、本發(fā)明通過構(gòu)建基于血液腫瘤本體模型的動態(tài)全局知識圖譜;該圖譜不僅靜態(tài)組織疾病分型、基因突變、治療方案及其間關(guān)系,還融入了強大的時序維度和邏輯推理能力;以患者確診日為原點精確錨定治療事件,并通過動態(tài)窗口聚合實驗室指標,真實刻畫治療過程的動態(tài)變化;利用規(guī)則引擎實時檢測臨床因果關(guān)系并生成治療響應路徑,使圖譜具備臨床推演能力;基于劑量-效應關(guān)系模型和鏈式反應模型,系統(tǒng)能根據(jù)實時流數(shù)據(jù)自動匹配時效性規(guī)則,超前觸發(fā)分級預警,提升了干預時效性和有效性,有效預防嚴重并發(fā)癥。
65、本發(fā)明實現(xiàn)了在治療方案推薦方面的高度個性化與安全性的優(yōu)化平衡;系統(tǒng)基于實時患者的分子特征,在知識圖譜中檢索具有相同分子特征且達到完全緩解目標的歷史成功病例,確保推薦方案具有堅實的循證基礎(chǔ);進而對候選方案進行多維度療效評分,綜合考慮完全緩解持續(xù)時間、微小殘留病灶清除深度以及治療相關(guān)毒性發(fā)生率,兼顧長期生存獲益與治療安全性;利用優(yōu)化算法訓練好的圖神經(jīng)網(wǎng)絡(luò)模型,結(jié)合包含患者當前階段、用藥、指標趨勢等信息的實時子圖譜,動態(tài)預測每種候選方案下患者發(fā)生嚴重感染或器官毒性等特定并發(fā)癥的風險;使得最終治療方案的選擇建立在對個體化風險-獲益比的精準量化評估之上,顯著提升了治療的安全性和患者的耐受性。
66、本發(fā)明顯著提升了診療流程的智能化與標準化水平,優(yōu)化了醫(yī)療資源配置;系統(tǒng)自動化地完成了從多源數(shù)據(jù)整合、時序分析、知識推理、風險評估到方案推薦的復雜閉環(huán)流程;基于預設(shè)的嚴格醫(yī)學邏輯確?;颊甙醋罴雅R床路徑推進,減少人為延誤;通過為每個治療階段創(chuàng)建包含關(guān)鍵事件、用藥方案、指標變化趨勢及并發(fā)癥的獨立子圖譜,實現(xiàn)了治療過程的精細化管理與復盤;超前預警機制使醫(yī)護人員能夠提前部署資源應對高風險事件,優(yōu)化了人力資源分配,將有限精力聚焦于最危急的患者,整體提升了醫(yī)療服務的效率和質(zhì)量。
67、當然,實施本發(fā)明的任一產(chǎn)品并不一定需要同時達到以上所述的所有優(yōu)點。