本技術(shù)涉及數(shù)據(jù)處理,尤其涉及一種基于語音交互的數(shù)據(jù)交互展示方法、系統(tǒng)及介質(zhì)。
背景技術(shù):
1、在快速變化的商業(yè)環(huán)境中,企業(yè)員工(如營服經(jīng)理)需要實時掌握業(yè)務(wù)數(shù)據(jù),以便做出迅速且準(zhǔn)確的決策,為企業(yè)實現(xiàn)更好的效益。然而,傳統(tǒng)的數(shù)據(jù)檢索和分析方式,通常依賴于手動輸入,需要用戶具備較高的sql數(shù)據(jù)庫操作技能,并且十分容易出錯。即便是對于經(jīng)驗豐富的用戶來說,面對海量的業(yè)務(wù)數(shù)據(jù),手動輸入和篩選仍然是一項耗時費力的任務(wù)。傳統(tǒng)的數(shù)據(jù)展示方式,如電子表格或靜態(tài)報告,往往存在數(shù)據(jù)更新不及時、信息展示不直觀等問題,限制了員工的決策效率。
技術(shù)實現(xiàn)思路
1、為解決上述技術(shù)問題,本發(fā)明的目的在于:提供一種基于語音交互的數(shù)據(jù)交互展示方法、系統(tǒng)及介質(zhì),能夠提高數(shù)據(jù)檢索的效率和準(zhǔn)確性,實現(xiàn)數(shù)據(jù)的直觀展示和交互。
2、為實現(xiàn)上述目的,本技術(shù)實施例的一方面提出了一種基于語音交互的數(shù)據(jù)交互展示方法,包括以下步驟:
3、獲取用戶語音數(shù)據(jù),對所述用戶語音數(shù)據(jù)進行預(yù)處理,得到第一語音信號;
4、對所述第一語音信號進行特征提取,得到梅爾濾波器組特征,將所述梅爾濾波器組特征輸入預(yù)先訓(xùn)練好的語音識別模型,得到語音識別結(jié)果;
5、通過預(yù)設(shè)的智能數(shù)據(jù)助手對所述語音識別結(jié)果進行檢索和案例搜索,得到用戶所需取數(shù)結(jié)果;
6、根據(jù)所述用戶所需取數(shù)結(jié)果對應(yīng)的數(shù)值類型將所述用戶所需取數(shù)結(jié)果進行展示;
7、其中,所述智能數(shù)據(jù)助手包括檢索增強生成框架和大語言模型。
8、在一些實施例中,所述對所述用戶語音數(shù)據(jù)進行預(yù)處理,得到第一語音信號,具體包括:
9、對所述用戶語音數(shù)據(jù)進行歸一化處理,得到第二語音信號;
10、將所述第二語音信號進行預(yù)加重處理,得到所述第一語音信號。
11、在一些實施例中,所述對所述第一語音信號進行特征提取,得到梅爾濾波器組特征,具體包括:
12、在時域上對所述第一語音信號進行分幀加窗,得到時域信號;
13、對所述時域信號進行短時傅里葉變換,得到短時傅里葉變換幅度譜;
14、設(shè)置梅爾濾波器組,將所述短時傅里葉變換幅度譜輸入所述梅爾濾波器組,得到梅爾短時傅里葉變換幅度譜;
15、對所述梅爾短時傅里葉變換幅度譜進行取對數(shù)模,得到對數(shù)梅爾時頻譜圖;
16、對所述對數(shù)梅爾時頻譜圖進行特征提取,得到所述梅爾濾波器組特征。
17、在一些實施例中,所述數(shù)據(jù)交互展示方法還包括預(yù)先訓(xùn)練所述語音識別模型的步驟,所述預(yù)先訓(xùn)練所述語音識別模型,具體包括:
18、獲取公開語音數(shù)據(jù)集和本地語音數(shù)據(jù)集;
19、對所述公開語音數(shù)據(jù)集進行特征提取,得到第一梅爾濾波器組特征集;
20、對所述本地語音數(shù)據(jù)集進行特征提取,得到第二梅爾濾波器組特征集;
21、對預(yù)先訓(xùn)練好的paraformer模型進行參數(shù)遷移,將所述第一梅爾濾波器組特征集和所述第二梅爾濾波器組特征集輸入?yún)?shù)遷移后的所述paraformer模型;
22、通過交叉熵?fù)p失、平均絕對誤差損失以及最小單詞錯誤率損失對參數(shù)遷移訓(xùn)練后的所述paraformer模型進行遷移學(xué)習(xí),得到訓(xùn)練好的所述語音識別模型;
23、設(shè)定置信度閾值,當(dāng)所述語音識別結(jié)果的置信度高于所述置信度閾值,將對應(yīng)的所述用戶語音數(shù)據(jù)輸入所述本地語音數(shù)據(jù)集。
24、在一些實施例中,所述通過預(yù)設(shè)的智能數(shù)據(jù)助手對所述語音識別結(jié)果進行檢索和案例搜索,得到用戶所需取數(shù)結(jié)果,具體包括:
25、構(gòu)建所述檢索增強生成框架,通過所述檢索增強生成框架對所述語音識別結(jié)果進行檢索,得到多個相似案例;
26、構(gòu)建提問文本,將所述提問文本和各所述相似案例輸入所述大語言模型進行案例搜索,得到最相似案例;
27、構(gòu)建用戶取數(shù)案例庫,根據(jù)所述最相似案例的sql代碼對所述用戶取數(shù)案例庫進行取數(shù),得到所述用戶所需取數(shù)結(jié)果。
28、在一些實施例中,所述檢索增強生成框架包括雙向編碼表示模型和文本檢索算法,所述通過預(yù)設(shè)的檢索增強生成框架對所述語音識別結(jié)果進行檢索,得到多個相似案例,具體包括:
29、構(gòu)建數(shù)據(jù)查詢案例庫;
30、將所述語音識別結(jié)果輸入所述雙向編碼表示模型進行向量編碼,得到語音問題向量和所述語音問題向量對應(yīng)的向量編碼;
31、通過所述文本檢索算法,根據(jù)所述數(shù)據(jù)查詢案例庫、所述語音問題向量以及所述向量編碼進行檢索,得到多個所述相似案例。
32、在一些實施例中,所述根據(jù)所述用戶所需取數(shù)結(jié)果對應(yīng)的數(shù)值類型將所述用戶所需取數(shù)結(jié)果進行展示,具體包括:
33、構(gòu)建數(shù)據(jù)展示模板,并確定所述用戶所需取數(shù)結(jié)果對應(yīng)的數(shù)值類型;
34、根據(jù)所述數(shù)據(jù)展示模板和所述數(shù)值類型對所述用戶所需取數(shù)結(jié)果進行展示。
35、為實現(xiàn)上述目的,本技術(shù)實施例的另一方面提出了一種基于語音交互的數(shù)據(jù)交互展示系統(tǒng),包括:
36、數(shù)據(jù)預(yù)處理模塊,用于獲取用戶語音數(shù)據(jù),對所述用戶語音數(shù)據(jù)進行預(yù)處理,得到第一語音信號;
37、語音增強與識別模塊,用于對所述第一語音信號進行特征提取,得到梅爾濾波器組特征,將所述梅爾濾波器組特征輸入預(yù)先訓(xùn)練好的語音識別模型,得到語音識別結(jié)果;
38、取數(shù)結(jié)果確定模塊,用于通過預(yù)設(shè)的智能數(shù)據(jù)助手對所述語音識別結(jié)果進行檢索和案例搜索,得到用戶所需取數(shù)結(jié)果;
39、數(shù)據(jù)交互展示模塊,用于根據(jù)所述用戶所需取數(shù)結(jié)果對應(yīng)的數(shù)值類型將所述用戶所需取數(shù)結(jié)果進行展示;
40、其中,所述智能數(shù)據(jù)助手包括檢索增強生成框架和大語言模型。
41、為實現(xiàn)上述目的,本技術(shù)實施例的另一方面提出了一種電子設(shè)備,所述電子設(shè)備包括存儲器、處理器、存儲在所述存儲器上并可在所述處理器上運行的程序以及用于實現(xiàn)所述處理器和所述存儲器之間的連接通信的數(shù)據(jù)總線,所述程序被所述處理器執(zhí)行時實現(xiàn)如前面所述的基于語音交互的數(shù)據(jù)交互展示方法。
42、為實現(xiàn)上述目的,本技術(shù)實施例的另一方面提出了一種存儲介質(zhì),所述存儲介質(zhì)為計算機可讀存儲介質(zhì),用于計算機可讀存儲,所述存儲介質(zhì)存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執(zhí)行,以實現(xiàn)如前面所述的基于語音交互的數(shù)據(jù)交互展示方法。
43、本發(fā)明的有益效果是:本發(fā)明的基于語音交互的數(shù)據(jù)交互展示方法、系統(tǒng)及介質(zhì),首先對用戶語音數(shù)據(jù)進行預(yù)處理,得到第一語音信號,接著對第一語音信號進行特征提取,得到梅爾濾波器組特征,將梅爾濾波器組特征輸入預(yù)先訓(xùn)練好的語音識別模型,得到語音識別結(jié)果,進而通過包括檢索增強生成框架和大語言模型的智能數(shù)據(jù)助手對語音識別結(jié)果進行檢索和案例搜索,得到用戶所需取數(shù)結(jié)果,最后根據(jù)用戶所需取數(shù)結(jié)果對應(yīng)的數(shù)值類型將用戶所需取數(shù)結(jié)果進行展示。本發(fā)明構(gòu)建基于檢索增強生成框架和大語言模型的智能數(shù)據(jù)助手,并通過語音交互功能和預(yù)先訓(xùn)練好的語言識別模型,有效識別用戶語音指令,以提升數(shù)據(jù)訪問效率,最終實現(xiàn)數(shù)據(jù)的直觀理解和快速分析,提高了數(shù)據(jù)檢索的效率和準(zhǔn)確性,基于用戶所需取數(shù)結(jié)果對應(yīng)的數(shù)值類型對數(shù)據(jù)進行展示,實現(xiàn)了數(shù)據(jù)的直觀展示和交互,能夠極大減少人工處理時間,有效提高員工工作效率。