本發(fā)明涉及智能計(jì)算中心、智算中心及算力基礎(chǔ)設(shè)施,具體涉及一種面向普惠算力智能計(jì)算中心的大模型分層存儲(chǔ)方法及裝置。
背景技術(shù):
1、隨著人工智能技術(shù)的快速發(fā)展,“智能計(jì)算中心”和“智算中心”應(yīng)運(yùn)而生。
2、“智能計(jì)算中心”是指通過(guò)使用大規(guī)模異構(gòu)算力資源,包括通用算力和智能算力,主要為人工智能應(yīng)用(如人工智能深度學(xué)習(xí)模型開(kāi)發(fā)、模型訓(xùn)練和模型推理等場(chǎng)景)提供所需算力、數(shù)據(jù)和算法的設(shè)施。智能計(jì)算中心涵蓋設(shè)施、硬件、軟件,并可提供從底層算力到頂層應(yīng)用使能的全棧能力。
3、“智能計(jì)算中心”包括但不限于“智算中心”。
4、“智算中心”即人工智能計(jì)算中心,是基于人工智能理論,采用人工智能計(jì)算架構(gòu),提供人工智能應(yīng)用所需算力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)的一類(lèi)算力基礎(chǔ)設(shè)施。
5、“算力”是“智能計(jì)算中心”和“智算中心”的核心,是計(jì)算機(jī)設(shè)備或計(jì)算/數(shù)據(jù)中心處理信息的能力,是計(jì)算機(jī)硬件和軟件配合共同執(zhí)行某種計(jì)算需求的能力,是通過(guò)對(duì)信息數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)目標(biāo)結(jié)果輸出的計(jì)算能力,是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新型生產(chǎn)力,主要通過(guò)算力基礎(chǔ)設(shè)施向社會(huì)提供服務(wù)。
6、目前智能計(jì)算中心可以提供數(shù)據(jù)存儲(chǔ)能力,用于存儲(chǔ)租戶服務(wù)的用戶的大模型,大模型小則幾個(gè)g,多則幾百個(gè)g,且大量用戶的大模型都是對(duì)基礎(chǔ)的大模型進(jìn)行微調(diào)后的大模型,微調(diào)后的大模型90%以上的內(nèi)容都是重復(fù)的,全量存儲(chǔ)用戶的大模型會(huì)造成算力資源的存儲(chǔ)和網(wǎng)絡(luò)流量的浪費(fèi),導(dǎo)致經(jīng)濟(jì)成本很高,難以實(shí)現(xiàn)普惠算力的廣泛應(yīng)用。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種面向普惠算力智能計(jì)算中心的大模型分層存儲(chǔ)方法及裝置,用于解決智能計(jì)算中心全量存儲(chǔ)用戶的大模型,造成算力資源存儲(chǔ)和網(wǎng)絡(luò)流量浪費(fèi),導(dǎo)致經(jīng)濟(jì)成本很高,難以實(shí)現(xiàn)普惠算力的廣泛應(yīng)用的問(wèn)題。
2、為了解決上述技術(shù)問(wèn)題,本發(fā)明是這樣實(shí)現(xiàn)的:
3、第一方面,本發(fā)明提供了一種面向普惠算力智能計(jì)算中心的大模型分層存儲(chǔ)方法,包括:
4、步驟s1:響應(yīng)于用戶觸發(fā)的保存大模型的指令,對(duì)所述用戶的大模型進(jìn)行拆解,獲得多個(gè)模型分層;
5、步驟s2:計(jì)算每個(gè)所述模型分層的內(nèi)容的哈希值;
6、步驟s3:檢索索引庫(kù)中是否存在所述模型分層的哈希值對(duì)應(yīng)的索引記錄,若存在,不保存所述模型分層;若不存在,保存所述模型分層,并根據(jù)所述模型分層的哈希值和所述模型分層的存儲(chǔ)路徑生成索引記錄存儲(chǔ)到所述索引庫(kù)中;
7、步驟s4:記錄所述大模型的所有模型分層的索引值。
8、可選的,所述步驟s1包括:
9、步驟s11:若所述大模型為對(duì)基礎(chǔ)模型進(jìn)行微調(diào)后的模型,對(duì)所述用戶的大模型進(jìn)行拆解,獲得兩個(gè)模型分層,所述兩個(gè)模型分層包括:基礎(chǔ)模型參數(shù)層和微調(diào)參數(shù)層;
10、和/或,所述步驟s1包括:
11、步驟s12:基于模型結(jié)構(gòu)對(duì)所述用戶的大模型進(jìn)行拆解,獲得多個(gè)模型分層。
12、可選的,所述步驟s3包括:
13、步驟s32:若所述索引庫(kù)中不存在所述模型分層的哈希值對(duì)應(yīng)的索引記錄,將所述模型分層保存到私有數(shù)據(jù)庫(kù)中,生成所述模型分層的哈希值對(duì)應(yīng)的索引記錄并存儲(chǔ)到所述索引庫(kù)中,所述索引記錄中記錄所述用戶所屬的租戶;
14、和/或,所述步驟s3包括:
15、若所述索引庫(kù)中存在所述模型分層的哈希值對(duì)應(yīng)的索引記錄,判斷所述用戶所屬的租戶是否記錄在所述索引記錄中;
16、步驟s34:如果所述用戶所屬的租戶沒(méi)有記錄在所述索引記錄中,將所述索引記錄中的租戶共享次數(shù)加1,并在所述索引記錄中記錄所述用戶所屬的租戶;判斷所述模型分層是否保存在私有數(shù)據(jù)庫(kù)中,如果所述模型分層保存在私有數(shù)據(jù)庫(kù)中,將所述模型分層移動(dòng)到公共數(shù)據(jù)庫(kù)中;
17、步驟s35:如果所述用戶所屬的租戶已經(jīng)記錄在所述索引記錄中,無(wú)需將所述索引記錄中的租戶共享次數(shù)加1。
18、可選的,所述步驟s3還包括:
19、步驟s36:若所述索引庫(kù)中存在所述模型分層的哈希值對(duì)應(yīng)的索引記錄,將所述索引記錄中記錄的用戶使用次數(shù)加1。
20、可選的,所述方法還包括:
21、步驟s5:根據(jù)存儲(chǔ)的所述模型分層的模型類(lèi)型、租戶共享次數(shù)和/或文件大小,確定每個(gè)租戶的存儲(chǔ)費(fèi)用;
22、其中,針對(duì)多個(gè)租戶共享的所述模型分層,根據(jù)所述模型分層的租戶共享次數(shù),由所述多個(gè)租戶均分所述模型分層的存儲(chǔ)費(fèi)用;或者,針對(duì)多個(gè)租戶共享的所述模型分層,若所述模型分層為基礎(chǔ)模型,對(duì)所述租戶不收取所述基礎(chǔ)模型的存儲(chǔ)費(fèi)用;
23、和/或,針對(duì)所述租戶私有的所述模型分層,根據(jù)所述模型分層的文件大小,計(jì)算所述模型分層的存儲(chǔ)費(fèi)用。
24、可選的,所述步驟s4包括:
25、步驟s41:將所述模型分層的哈希值作為索引值,記錄所述大模型的所有模型分層的索引值。
26、可選的,所述方法還包括:
27、步驟s6:響應(yīng)于用戶觸發(fā)的讀取大模型的指令,獲取所述大模型的所有模型分層的索引值;
28、步驟s7:根據(jù)所述模型分層的索引值,從所述索引庫(kù)中查詢所述模型分層的存儲(chǔ)路徑,并根據(jù)所述存儲(chǔ)路徑讀取所述模型分層;
29、步驟s8:將讀取的所有模型分層進(jìn)行合并得到所述大模型。
30、第二方面,本發(fā)明提供了一種面向普惠算力智能計(jì)算中心的大模型分層存儲(chǔ)裝置,包括:
31、拆解模塊,用于步響應(yīng)于用戶觸發(fā)的保存大模型的指令,對(duì)所述用戶的大模型進(jìn)行拆解,獲得多個(gè)模型分層;
32、哈希值計(jì)算模塊,用于計(jì)算每個(gè)所述模型分層的內(nèi)容的哈希值;
33、存儲(chǔ)模塊,用于檢索索引庫(kù)中是否存在所述模型分層的哈希值對(duì)應(yīng)的索引記錄,若存在,不保存所述模型分層;若不存在,保存所述模型分層,并根據(jù)所述模型分層的哈希值和所述模型分層的存儲(chǔ)路徑生成索引記錄存儲(chǔ)到所述索引庫(kù)中;
34、記錄模塊,用于記錄所述大模型的所有模型分層的索引值。
35、第三方面,本發(fā)明提供了一種算力設(shè)備,包括:處理器、存儲(chǔ)器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序,所述程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的面向普惠算力智能計(jì)算中心的大模型分層存儲(chǔ)方法的步驟。
36、第四方面,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的面向普惠算力智能計(jì)算中心的大模型分層存儲(chǔ)方法的步驟。
37、第五方面,本發(fā)明提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述第一方面所述的面向普惠算力智能計(jì)算中心的大模型分層存儲(chǔ)方法的步驟。
38、本發(fā)明中,當(dāng)用戶需要在智能計(jì)算中心存儲(chǔ)大模型時(shí),對(duì)用戶的大模型進(jìn)行拆解,得到多個(gè)模型分層,計(jì)算各模型分層的內(nèi)容的哈希值,檢索索引庫(kù)中是否存在模型分層的哈希值對(duì)應(yīng)的索引記錄,若存在,說(shuō)明該模型分層的內(nèi)容之前已經(jīng)被存儲(chǔ),則不用重復(fù)存儲(chǔ),若不存在,說(shuō)明該模型分層的內(nèi)容之間沒(méi)有被存儲(chǔ)過(guò),則存儲(chǔ)該模型分層,并根據(jù)述模型分層的哈希值和所述模型分層的存儲(chǔ)路徑生成索引記錄存儲(chǔ)到所述索引庫(kù)中,當(dāng)大模型的模型分層的內(nèi)容之前已經(jīng)被存儲(chǔ)過(guò),則不用重復(fù)存儲(chǔ),即無(wú)需全量存儲(chǔ)大模型,從而可以有效節(jié)省存儲(chǔ)空間,降低算力資源的存儲(chǔ)和網(wǎng)絡(luò)流量浪費(fèi),優(yōu)化智能計(jì)算中心的算力資源,大幅度減少算力資源的浪費(fèi),大幅度降低經(jīng)濟(jì)成本,促進(jìn)實(shí)現(xiàn)普惠算力的廣泛應(yīng)用。