AI底層算法創(chuàng)新的專(zhuān)利撰寫(xiě):如何兼顧權(quán)利要求保護(hù)范圍和客體問(wèn)題?(上)
摘 要
為了貫徹落實(shí)中央十九大報(bào)告中指出的“加快推動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實(shí)體經(jīng)濟(jì)深度融合”,以及習(xí)近平總書(shū)記在中共中央政治局第二十五次集體學(xué)習(xí)時(shí)強(qiáng)調(diào)的“要完善大數(shù)據(jù)、人工智能、基因技術(shù)等新領(lǐng)域新業(yè)態(tài)專(zhuān)利審查標(biāo)準(zhǔn)”等要求,國(guó)家知識(shí)產(chǎn)權(quán)局在2021年8月3號(hào)對(duì)外發(fā)布的《專(zhuān)利審查指南修改草案(征求意見(jiàn)稿)》中,對(duì)于大數(shù)據(jù)、人工智能等領(lǐng)域的發(fā)明的專(zhuān)利客體、創(chuàng)造性判斷等問(wèn)題,進(jìn)一步明確了審查標(biāo)準(zhǔn)。雖然,目前專(zhuān)利審查指南的更新版本還未生效,但知識(shí)產(chǎn)權(quán)從業(yè)人員可從中窺見(jiàn)最新審查政策的導(dǎo)向。因此,基于目前專(zhuān)利審查指南的修訂內(nèi)容,結(jié)合多個(gè)典型案例,文章深入探討了涉及AI算法本身改進(jìn)的案例撰寫(xiě)方法,以期兼顧此類(lèi)專(zhuān)利申請(qǐng)的客體問(wèn)題以及權(quán)利要求保護(hù)范圍問(wèn)題之間的平衡。
關(guān)鍵詞:AI算法專(zhuān)利;基礎(chǔ)層創(chuàng)新;技術(shù)層創(chuàng)新;客體;權(quán)利要求保護(hù)范圍
>>> 一、引 言
近幾年,人工智能技術(shù)的發(fā)展勢(shì)頭迅猛,許多創(chuàng)新主體的創(chuàng)新方向已經(jīng)從原來(lái)的應(yīng)用層創(chuàng)新逐漸過(guò)渡到AI技術(shù)的底層算法本身的創(chuàng)新。各大創(chuàng)新主體對(duì)涉及AI算法類(lèi)發(fā)明專(zhuān)利的保護(hù)需求也越來(lái)越強(qiáng)烈,尤其是對(duì)涉及機(jī)器學(xué)習(xí)的算法本身改進(jìn)的發(fā)明專(zhuān)利申請(qǐng)的保護(hù)需求最為突出。
2020年2月1號(hào)施行的專(zhuān)利審查指南[1],雖在相關(guān)規(guī)定中給出了包含算法特征和方法特征的案件的客體審查基準(zhǔn),但創(chuàng)新主體對(duì)于而今的涉及AI算法本身創(chuàng)新的專(zhuān)利申請(qǐng)的客體審查判斷仍然存在一定的困難。例如,現(xiàn)行的審查指南中僅明確規(guī)定了“對(duì)一項(xiàng)包含算法特征和方法特征的權(quán)利要求是否技術(shù)方案進(jìn)行審查時(shí),需要整體考慮權(quán)利要求中記載的全部特征。如果該項(xiàng)權(quán)利要求記載了對(duì)要解決的技術(shù)問(wèn)題采用了利用自然規(guī)律的技術(shù)手段,并由此獲得符合自然規(guī)律的技術(shù)效果,則該權(quán)利要求限定的解決方案屬于專(zhuān)利法第二條第二款所述的技術(shù)方案。例如,權(quán)利要求中涉及算法的各個(gè)步驟體現(xiàn)出與所要解決的技術(shù)問(wèn)題密切相關(guān),如算法處理的數(shù)據(jù)是技術(shù)領(lǐng)域中具有確切技術(shù)含義的數(shù)據(jù),算法的執(zhí)行直接體現(xiàn)出利用自然規(guī)律解決某一技術(shù)問(wèn)題的過(guò)程,并且獲得了技術(shù)效果,則通過(guò)該權(quán)利要求限定的解決方案屬于A2.2所述的技術(shù)方案[2]”。由此不難看出,現(xiàn)行的審查指南對(duì)于算法類(lèi)專(zhuān)利申請(qǐng)案具有明確的規(guī)定,即算法類(lèi)案件中涉及到的數(shù)據(jù)必須是技術(shù)領(lǐng)域中具有確切技術(shù)含義的數(shù)據(jù),即規(guī)定了算法類(lèi)案件要想通過(guò)客體審查的關(guān)口必須要與技術(shù)領(lǐng)域相結(jié)合,這無(wú)疑限縮了算法類(lèi)案件的保護(hù)范圍。
從各大創(chuàng)新主體的需求來(lái)看,未來(lái)的AI領(lǐng)域創(chuàng)新可能很大程度上傾向于算法本身的創(chuàng)新,例如:數(shù)學(xué)模型、參數(shù)優(yōu)化上的創(chuàng)新,此類(lèi)創(chuàng)新既可應(yīng)用于A領(lǐng)域,也可應(yīng)用于B領(lǐng)域,這在未來(lái)技術(shù)創(chuàng)新的道路上并不排除AI算法成為一種通用的工具,且無(wú)具體領(lǐng)域的限定。正如,現(xiàn)在被大家日常所用的計(jì)算機(jī),在很多年以前也是技術(shù)的,以此類(lèi)比到而今的AI算法專(zhuān)利——雖然技術(shù)性很強(qiáng),但也難保在很多年后可能被人類(lèi)作為通用工具,其并不局限在某一個(gè)領(lǐng)域。考慮到社會(huì)創(chuàng)新未來(lái)的發(fā)展,并且基于各大創(chuàng)新主體涉及AI算法專(zhuān)利的創(chuàng)新保護(hù)需求,國(guó)家知識(shí)產(chǎn)權(quán)局圍繞人工智能和大數(shù)據(jù)領(lǐng)域也在嘗試補(bǔ)充現(xiàn)有規(guī)定未涉及的客體審查基準(zhǔn),以期和公眾一起探討未結(jié)合具體技術(shù)領(lǐng)域的人工智能算法改進(jìn)方案如何構(gòu)成專(zhuān)利保護(hù)的客體,從而嘗試給涉及AI算法本身改進(jìn)的案件一條通過(guò)客體審查的出路,與此同時(shí),也兼顧了此類(lèi)案件的保護(hù)范圍。
基于該初衷,國(guó)家知識(shí)產(chǎn)權(quán)局2021年8月3日公布的《專(zhuān)利審查指南修改草案(征求意見(jiàn)稿)》中,于第二部分第九章6.1.2節(jié)補(bǔ)充了有關(guān)人工智能算法的改進(jìn)方案的審查基準(zhǔn),具體為“如果權(quán)利要求的解決方案涉及深度學(xué)習(xí)、分類(lèi)聚類(lèi)等人工智能、大數(shù)據(jù)算法的改進(jìn),該算法與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)存在特定技術(shù)關(guān)聯(lián),能夠解決如何提升硬件運(yùn)算效率或執(zhí)行效果的技術(shù)問(wèn)題,包括減少數(shù)據(jù)存儲(chǔ)量、減少數(shù)據(jù)傳輸量、提高硬件處理速度等,從而獲得符合自然規(guī)律的計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果,則該權(quán)利要求限定的解決方案屬于專(zhuān)利法第二條第二款所述的技術(shù)方案”。
上述內(nèi)容實(shí)際上釋放出了三層審查基準(zhǔn):
(1)審查權(quán)利要求中的解決方案是否涉及深度學(xué)習(xí)、分類(lèi)聚類(lèi)等人工智能、大數(shù)據(jù)的算法
(2)審查該算法是否與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)有特定技術(shù)關(guān)聯(lián)
(3)審查該算法所帶來(lái)的技術(shù)效果是否能夠帶來(lái)計(jì)算機(jī)內(nèi)部性能的改進(jìn)
若以上三層審查基準(zhǔn)都滿足,則權(quán)利要求中的解決方案即使沒(méi)有明確規(guī)定應(yīng)用領(lǐng)域,也符合A2.2規(guī)定的技術(shù)方案。
故而,基于對(duì)本次征求意見(jiàn)稿中審查指南補(bǔ)充的新的審查基準(zhǔn)的理解,筆者同步結(jié)合以下幾個(gè)典型案例,詳細(xì)為大家剖析國(guó)家知識(shí)產(chǎn)權(quán)局對(duì)于AI算法類(lèi)案件的審查方向的變化。
>>> 二、以下專(zhuān)利申請(qǐng)案為何能順利通過(guò)A2.2的客體審查?
首先,我們需明確AI算法類(lèi)案件的創(chuàng)新包括哪些類(lèi)型;談及此處,則需了解AI技術(shù)的技術(shù)架構(gòu)。
AI技術(shù)架構(gòu)從上到下,分為AI應(yīng)用層和AI底層算法,而AI底層算法包括AI基礎(chǔ)層算法和AI的技術(shù)層算法。這三個(gè)層在各大創(chuàng)新主體的研發(fā)過(guò)程中經(jīng)常會(huì)涉及到創(chuàng)新的技術(shù)點(diǎn)。
何為AI“應(yīng)用層”創(chuàng)新?
此類(lèi)創(chuàng)新是AI技術(shù)與各種應(yīng)用場(chǎng)景的結(jié)合。
AI應(yīng)用層是人工智能產(chǎn)業(yè)的延伸,集成一類(lèi)或多類(lèi)人工智能基礎(chǔ)應(yīng)用技術(shù),面向特定應(yīng)用場(chǎng)景需求而形成軟硬件產(chǎn)品或解決方案。
例如,我們經(jīng)??吹降闹悄荞{駛、智能金融、智能醫(yī)療或者機(jī)器人等,都是常見(jiàn)的AI技術(shù)在應(yīng)用場(chǎng)景上的創(chuàng)新。
何為AI“底層算法”創(chuàng)新?
實(shí)際上此類(lèi)創(chuàng)新包含AI基礎(chǔ)層的創(chuàng)新以及AI技術(shù)層的創(chuàng)新。
AI基礎(chǔ)層主要包含基礎(chǔ)硬件設(shè)施、算力平臺(tái)、數(shù)據(jù)資源等,其聚焦的是計(jì)算能力和數(shù)據(jù)資源,為人工智能提供數(shù)據(jù)及算力支撐;
AI技術(shù)層聚焦在算法和模型上,主要包括操作系統(tǒng)、模型框架以及神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、遺傳算法等模型構(gòu)建或者模型訓(xùn)練算法的創(chuàng)新。
針對(duì)AI底層算法類(lèi)創(chuàng)新的案件,實(shí)際上無(wú)論是基礎(chǔ)層的創(chuàng)新還是技術(shù)層的創(chuàng)新,過(guò)去幾年中行業(yè)內(nèi)處理此類(lèi)案件常見(jiàn)的做法是將其算法創(chuàng)新與具體的技術(shù)領(lǐng)域相結(jié)合,以滿足客體審查基準(zhǔn);但隨著中央十九大報(bào)告的出臺(tái)以及針對(duì)AI案件國(guó)家知識(shí)產(chǎn)權(quán)局一系列利好的修訂內(nèi)容,部分企業(yè)做了新的撰寫(xiě)嘗試,并且取得了較好的結(jié)果。
接下來(lái),筆者詳細(xì)將分析此類(lèi)案例,其中,案例一至案例三涉及的是AI技術(shù)層的創(chuàng)新專(zhuān)利,案例四和案例五涉及的是AI基礎(chǔ)層的創(chuàng)新專(zhuān)利。
案例一
背景技術(shù):
自訓(xùn)練方法是一種利用神經(jīng)網(wǎng)絡(luò)模型自身的學(xué)習(xí)結(jié)果對(duì)模型進(jìn)行迭代訓(xùn)練的方法。傳統(tǒng)的自訓(xùn)練方法通常需要對(duì)樣本數(shù)據(jù)D進(jìn)行數(shù)據(jù)增廣,得到數(shù)據(jù)D';使用神經(jīng)網(wǎng)絡(luò)模型對(duì)數(shù)據(jù)D'進(jìn)行預(yù)測(cè),得到數(shù)據(jù)D'中各數(shù)據(jù)的輸出結(jié)果;合并數(shù)據(jù)D與數(shù)據(jù)D',繼續(xù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。直到達(dá)到終止條件。對(duì)于傳統(tǒng)的自訓(xùn)練方法來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)模型的每一次訓(xùn)練,均需要執(zhí)行數(shù)據(jù)增廣與使用神經(jīng)網(wǎng)絡(luò)模型對(duì)增廣數(shù)據(jù)進(jìn)行預(yù)測(cè)的步驟,因此神經(jīng)網(wǎng)絡(luò)模型在進(jìn)行自訓(xùn)練時(shí)所需的時(shí)間成本較高,步驟較為繁瑣。
權(quán)利要求1 如下:
1.一種自訓(xùn)練方法,包括:
獲取訓(xùn)練數(shù)據(jù),所述訓(xùn)練數(shù)據(jù)中包含多個(gè)訓(xùn)練樣本與各訓(xùn)練樣本對(duì)應(yīng)的標(biāo)簽;
使用訓(xùn)練數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)設(shè)次數(shù)的訓(xùn)練,并將各次訓(xùn)練過(guò)程中使用的訓(xùn)練樣本及其對(duì)應(yīng)的輸出結(jié)果作為緩存數(shù)據(jù),記錄到緩存中;
在訓(xùn)練次數(shù)超過(guò)預(yù)設(shè)次數(shù)之后,使用訓(xùn)練數(shù)據(jù)與緩存中的緩存數(shù)據(jù)對(duì)所述神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,并將各次訓(xùn)練過(guò)程中使用的訓(xùn)練樣本及其對(duì)應(yīng)的輸出結(jié)果作為緩存數(shù)據(jù),記錄到緩存中;
在確定所述神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練達(dá)到終止條件的情況下,完成所述神經(jīng)網(wǎng)絡(luò)模型的自訓(xùn)練;
其中,所述將各次訓(xùn)練過(guò)程中使用的訓(xùn)練樣本及其對(duì)應(yīng)的輸出結(jié)果作為緩存數(shù)據(jù),記錄到緩存中包括:
針對(duì)緩存數(shù)據(jù)中的同一個(gè)訓(xùn)練樣本,使用本次訓(xùn)練過(guò)程中得到的輸出結(jié)果替換前次訓(xùn)練過(guò)程中得到的輸出結(jié)果。
【案例一】分析如下:
獨(dú)立權(quán)利要求中的解決方案主要是通過(guò)采用創(chuàng)建緩存,將神經(jīng)網(wǎng)絡(luò)模型在各次訓(xùn)練過(guò)程中使用的訓(xùn)練樣本及其對(duì)應(yīng)的輸出結(jié)果作為緩存數(shù)據(jù)進(jìn)行記錄的技術(shù)手段,克服現(xiàn)有技術(shù)中在每次訓(xùn)練過(guò)程中需要對(duì)數(shù)據(jù)進(jìn)行增廣以及對(duì)增廣數(shù)據(jù)進(jìn)行預(yù)測(cè)所導(dǎo)致的時(shí)間成本較高、步驟較為繁瑣的技術(shù)問(wèn)題,實(shí)現(xiàn)了減少對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行自訓(xùn)練時(shí)需要的時(shí)間成本,提升了對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行自訓(xùn)練的效率的技術(shù)效果。該方案涉及神經(jīng)網(wǎng)絡(luò)模型,雖然對(duì)涉及到的訓(xùn)練數(shù)據(jù)并沒(méi)有具體的應(yīng)用領(lǐng)域的限定,但是訓(xùn)練過(guò)程中涉及到創(chuàng)建緩存并記錄數(shù)據(jù),該過(guò)程與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)果存在特定的技術(shù)關(guān)聯(lián),且整體的訓(xùn)練過(guò)程降低了計(jì)算機(jī)在訓(xùn)練模型時(shí)的自訓(xùn)練時(shí)間成本,從而達(dá)到提升神經(jīng)網(wǎng)絡(luò)模型的自訓(xùn)練效率這一符合自然規(guī)律的涉及計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果。
故而,此案在審查過(guò)程中通過(guò)了客體的審查關(guān)口,并且最終得到授權(quán)。
案例二
背景技術(shù):
當(dāng)固定采用某一種模型訓(xùn)練方案,會(huì)使得處理器的資源不能很好的被調(diào)用,從而使得計(jì)算機(jī)的運(yùn)行效率比較低。
權(quán)利要求1 如下:
1.一種訓(xùn)練方法,包括:
當(dāng)訓(xùn)練數(shù)據(jù)的大小發(fā)生改變時(shí),針對(duì)改變后的訓(xùn)練數(shù)據(jù),分別計(jì)算所述改變后的訓(xùn)練數(shù)據(jù)在預(yù)設(shè)的至少兩個(gè)候選訓(xùn)練方案中的訓(xùn)練耗時(shí);
從預(yù)設(shè)的至少兩個(gè)候選訓(xùn)練方案中選取訓(xùn)練耗時(shí)最小的訓(xùn)練方案作為所述改變后的訓(xùn)練數(shù)據(jù)的最佳訓(xùn)練方案;所述至少兩個(gè)候選訓(xùn)練方案包括至少一個(gè)單處理器方案,至少一個(gè)基于數(shù)據(jù)并行的多處理器方案;
將所述改變后的訓(xùn)練數(shù)據(jù)在所述最佳訓(xùn)練方案中進(jìn)行模型訓(xùn)練。
【案例二】分析如下:
獨(dú)立權(quán)利要求中的解決方案主要是在訓(xùn)練數(shù)據(jù)大小發(fā)生變化時(shí),通過(guò)計(jì)算采用變化后的訓(xùn)練數(shù)據(jù)在至少兩個(gè)訓(xùn)練方案中的訓(xùn)練耗時(shí)來(lái)選擇最佳訓(xùn)練方案,并將改變后的訓(xùn)練數(shù)據(jù)在最佳訓(xùn)練方案中進(jìn)行模型訓(xùn)練,其中,最佳訓(xùn)練方案包括單處理器方案以及多處理器方案。整個(gè)步驟整體上是圍繞當(dāng)數(shù)據(jù)發(fā)生變化,如何對(duì)單、多處理器方案進(jìn)行更好的調(diào)度,使得計(jì)算機(jī)的運(yùn)行效率更高。該方案涉及到模型訓(xùn)練,雖然對(duì)涉及到的訓(xùn)練數(shù)據(jù)并沒(méi)有具體的應(yīng)用領(lǐng)域的限定,但是訓(xùn)練過(guò)程中涉及到根據(jù)訓(xùn)練耗時(shí)控制對(duì)單處理器訓(xùn)練方案、多處理器訓(xùn)練方案進(jìn)行更好的調(diào)度,該過(guò)程與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)存在特定的技術(shù)關(guān)聯(lián),且整體的訓(xùn)練過(guò)程降低了計(jì)算機(jī)在訓(xùn)練模型時(shí)的耗時(shí),從而達(dá)到提升計(jì)算機(jī)的運(yùn)行效率這一符合自然規(guī)律的涉及計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果。
故而,此案在審查過(guò)程中通過(guò)了客體的審查關(guān)口,并且最終得到授權(quán)。
案例三
背景技術(shù):
在實(shí)際應(yīng)用中,經(jīng)常需要檢測(cè)業(yè)務(wù)數(shù)據(jù)是否為異常數(shù)據(jù)。為此可以訓(xùn)練模型,進(jìn)而可以通過(guò)訓(xùn)練的模型檢測(cè)業(yè)務(wù)數(shù)據(jù)是否為異常數(shù)據(jù)。因此,如何提高模型的訓(xùn)練效果是當(dāng)前亟需解決的技術(shù)問(wèn)題。
權(quán)利要求1 如下:
1.一種模型訓(xùn)練方法,包括:
獲取訓(xùn)練樣本集,所述訓(xùn)練樣本集包括無(wú)標(biāo)簽樣本集和有標(biāo)簽樣本集,所述無(wú)標(biāo)簽樣本集包括多個(gè)第一樣本,所述有標(biāo)簽樣本集包括多個(gè)第二樣本和類(lèi)型標(biāo)簽,所述類(lèi)型標(biāo)簽用于表示所述有標(biāo)簽樣本集中是否包含異常的第二樣本;
根據(jù)所述無(wú)標(biāo)簽樣本集,對(duì)第一模型進(jìn)行訓(xùn)練,所述第一模型包括特征提取子模型;
根據(jù)所述有標(biāo)簽樣本集和特征提取子模型的訓(xùn)練結(jié)果,對(duì)第二模型進(jìn)行訓(xùn)練,所述第二模型包括特征提取子模型和異常數(shù)據(jù)檢測(cè)子模型,所述異常數(shù)據(jù)檢測(cè)子模型用于根據(jù)特征提取子模型的輸出檢測(cè)異常數(shù)據(jù)。
【案例三】分析如下:
獨(dú)立權(quán)利要求的解決方案主要是通過(guò)無(wú)標(biāo)簽樣本集對(duì)第一模型進(jìn)行訓(xùn)練,可以實(shí)現(xiàn)對(duì)第二模型的部分模型參數(shù)進(jìn)行無(wú)監(jiān)督的預(yù)訓(xùn)練,進(jìn)而通過(guò)有標(biāo)簽樣本集實(shí)現(xiàn)對(duì)第二模型的模型參數(shù)進(jìn)行有監(jiān)督的再次訓(xùn)練。這樣便于利用大量的無(wú)標(biāo)簽樣本,并結(jié)合相對(duì)少量的有標(biāo)簽樣本,實(shí)現(xiàn)對(duì)第二模型的模型參數(shù)進(jìn)行訓(xùn)練,有利于提高第二模型的訓(xùn)練效果。整個(gè)解決方案中涉及模型訓(xùn)練上的改進(jìn),屬于涉及人工智能領(lǐng)域的算法改進(jìn),雖然對(duì)涉及到的無(wú)標(biāo)簽樣本和有標(biāo)簽樣本以及模型并沒(méi)有具體技術(shù)領(lǐng)域的限定,但是從實(shí)質(zhì)分析來(lái)看其通過(guò)這樣的訓(xùn)練方式的改進(jìn),提高了計(jì)算機(jī)訓(xùn)練第二模型的訓(xùn)練效果,能夠解決計(jì)算機(jī)提升執(zhí)行效果的技術(shù)問(wèn)題,從而使得計(jì)算機(jī)系統(tǒng)內(nèi)部性能得到了改進(jìn)。
故而,此案在審查過(guò)程中通過(guò)了客體的審查關(guān)口,并且最終得到授權(quán)。
案例四
背景技術(shù):
目前在機(jī)器學(xué)習(xí)的過(guò)程中,對(duì)訓(xùn)練樣本數(shù)據(jù)的需求量巨大,并且需要對(duì)大量的訓(xùn)練樣本數(shù)據(jù)進(jìn)行標(biāo)注,傳統(tǒng)技術(shù)中通常需要人工對(duì)大量的訓(xùn)練樣本數(shù)據(jù)進(jìn)行標(biāo)注,使得標(biāo)注工作過(guò)分依賴(lài)于人,并且工作量巨大,標(biāo)注的效率較低。
公開(kāi)版本的權(quán)利要求1 如下:
1.一種數(shù)據(jù)標(biāo)注的方法,其特征在于,所述方法包括:
通過(guò)預(yù)先訓(xùn)練的目標(biāo)標(biāo)注模型對(duì)多個(gè)待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注,得到由所述待標(biāo)注數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果構(gòu)成的目標(biāo)集合;
利用預(yù)先訓(xùn)練的目標(biāo)分類(lèi)器選取所述待標(biāo)注數(shù)據(jù)中的非可信數(shù)據(jù),以驗(yàn)證所述非可信數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果;
更正所述目標(biāo)集合中未通過(guò)驗(yàn)證的非可信數(shù)據(jù)所對(duì)應(yīng)的標(biāo)注結(jié)果。
授權(quán)版本的權(quán)利要求1 如下:
1.一種數(shù)據(jù)標(biāo)注的方法,其特征在于,所述方法包括:
通過(guò)預(yù)先訓(xùn)練的目標(biāo)標(biāo)注模型對(duì)多個(gè)待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注,得到由所述待標(biāo)注數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果構(gòu)成的目標(biāo)集合;
利用預(yù)先訓(xùn)練的目標(biāo)分類(lèi)器選取所述待標(biāo)注數(shù)據(jù)中的非可信數(shù)據(jù),以驗(yàn)證所述非可信數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果;
更正所述目標(biāo)集合中未通過(guò)驗(yàn)證的非可信數(shù)據(jù)所對(duì)應(yīng)的標(biāo)注結(jié)果,并將經(jīng)過(guò)更正的目標(biāo)集合存放入預(yù)先建立的標(biāo)注數(shù)據(jù)庫(kù)中,利用所述標(biāo)注數(shù)據(jù)庫(kù)對(duì)所述目標(biāo)標(biāo)注模型進(jìn)行更新;
其中,所述待標(biāo)注數(shù)據(jù)用于作為機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù),所述標(biāo)注結(jié)果用于作為機(jī)器學(xué)習(xí)的所述訓(xùn)練樣本數(shù)據(jù)的標(biāo)注。
【案例四】分析如下:
案例四的解決方案主要是通過(guò)訓(xùn)練好的目標(biāo)標(biāo)注模型對(duì)多個(gè)待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注后,又利用目標(biāo)分類(lèi)器篩選出更有可能標(biāo)注錯(cuò)誤的待標(biāo)注數(shù)據(jù)進(jìn)行抽檢,并對(duì)錯(cuò)誤的標(biāo)注結(jié)果進(jìn)行更正。從而使得標(biāo)注工作無(wú)需完全依賴(lài)于人,節(jié)省了大量的人力資源,提高了標(biāo)注的效率。同時(shí),能夠更有針對(duì)性的驗(yàn)證被標(biāo)注數(shù)據(jù)的結(jié)果,提高了標(biāo)注的準(zhǔn)確度。
此案在審查過(guò)程中經(jīng)歷了三次審查意見(jiàn),其中一通的審查意見(jiàn)中明確指出了公開(kāi)版本的獨(dú)立權(quán)利要求不符合A2.2的規(guī)定,后面的二通和三通指出的是有關(guān)新穎性和創(chuàng)造性的問(wèn)題?;谠摰谝淮螌彶橐庖?jiàn)通知書(shū)的意見(jiàn),筆者找到了如上的授權(quán)版本,授權(quán)版本獨(dú)立權(quán)利要求中增加了“并將經(jīng)過(guò)更正的目標(biāo)集合存放入預(yù)先建立的標(biāo)注數(shù)據(jù)庫(kù)中,利用所述標(biāo)注數(shù)據(jù)庫(kù)對(duì)所述目標(biāo)標(biāo)注模型進(jìn)行更新;其中,所述待標(biāo)注數(shù)據(jù)用于作為機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù),所述標(biāo)注結(jié)果用于作為機(jī)器學(xué)習(xí)的所述訓(xùn)練樣本數(shù)據(jù)的標(biāo)注”。
結(jié)合授權(quán)后的版本,筆者分析國(guó)家知識(shí)產(chǎn)權(quán)局的審查思路大致如下,授權(quán)后獨(dú)立權(quán)利要求的解決方案中明確了“所述待標(biāo)注數(shù)據(jù)用于作為機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù),所述標(biāo)注結(jié)果用于作為機(jī)器學(xué)習(xí)的所述訓(xùn)練樣本數(shù)據(jù)的標(biāo)注”,該特征主要明確了獨(dú)立權(quán)利要求的解決方案涉及機(jī)器學(xué)習(xí)領(lǐng)域,雖然其對(duì)涉及到的待標(biāo)注數(shù)據(jù)或者訓(xùn)練樣本數(shù)據(jù)并沒(méi)有具體的應(yīng)用領(lǐng)域的限定,但是從“并將經(jīng)過(guò)更正的目標(biāo)集合存放入預(yù)先建立的標(biāo)注數(shù)據(jù)庫(kù)中,利用所述標(biāo)注數(shù)據(jù)庫(kù)對(duì)所述目標(biāo)標(biāo)注模型進(jìn)行更新”這一特征上明確了預(yù)先建立了標(biāo)注數(shù)據(jù)庫(kù),并調(diào)用標(biāo)注數(shù)據(jù)庫(kù)對(duì)模型進(jìn)行更新,而這一過(guò)程必然與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)存在特定的技術(shù)關(guān)聯(lián),且利用更新后的目標(biāo)標(biāo)注模型對(duì)數(shù)據(jù)進(jìn)行標(biāo)注的過(guò)程,達(dá)到了提升計(jì)算機(jī)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注的效率這一符合自然規(guī)律的涉及計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果,故此案在審查過(guò)程中通過(guò)了客體的審查關(guān)口,并且最終得到授權(quán)。
案例五
背景技術(shù):
數(shù)據(jù)清洗是指發(fā)現(xiàn)并糾正數(shù)據(jù)中的錯(cuò)誤的一道程序,其任務(wù)是過(guò)濾掉不符合要求的數(shù)據(jù)。一般來(lái)說(shuō),數(shù)據(jù)清理是對(duì)清洗前的數(shù)據(jù)進(jìn)行精簡(jiǎn)以得到清洗后的數(shù)據(jù)的過(guò)程?,F(xiàn)有的數(shù)據(jù)清洗通常需要數(shù)據(jù)清洗人員手工實(shí)現(xiàn),通過(guò)人工檢查,逐個(gè)驗(yàn)證數(shù)據(jù)。
權(quán)利要求1 如下:
獲取待清洗的訓(xùn)練樣本集合;
基于所述訓(xùn)練樣本集合,對(duì)初始模型進(jìn)行有監(jiān)督訓(xùn)練得到包括特征提取層的模型;
采用所述特征提取層提取所述訓(xùn)練樣本集合中的訓(xùn)練樣本的特征數(shù)據(jù);
對(duì)所得到的特征數(shù)據(jù)進(jìn)行聚類(lèi)處理,以確定所述訓(xùn)練樣本集合中孤立的訓(xùn)練樣本;
基于所確定出的孤立的訓(xùn)練樣本,對(duì)所述訓(xùn)練樣本集合進(jìn)行清洗,得到清洗后的訓(xùn)練樣本集合,以及利用所述清洗后的訓(xùn)練樣本集合重新對(duì)所述初始模型進(jìn)行有監(jiān)督訓(xùn)練。
【案例五】分析如下:
獨(dú)立權(quán)利要求的解決方案主要是通過(guò)采用訓(xùn)練得到的特征提取層提取訓(xùn)練樣本的特征數(shù)據(jù)并進(jìn)行聚類(lèi)處理以得到孤立訓(xùn)練樣本,并采用該孤立的樣本對(duì)訓(xùn)練樣本集合進(jìn)行清洗,得到清洗后的訓(xùn)練樣本集合,進(jìn)而無(wú)需人工清洗,豐富了數(shù)據(jù)清洗的方式,提高數(shù)據(jù)清洗的效率和準(zhǔn)確性,進(jìn)而提高了模型訓(xùn)練的準(zhǔn)確性和效率。該方案涉及到有監(jiān)督訓(xùn)練、聚類(lèi)處理等人工智能算法,雖然對(duì)涉及到的訓(xùn)練樣本并沒(méi)有具體的應(yīng)用領(lǐng)域的限定,但是基于孤立的訓(xùn)練樣本對(duì)原來(lái)的訓(xùn)練樣本集合進(jìn)行清洗,該清洗過(guò)程與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)存在特定的技術(shù)關(guān)聯(lián),且整體的清洗過(guò)程降低了人工清洗的成本,節(jié)約了數(shù)據(jù)清洗的耗時(shí),達(dá)到了提高計(jì)算機(jī)清洗數(shù)據(jù)的效率和準(zhǔn)確性,使得計(jì)算機(jī)進(jìn)行模型訓(xùn)練的效果得到提升,提升了計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果,故此案在審查過(guò)程中通過(guò)了客體的審查關(guān)口,并且最終得到授權(quán)。
結(jié)合以上案例,讀者應(yīng)該可以清晰地看到國(guó)家知識(shí)產(chǎn)權(quán)局對(duì)AI算法類(lèi)案件進(jìn)行客體審查的過(guò)程中,已經(jīng)逐漸的在放松客體審查的關(guān)口,并已逐步在利用《專(zhuān)利審查指南修改草案(征求意見(jiàn)稿)》中所補(bǔ)充的有關(guān)人工智能算法的改進(jìn)方案的審查基準(zhǔn),這對(duì)于眾多的創(chuàng)新主體在AI算法上的創(chuàng)新無(wú)疑是非常利好的導(dǎo)向。