
下列服務條款適用于招標采購網(wǎng)會員,若您使用中國招標采購網(wǎng)提供的服務,您必須同意接受此服務條款。
一、服務條款的確認和接納
本服務條款適用于中國招標采購網(wǎng)用戶,您在申請注冊流程中點擊同意本服務條款之前,應當認真閱讀本服務條款。請您務必審慎閱讀、充分理解各條款內(nèi)容,當您按照注冊頁面提示填寫信息、閱讀并同意本服務條款且完成全部注冊程序后,即表示您已充分閱讀、理解并接受本服務條款的全部內(nèi)容,并與中國招標采購網(wǎng)達成一致,成為中國招標采購網(wǎng)平臺用戶。閱讀本服務條款的過程中,如果您不同意本服務條款或其中任何條款約定,您應立即停止注冊程序。中國招標采購網(wǎng)服務的所有權和運作權歸北京中采高科招標集團有限公司所有。所提供的服務必須按照其發(fā)布的公司章程,服務條款和操作規(guī)則嚴格執(zhí)行。用戶通過完成注冊程序并點擊“我已經(jīng)閱讀并接受《中國招標采購網(wǎng)服務條款》中的各項內(nèi)容”,這表示用戶與北京中采高科招標集團有限公司達成協(xié)議并接受所有的服務條款。
二、服務簡介
北京中采高科招標集團有限公司運用自己的操作系統(tǒng)通過國際互聯(lián)網(wǎng)絡為用戶提供各項服務,用戶(包括普通個人用戶,免費企業(yè)會員,收費企業(yè)會員)注冊時,必須同意:
1. 提供真實、準確、即時、完整的個人/企業(yè)資料。同時,應根據(jù)情況變化維護并及時更新注冊信息,以確保其真實、準確、即時、完整性。
2、一旦北京中采高科招標集團有限公司發(fā)現(xiàn)用戶資料含有不準確甚至是虛假內(nèi)容,北京中采高科招標集團有限公司有權利中止對該用戶的服務。
三、用戶的帳號、密碼和安全性
1、中國招標采購網(wǎng)的注冊帳號可以是英文、數(shù)字、字母、中文,或者是它們的組合。用戶可以根據(jù)自己的需要進行選擇,但是用戶注冊的帳號或者填寫的昵稱需要符合下列規(guī)定:
(1)不得使用黨和國家機構的名稱或者是它們的縮寫。
(2)不得使用黨和國家領導人或者其他知名人士的真實姓名、筆名、藝名或者是他們的縮寫。
(3)不得使用不健康、不文明或者帶有侮辱性、攻擊性的用戶名和昵稱。
(4)您一旦注冊成功,就成為北京中采高科招標集團有限公司的合法用戶,您將得到一個密碼和用戶名。并同意接受北京中采高科招標集團有限公司提供的各項服務。如果您未保管好自己的用戶名和密碼,而對您、北京中采高科招標集團有限公司或第三方造成的損害,您將負全部責任。另外,每個用戶都要對其用戶名中的所有活動和事件負全責。您可隨時改變您的密碼和圖標,也可以結束舊的用戶名重開一個新用戶名。
(5)為避免用戶的合法權利受到侵害,用戶若發(fā)現(xiàn)任何非法使用用戶名或存在安全漏洞的情況,請立即通告北京中采高科招標集團有限公司。
四、服務條款的修改及修訂
北京中采高科招標集團有限公司有權在必要時修改服務條款,北京中采高科招標集團有限公司服務條款一旦發(fā)生變動,公司將會在用戶進入下一步使用前的頁面提示修改內(nèi)容。如果您同意改動,則再一次激活“同意服務條款提交注冊信息”按鈕,視為接受本服務條款的變動。如果用戶不接受。北京中采高科招標集團有限公司則保留隨時修改或中斷服務而不需通知用戶的權利。用戶接受北京中采高科招標集團有限公司行使修改或中斷服務的權利,北京中采高科招標集團有限公司不需對用戶或第三方負責。本服務條款任一條款被視為廢止、無效或不可執(zhí)行,該條應視為可分的且并不影響本服務條款其余條款的有效性及可執(zhí)行性。
五、用戶隱私制度
北京中采高科招標集團有限公司(中國招標采購網(wǎng))非常重視用戶信息的保護,在使用中國招標采購網(wǎng)的所有產(chǎn)品和服務前,請您務必仔細閱讀并透徹理解本聲明。一旦您選擇使用,即表示您已經(jīng)同意我們按照本隱私聲明來使用和披露您的個人信息,并接受本條款現(xiàn)有內(nèi)容及其可能隨時更新的內(nèi)容。
1、本注冊條款所涉及的隱私是指:在會員注冊中國招標采購網(wǎng)網(wǎng)站帳戶時,使用其它中國招標采購網(wǎng)網(wǎng)站產(chǎn)品或服務,訪問中國招標采購網(wǎng)網(wǎng)頁,或參加任何形式的會員活動、培訓活動時,中國招標采購網(wǎng)會收集的會員的個人身份識別資料,包括會員的姓名、昵稱、電郵地址、出生日期、性別、職業(yè)、所在行業(yè)、工齡,真實頭像,籍貫,公司名稱,QQ號碼,公司地址,公司的產(chǎn)品以及服務簡介,公司固話傳真,公司主頁,公司主要做的項目等。中國招標采購網(wǎng)網(wǎng)站自動接收并記錄會員的瀏覽器和服務器日志上的信息,包括但不限于會員的IP地址、在線、無線信息、信件等資料。
2、中國招標采購網(wǎng)收集上述信息將用于:提供網(wǎng)站服務、改進網(wǎng)頁內(nèi)容,滿足會員對某種產(chǎn)品、活動的需求、通知會員最新產(chǎn)品、活動信息、或根據(jù)法律法規(guī)要求的用途、給會員帶來更多商業(yè)機會等。
3、我們網(wǎng)站有相應的安全措施來確保我們掌握的信息不丟失,不被濫用和變造。這些安全措施包括向其它服務器備份數(shù)據(jù)和對用戶密碼加密。盡管我們有這些安全措施,但請注意在因特網(wǎng)上不存在“完善的安全措施”。
4、中國招標采購網(wǎng)可能利用工具,為合作伙伴的網(wǎng)站進行數(shù)據(jù)搜集工作,有關數(shù)據(jù)也會作統(tǒng)計用途。網(wǎng)站會將所記錄的中國招標采購網(wǎng)會員數(shù)據(jù)整合起來,以綜合數(shù)據(jù)形式供合作伙伴參考。綜合數(shù)據(jù)會包括人數(shù)統(tǒng)計和使用情況等資料,但不會包含任何可以識別個人身份的數(shù)據(jù)。
5、信息的披露和使用:們不會向任何無關第三方提供,出售,出租,分享和交易用戶的個人信息,但為方便您使用中國招標采購網(wǎng)服務及中國招標采購網(wǎng)關聯(lián)公司或其他組織的服務(以下稱其他服務),您同意并授權中國招標采購網(wǎng)將您的個人信息傳遞給您同時接受其他服務的中國招標采購網(wǎng)關聯(lián)公司或其他組織,或從為您提供其他服務的中國招標采購網(wǎng)關聯(lián)公司或其他組織獲取您的個人信息。包括但不限于:您同意我們可批露或使用您的個人信息以用于識別和(或)確認您的身份,或解決爭議,或有助于確保網(wǎng)站安全、限制欺詐、非法或其他刑事犯罪活動,以執(zhí)行我們的服務協(xié)議。您同意我們可批露或使用您的個人信息以保護您的生命、財產(chǎn)之安全或為防止嚴重侵害他人之合法權益或為公共利益之需要。您同意我們可批露或使用您的個人信息以改進我們的服務,并使我們的服務更能符合您的要求,從而使您在使用我們服務時得到更好的使用體驗。您同意我們利用您的個人信息與您聯(lián)絡,并向您提供您感興趣的信息,如:產(chǎn)品信息。您接受“服務協(xié)議”和本隱私聲明即為明示同意收取這些資料。您同意,您的個人信息可以被搜索引擎搜索,并在搜索結果中顯示,由此給您帶來更多的合作機會。您同意并授權中國招標采購網(wǎng)將您的個人信息傳遞給中國招標采購網(wǎng),中國招標采購網(wǎng)關聯(lián)公司、中國招標采購網(wǎng)合作伙伴、中國招標采購網(wǎng)會員,以助于中國招標采購網(wǎng)給您帶來更多的商業(yè)機會、其他服務、合作伙伴等。法律規(guī)定的其他需披露您個人信息的情況。
6、關于會員在中國招標采購網(wǎng)的上傳或張貼的內(nèi)容
(1)會員在中國招標采購網(wǎng)上傳或張貼的內(nèi)容(包括照片、文字、附件、帖子、招投標信息、個人合作名片、公司名錄和黃頁、工程信息等),視為會員授予中國招標采購網(wǎng)免費、非獨家的使用權,中國招標采購網(wǎng)有權為展示、傳播及推廣、促使合作等前述張貼內(nèi)容的目的,對上述內(nèi)容進行復制、修改、出版等。該使用權持續(xù)至會員書面通知中國招標采購網(wǎng)不得繼續(xù)使用,且中國招標采購網(wǎng)實際收到該等書面通知時止。中國招標采購網(wǎng)網(wǎng)站、中國招標采購網(wǎng)合作伙伴、中國招標采購網(wǎng)關聯(lián)公司均可使用。
(2)因會員進行上述上傳或張貼,而導致任何第三方提出侵權或索賠要求的,會員承擔全部責任。
(3)任何第三方對于會員在中國招標采購網(wǎng)的公開使用區(qū)域張貼的內(nèi)容進行復制、修改、編輯、傳播等行為的,該行為產(chǎn)生的法律后果和責任均由行為人承擔,與中國招標采購網(wǎng)無關。
7、不可抗力
(1)“不可抗力”是指中國招標采購網(wǎng)不能合理控制、不可預見或即使預見亦無法避免的事件,該事件妨礙、影響或延誤中國招標采購網(wǎng)根據(jù)本注冊條款履行其全部或部分義務。該事件包括但不限于政府行為、自然災害、戰(zhàn)爭、黑客襲擊、電腦病毒、網(wǎng)絡故障等。不可抗力可能導致中國招標采購網(wǎng)網(wǎng)站無法訪問、訪問速度緩慢、存儲數(shù)據(jù)丟失、會員個人信息泄漏等不利后果。
(2)遭受不可抗力事件時,中國招標采購網(wǎng)可中止履行本注冊條款項下的義務直至不可抗力的影響消除為止,并且不因此承擔違約責任;但應盡最大努力克服該事件,減輕其負面影響。
六、拒絕提供擔保和免責聲明
用戶明確同意使用中國招標采購網(wǎng)服務的風險由用戶個人承擔。服務提供是建立在免費的基礎上。北京中采高科招標集團有限公司明確表示不提供任何類型的擔保,不論是明確的或隱含的,但是對商業(yè)性的隱含擔保,特定目的和不違反規(guī)定的適當擔保除外。北京中采高科招標集團有限公司不擔保服務一定能滿足用戶的要求,也不擔保服務不會受中斷,對服務的及時性、安全性、真實性、出錯發(fā)生都不作擔保。北京中采高科招標集團有限公司拒絕提供任何擔保,包括信息能否準確、及時、順利地傳送。用戶理解并接受下載或通過中國招標采購網(wǎng)產(chǎn)品服務取得的任何信息資料取決于用戶自己,并由其承擔系統(tǒng)受損、資料丟失以及其它任何風險。北京中采高科招標集團有限公司對在服務網(wǎng)上得到的任何商品購物服務、交易進程、招聘信息,都不作擔保。用戶不會從北京中采高科招標集團有限公司收到口頭或書面的意見或信息,中國招標采購網(wǎng)也不會在這里作明確擔保。
七、有限責任
北京中采高科招標集團有限公司對任何直接、間接、偶然、特殊及繼起的損害或其他一切損害不負責任,這些損害來自:不正當使用產(chǎn)品服務,在網(wǎng)上進行交易,非法使用服務或用戶傳送的信息有所變動。這些損害會導致北京中采高科招標集團有限公司形象受損,所以北京中采高科招標集團有限公司早已提出這種損害的可能性。
八、不提供零售和商業(yè)性服務
用戶使用北京中采高科招標集團有限公司各項服務的權利是企業(yè)的。個人用戶只能是一個公司或?qū)嶓w的商業(yè)性組織下的所屬員工。用戶承諾:未經(jīng)北京中采高科招標集團有限公司同意,不得利用北京中采高科招標集團有限公司各項服務進行銷售或作其他商業(yè)用途。
九、用戶管理
用戶單獨承擔發(fā)布內(nèi)容的責任。用戶對服務的使用是根據(jù)所有適用于服務的地方法律、國家法律和國際法律標準的。
用戶承諾:
1、在中國招標采購網(wǎng)的網(wǎng)頁上發(fā)布信息或者利用中國招標采購網(wǎng)的服務時必須符合中國有關法規(guī)(部分法規(guī)請見附錄),不得在中國招標采購網(wǎng)的網(wǎng)頁上或者利用中國招標采購網(wǎng)的服務制作、復制、發(fā)布、傳播以下信息:
(1)反對憲法所確定的基本原則的;
(2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一的;
(3)損害國家榮譽和利益的;
(4)煽動民族仇恨、民族歧視,破壞民族團結的;
(5)破壞國家宗教政策,宣揚邪教和封建迷信的;
(6)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定的;
(7)散布淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪的;
(8)侮辱或者誹謗他人,侵害他人合法權益的;
(9)含有法律、行政法規(guī)禁止的其他內(nèi)容的。
2、在中國招標采購網(wǎng)的網(wǎng)頁上發(fā)布信息或者利用中國招標采購網(wǎng)的服務時還必須符合其他有關國家和地區(qū)的法律規(guī)定以及國際法的有關規(guī)定。
3、不利用中國招標采購網(wǎng)的服務從事以下活動:
(1)未經(jīng)允許,進入計算機信息網(wǎng)絡或者使用計算機信息網(wǎng)絡資源的;
(2)未經(jīng)允許,對計算機信息網(wǎng)絡功能進行刪除、修改或者增加的;
(3)未經(jīng)允許,對進入計算機信息網(wǎng)絡中存儲、處理或者傳輸?shù)臄?shù)據(jù)和應用程序進行刪除、修改或者增加的;
(4)故意制作、傳播計算機病毒等破壞性程序的;
(5)其他危害計算機信息網(wǎng)絡安全的行為。
4、不以任何方式干擾中國招標采購網(wǎng)的服務。
5、遵守中國招標采購網(wǎng)的所有其他規(guī)定和程序。用戶需對自己在使用中國招標采購網(wǎng)服務過程中的行為承擔法律責任。用戶理解,如果中國招標采購網(wǎng)發(fā)現(xiàn)其網(wǎng)站傳輸?shù)男畔⒚黠@屬于上段第1條所列內(nèi)容之一,依據(jù)中國法律,中國招標采購網(wǎng)有義務立即停止傳輸,保存有關記錄,向國家有關機關報告,并且刪除含有該內(nèi)容的地址、目錄或關閉服務器。
用戶使用中國招標采購網(wǎng)電子公告服務,包括電子布告牌、電子白板、電子論壇、網(wǎng)絡聊天室和留言板等以交互形式為上網(wǎng)用戶提供信息發(fā)布條件的行為,也須遵守本條的規(guī)定以及北京中采高科招標集團有限公司將專門發(fā)布的電子公告服務規(guī)則,上段中描述的法律后果和法律責任同樣適用于電子公告服務的用戶。若用戶的行為不符合以上提到的服務條款,北京中采高科招標集團有限公司將作出獨立判斷立即取消用戶服務帳號。
十、保障
用戶同意保障和維護北京中采高科招標集團有限公司全體成員的利益,負責支付由用戶使用超出服務范圍引起的律師費用,違反服務條款的損害補償費用,其它人使用用戶的電腦、帳號和其它知識產(chǎn)權的追索費。
十一、結束服務
用戶或北京中采高科招標集團有限公司可隨時根據(jù)實際情況中斷服務。北京中采高科招標集團有限公司不需對任何個人或第三方負責而隨時中斷服務。用戶若反對任何服務條款的建議或?qū)髞淼臈l款修改有異議,或?qū)?/span>中國招標采購網(wǎng)服務不滿,用戶只有以下的追索權:
1、不再使用中國招標采購網(wǎng)服務。
2、結束用戶使用中國招標采購網(wǎng)服務的資格。
3、通告北京中采高科招標集團有限公司停止該用戶的服務。
十二、通告
所有發(fā)給用戶的通告都可通過電子郵件或常規(guī)的信件傳送。北京中采高科招標集團有限公司會通過郵件服務發(fā)報消息給用戶,告訴他們服務條款的修改、服務變更、或其它重要事情。同時,北京中采高科招標集團有限公司保留對本站免費用戶投放商業(yè)性廣告的權利。
十三、 參與廣告策劃
在北京中采高科招標集團有限公司許可下用戶可在他們發(fā)表的信息中加入宣傳資料或參與廣告策劃,在中國招標采購網(wǎng)各項免費服務上展示他們的產(chǎn)品。任何這類促銷方法,包括運輸貨物、付款、服務、商業(yè)條件、擔保及與廣告有關的描述都只是在相應的用戶和廣告銷售商之間發(fā)生。北京中采高科招標集團有限公司不承擔任何責任,北京中采高科招標集團有限公司沒有義務為這類廣告銷售負任何一部分的責任。
十四、 內(nèi)容的所有權
中國招標采購網(wǎng)對其獨立采編的或從第三方獲得合法許可的信息內(nèi)容,內(nèi)容的定義包括:文字、軟件、聲音、相片、錄象、圖表;在廣告中的全部內(nèi)容;全部中國招標采購網(wǎng)虛擬社區(qū)服務為用戶提供的商業(yè)信息。所有這些內(nèi)容均受版權、商標、標簽和其它財產(chǎn)所有權法律的保護。所以,用戶只能在北京中采高科招標集團有限公司和廣告商授權下才能使用這些內(nèi)容,而不能擅自復制、再造這些內(nèi)容、或創(chuàng)造與內(nèi)容有關的派生產(chǎn)品。在本站發(fā)表、轉(zhuǎn)載的文章僅代表作者本人觀點,本站沒有義務查實文章或圖片、音頻、視頻文件的出處及其真實性。如果您是文章、圖片等資料的版權所有人,請與我們聯(lián)系并說明具體文章標題,中國招標采購網(wǎng)會及時加上版權信息,如果您反對中國招標采購網(wǎng)使用,在收到身份證明、版權證明和刪除要求后我們會立即刪除有版權問題的內(nèi)容。
十五、 法律
用戶和北京中采高科招標集團有限公司一致同意有關本協(xié)議以及使用中國招標采購網(wǎng)的服務產(chǎn)生的爭議交由仲裁解決,但是北京中采高科招標集團有限公司有權選擇采取訴訟方式,并有權選擇受理該訴訟的有管轄權的法院。若有任何服務條款與法律相抵觸,那這些條款將按盡可能接近的方法重新解析,而其它條款則保持對用戶產(chǎn)生法律效力和影響。
十六、 中國招標采購網(wǎng)會員帳號所含服務的信息儲存及安全
北京中采高科招標集團有限公司對用戶帳號上所有服務將盡力維護其安全性及方便性,但對服務中出現(xiàn)信息刪除或儲存失敗不承擔任何負責。另外我們保留判定用戶的行為是否符合中國招標采購網(wǎng)服務條款的要求的權利,如果用戶違背了用戶服務條款的規(guī)定,將會中斷其用戶服務的帳號。
十七、 青少年用戶特別提示
青少年用戶必須遵守全國青少年網(wǎng)絡文明公約:要善于網(wǎng)上學習,不瀏覽不良信息;要誠實友好交流,不侮辱欺詐他人;要增強自護意識,不隨意約會網(wǎng)友;要維護網(wǎng)絡安全,不破壞網(wǎng)絡秩序;要有益身心健康,不沉溺虛擬時空。
編者按 :本文提出了一種基于深度學習的招標標準知識庫構建方法。該方法運用自然語言處理技術對國家法律、企業(yè)制度進行分析和理解,提取其中的知識點;用知識圖譜技術對知識點進行存儲和組織,形成標準知識庫;利用該標準知識庫對招標文件范本進行自動審核和建議,建議結果的文本相似度超過75%,從而驗證了標準知識庫的有效性。
為完善招標文件編制規(guī)則,國家發(fā)展改革委聯(lián)合九部委共同編制了《標準設備采購招標文件》等5個標準招標文件,依法必須進行招標項目的招標人需在此基礎上編制招標文件。中國神華國際工程有限公司(以下簡稱工程公司)以標準招標文件為基礎,結合國家法律、集團制度規(guī)定的內(nèi)容編制了招標文件范本(以下簡稱范本),并且將范本作為招標文件的編制規(guī)范基礎。但目前編制范本所參考的文件尚未結構化存儲,無法快速檢索,導致人工編制范本占用大量的專家資源,耗費人力物力。
本文通過對工程公司現(xiàn)有招標數(shù)據(jù)的分析,并結合專家編制范本的經(jīng)驗,提出基于深度學習的招標標準知識庫構建方法,旨在利用技術手段為知識庫在招標領域的研究應用提供理論和實踐經(jīng)驗,解決編制范本耗時耗力的痛點,同時確保范本合規(guī)合法。
一、相關工作和技術
自然語言處理技術和知識圖譜技術發(fā)展日趨成熟,使得機器對文件的理解和分析能力進一步提升,加速將非結構化的數(shù)據(jù)轉(zhuǎn)變?yōu)榻Y構化的知識,為建立招標領域標準知識庫提供了有效的技術支撐條件。
當前知識庫已廣泛應用于各個領域。從2012年起,中國石油天然氣集團有限公司開始進行招標投標知識庫研究,以提高招標文件編制效率,使即使是非專業(yè)招標人也能在其指導下高效地完成工作。2016年,北京市高級人民法院對法律知識庫進行了研究,其核心數(shù)據(jù)是以司法審判、司法行政等文件構建的法律知識庫,可以提取歷史案件的特征,并與新案件自動配對,自動生成裁判文書,極大地提高了司法人員工作效率。
這些案例為我們構建招標領域標準知識庫提供了思路和信心。本文對招標領域的國家法律、企業(yè)制度進行研究,借鑒專家編制招標文件范本的思路,深入分析文件間的邏輯關系,并從文件中提取知識點,形成招標標準知識庫。
二、招標文件編制問題描述
招標文件編制是招標活動的重要環(huán)節(jié)。目前編制招標文件主要面臨兩個問題,一是國家標準招標文件的發(fā)布規(guī)范了招標市場,但局限于其通用性,無法滿足集團制度等專用規(guī)定,專家需要根據(jù)公司要求編制范本,費時費力;二是招標文件的合規(guī)性目前主要由專家檢查,缺乏系統(tǒng)管理手段,人工檢查容易出現(xiàn)條款遺漏和數(shù)值錯誤問題。
以上問題可通過建立標準知識庫進行解決。在編制招標文件時,通過選擇基于標準知識庫創(chuàng)建的范本文件,可以保證招標文件避免發(fā)生法律規(guī)范條款遺漏的問題?;跇藴手R庫的招標文件合規(guī)性檢查,可以有效地解決人工檢查容易遺漏和出錯的問題,已成為招標文件質(zhì)量保證的新手段。
關于標準知識庫的構建方法,我們針對招標領域定義了知識點和標準知識庫兩種類別。知識點是為求解某個問題,經(jīng)過推理而形成特定答案的條目,由屬性名(Key)和屬性值(Value)構成。 標準知識庫是將標準招標文件、國家法律、企業(yè)制度文件提取知識點后,進行結構化存儲,是知識點的集合,也是管理和組織知識點的倉庫。
三、方案實現(xiàn)
(一)方案概括介紹
本方案基于深度學習技術構建知識點提取模型,從非結構化的數(shù)據(jù)中提取知識點,構建標準知識庫。知識點作為標準知識庫的基礎單元,通過屬性名和屬性值進行表示。
要構建一個知識點提取模型,首先需要解析標準招標文件、國家法律、集團規(guī)定等文件內(nèi)容,對文件內(nèi)容按語句拆分。然后挑選部分語句進行標注,這些標注數(shù)據(jù)是訓練知識提取模型的數(shù)據(jù)集。最后通過命名實體識別、實體消歧和實體關系抽取技術對知識點提取模型進行訓練(見圖1)。
(二)知識點提取模型
1. 命名實體識別
本文主要利用AttBi-LSTM模型和CRF識別文件中的實體。
通過命名實體識別對當前語句進行實體定位,并對已定位的實體分類為預先定義的類別。選取標準招標文件、國家法律文件、集團規(guī)定文件的內(nèi)容作為語料庫,對各類文件的部分語句進行預訓練(見圖2)。
(1)數(shù)據(jù)標注。在本實驗中,模型訓練集的標簽是每個字向量對應標注的類別標號,標注標簽的分類一共有四類,即KEY、R、VALUE和O。其中KEY表示知識點屬性名;R表示知識點屬性名和屬性值的關聯(lián)詞;VALUE表示知識點屬性值;O表示非核心實體,可以忽略不處理。例如針對“招標有效期為90天?!边@個語句,標注結果為“招標有效期/KEY 為/R 90天 /VALUE 。/O”。
(2)命名實體識別語言模型構建。首先,在預訓練部分,將待訓練的文本序列進行文本向量化,將其每個字轉(zhuǎn)換為對應的有特定意義的固定長度的向量;再將處理好的詞向量序列輸入Bi-LSTM,提取文本雙向長距離依賴特征;然后利用Attention機制抽取輸入序列和輸出序列之間的關聯(lián)性,根據(jù)重要度算法獲取語句特征;最后用線性CRF層處理標簽之間的狀態(tài)關系,得到全局最優(yōu)標注序列。
例如:針對“招標代理機構為中國神華國際工程有限公司?!闭Z句,處理結果為[<“招標代理機構”,“KEY”>,<“為”,“R”>, <“中國神華國際工程有限公司”,“VALUE”>]。
2. 實體消歧
主流的實體消歧思路是使用待消歧的指稱上下文同標準知識庫的候選實體向量進行結合,構建深度排序模型,從而實現(xiàn)實體消歧,其中實體向量是使用實體知識描述進行離線訓練得到的。
本文通過實體消歧將文件中識別出的實體鏈接到其在標準知識庫中的相應實體,其對應著自然語言中的一詞多義。例如<“招標代理機構”, “招標機構”>,<“投標資質(zhì)”,“投標資格”>(見圖3)。
3. 實體關系抽取
本文將知識點之間的關系描述為三元組<E1,R,E2>,其中E1和E2表示為知識點,R表示為知識點間的關聯(lián)關系。實體關系抽取的主要目的是從語句中識別出知識點并提取它們之間的關系。
本文采用實體關系抽取的方法,語句經(jīng)過命名實體識別、實體鏈接、關系觸發(fā)詞識別3個預處理過程,將判定為知識點的數(shù)據(jù)存儲在數(shù)據(jù)庫中(見圖4)。
4 .知識點提取算法
本文采用基于深度學習的知識庫迭代自增式擴展算法進行知識點提取。 通過對招標領域的部分語料進行標注,構建知識點基礎數(shù)據(jù)集, 每個知識點對應屬性名和屬性值。算法自動發(fā)現(xiàn)標準知識庫中已有的屬性名和屬性值的特性,然后不斷識別新的知識點并更新標準知識庫。
迭代自增式擴展算法是針對標準知識庫不斷更新知識點的算法,該方法以卷積神經(jīng)網(wǎng)絡為基礎,設計了噪聲檢測模型,能夠準確地識別噪聲。首先給出招標領域的一個初始標準知識庫,其中包含項目名稱、招標代理機構、招標機構、招標方式、資金來源等屬性名和屬性值。最終從招標領域文件語料中識別更多的知識點,得到一個擴充的標準知識庫(圖5)。
5 .知識庫存儲
本文使用圖形數(shù)據(jù)庫Neo4j存儲知識點。Neo4j在保存知識點的同時,也保存了不同知識點之間的關聯(lián)關系。通過這類關系,為后面的實體消歧、知識融合提供數(shù)據(jù)支持(見圖6)。
四、實驗結果
(一)實驗設計
1. 實驗目標
訓練一個知識點提取模型,從標準招標文件、國家法律文件、集團規(guī)定文件中提取知識點并構建一個標準知識庫,最終通過生成范本的文本相似度驗證標準知識庫的有效性。
2. 實驗數(shù)據(jù)
本文從工程公司提供的9個國家標準招標文件、7個工程公司實用化母本,6個國家法律、5個工程公司管理制度提取數(shù)據(jù),構建知識庫(見圖7)。
3. 實驗方法
對部分標準招標文件、國家法律文件、集團規(guī)范和制度文件的知識點進行標注。將包含知識點的語句作為正樣例數(shù)據(jù),不包含知識點的語句作為負樣例。通過輸入正負樣例語料,訓練知識點提取模型。
(1)輸入文件結構化。對輸入的文件進行結構化處理。解析文件中的章節(jié)目錄信息,表格信息、正文信息。章節(jié)目錄信息按樹狀結構化處理,并確保段落正文都能關聯(lián)到正確的章節(jié)目錄。最后對所有的段落正文以語句為單元進行拆分,并標記對應的下標值。
(2)標注數(shù)據(jù)。首先將文件中的數(shù)據(jù)拆分成語句,從而得到一個語句集合。然后對拆分后的語句進行標注,將能夠標注出知識點的語句標記為正樣例數(shù)據(jù),將未能標注出知識點的語句標記為負樣例數(shù)據(jù)。
(3)構建標準知識庫。將正樣例數(shù)據(jù)和負樣例數(shù)據(jù)作為輸入數(shù)據(jù),按照本文所述構建知識點提取模型的步驟訓練知識點提取模型。訓練完成后,通過調(diào)用知識點提取模型,以標準招標文件、國家法律文件、集團規(guī)定文件的文本集合內(nèi)容作為輸入,提取知識點數(shù)據(jù),構建標準知識庫。
(4)關鍵指標。通過文本相似度(Acc)來衡量生成范本的質(zhì)量。文本相似度的分母是機器自動生成范本的語句條目數(shù)A,分子是條目數(shù)A中能夠在專家編制的實用化母本條目數(shù)B中找到的相似條目數(shù)。
(二)實驗結果及分析
為驗證所構建標準知識庫的可行性和有效性,本文對提取的知識點進行多次分批抽查,以驗證結果。
1. 實驗結果分析
從文件中提取的知識點數(shù)據(jù)統(tǒng)計見表1。通過對提取的知識點數(shù)據(jù)進行分析,標準招標文件和國家法律文件提取的知識點準確率最高。因為相對于集團規(guī)定文件,標準招標文件、國家法律文件的文件格式和內(nèi)容更加規(guī)整(見表2)。
2 .驗證方法有效性
經(jīng)過人工對生成的范本進行驗證,文件相似度均超過預定的70%的指標,證明本文所述方法構建的知識點提取模型切實可行(見表3)。
3. 分析方法待提高的部分
(1)通過提升知識點標注數(shù)量提升模型精度。隨著知識點標注數(shù)量的增加,模型精度會有所提高。
(2)通過人工反饋的方式完善模型基礎數(shù)據(jù)。對提取不正確的知識點及未能提取的知識點進行人工反饋,將正確的知識點數(shù)據(jù)反饋給模型,使模型擁有自主學習的能力。
五、結論
本文提出一種基于深度學習的招標領域標準知識庫構建方法。該方法通過建立一個知識點提取模型,從文件中實現(xiàn)知識提取,并且能夠通過人工標注和反饋不斷優(yōu)化模型。實驗結果表明,該方法可有效提取知識點,基于標準知識庫對范本內(nèi)容進行自動審核和建議,建議結果的文本相似度超過75%,驗證了標準知識庫的有效性。除范本生成外,標準知識庫還可以應用于合規(guī)檢查、文本審核、文件對比等業(yè)務場景。
作者:王進強 盧 爽
作者單位:中國神華國際工程有限公司
來源:《招標采購管理》2021年第9期