成全在线观看免费完整的,成全影视大全免费追剧大全,成全视频高清免费播放电视剧好剧,成全在线观看免费完整,成全在线观看高清全集,成全动漫视频在线观看完整版动画

×

打開微信,掃一掃二維碼
訂閱我們的微信公眾號

首頁 錦天城概況 黨建工作 專業領域 行業領域 專業人員 全球網絡 新聞資訊 出版刊物 加入我們 聯系我們 訂閱下載 CN EN JP
首頁 > 全球網絡 > 上海 > 出版刊物 > 專業文章 > 通義千問開源大模型許可協議合規探析

通義千問開源大模型許可協議合規探析

作者:丁華 黃威 陳岱源 2024-10-11

一、通義千問開源大模型簡介


通義千問是由阿里巴巴集團旗下的云計算服務公司阿里云開發的大語言模型。2023年8月3日,阿里云宣布其自研的大模型通義千問正式開源,并在AI模型社區魔搭ModelScope上架了兩款開源模型——Qwen-7B和Qwen-7B-Chat,隨后在2023年相繼發布了Qwen-1_8B、Qwen-72B 和 Qwen-Audio。Qwen-7B、Qwen-72B和Qwen-7B-Chat采用《Tongyi Qianwen LICENSE AGREEMENT》,Qwen-1_8B采用《Tongyi Qianwen RESEARCH LICENSE AGREEMENT》[1]。

2024年4月28日,阿里云發布了Qwen-1.5系列大模型。2024年6月,阿里云發布了Qwen-2系列大模型,包含Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B共五個版本。其中Qwen2-72B曾在2024年6月登頂HuggingFace排行榜,力壓Meta的Llama-3-70B開源模型。同時,在上海人工智能實驗室聯合魔搭社區推出的中國大語言模型評測競技場Compass Arena測評中,Qwen2-72B也超過了一眾閉源商業模型,僅次于GPT-4o[2]。在Qwen-2系列的五個版本中,僅有Qwen2-72B采用《Tongyi Qianwen LICENSE AGREEMENT》[3],另外四個版本均采用采用Apache2.0許可證。


2024年9月19日,在云棲大會上,阿里云發布了新一代的開源模型Qwen2.5系列,包含0.5B, 1.5B, 3B, 7B, 14B, 32B和72B共7種版本。Qwen系列開源大模型的倉庫位于Github、Hugging Face、魔搭社區以及阿里云自身的阿里云百煉大模型平臺。Qwen2.5系列中,Qwen2.5-72B[4]采用《Qwen LICENSE AGREEMENT》,Qwen2.5-3B[5]采用《Qwen RESEARCH LICENSE AGREEMENT》,這兩個許可證均發布于2024年9月19日,除3B和72B之外,Qwen2.5系列模型均采用Apache2.0許可證。


除了上述開源版本外,阿里云還另有商業版產品線“通義千問”,用戶日常在網頁端訪問的“通義千問”時,即是閉源模型在提供服務。


二、通義千問開源大模型許可協議和研究許可協議簡介


(一)通義千問許可協議(Tongyi Qianwen LICENSE AGREEMENT)


通義千問許可協議(Tongyi Qianwen LICENSE AGREEMENT)在2023年8月3日發布,許可證內容包括9個條款,主要內容如下:


首先在序言部分明確,通過點擊同意或使用或分發通義千問材料的任何部分或元素,將被視為已認可并接受通義千問許可協議的內容,通義千問許可協議會立即生效。


在第1條定義部分,對通義千問許可協議涉及的重要概念進行了定義,例如:“材料”總體而言,指依據本協議提供的阿里云專有的通義千問及其文檔(和其任何部分)。“通義千問”指大型語言模型(包括Qwen模型和Qwen-Chat模型),和軟件和算法,包括經訓練的模型權重、參數(包括優化器狀態)、機器學習模型代碼、推理實現代碼、訓練實現代碼、微調實現代碼和其他我們分發的前述內容的元素。“源代碼”形式指進行修改的首選形式,包括但不限于模型源代碼、文檔源碼和配置文件。“目標代碼”形式指任何從源代碼形式經機器轉換或翻譯而導出的形式,包括但不限于經編譯的目標代碼、生成的文檔以及轉換成其他媒體類型。


第2條授予權利,基于阿里云的知識產權或阿里云擁有的在材料中體現的其他權利,授予被許可人對材料非獨占的、全球性、不可轉讓且免版稅的有限許可,以使用、再制造、分發、復制、創建衍生作品及對材料進行修改。


第3條再分發,許可協議第3條規定,被許可人可以任何媒介再制造和分發材料或其衍生作品的副本,無論是否進行了修改,并可以源碼或目標碼形式提供,前提是滿足以下條件:


(1)應向材料或其衍生作品的任何其他接收者提供通義千問許可協議的副本;(2)應確保任何被修改的文件帶有顯著的通知聲明被許可人更改了該文件;(3) 在分發的所有材料副本中,應在作為該副本一部分的“通知”文本文件中保留如下歸屬通知:“通義千問根據通義千問許可協議授予許可,版權所有 ? 阿里云。所有權利保留。”并且;(4)可以為被許可人的修改添加被許可人的版權聲明,并可為使用、再制造或分發被許可人的修改或任何此類衍生作品整體提供額外或不同的許可條款和條件,前提是被許可人使用、再制造和分發該作品須符合通義千問許可協議的條款和條件。


第4條限制 通義千問許可協議第4條規定,如果被許可人商業性地使用材料,并且被許可人的產品或服務擁有超過1億的月活躍用戶,則應當向阿里云申請許可證。未經阿里云的明確授權,不得行使通義千問許可協議下的權利。


第5條使用規則 通義千問許可協議第5條規定,材料可能受到中國、美國或其他國家和地區出口管制或限制的影響。被許可人在使用材料時應遵守適用的法律和法規。不得使用材料或其任何輸出來改進任何其他大型語言模型(不包括通義千問或其衍生作品)。


第6條知識產權 通義千問許可協議第6條規定,阿里云保留對材料及阿里云制作或委托制作的所有衍生作品的所有知識產權的所有權。在遵守本協議的條款和條件的條件下,對于被許可人做出的對材料的修改和任何衍生作品改,被許可人將是這些修改和衍生作品的所有者。


除通義千問許可協議要求的履行通知要求或為描述和再分發材料而合理和通常使用外,未授予使用我們的商號、商標、服務標志或產品名稱的商標許可。


如果被許可人提起訴訟或采取其他程序(包括在訴訟中的交叉請求或反請求)針對阿里云或任何實體,聲稱材料或其任何輸出,或前述任何部分侵犯了被許可人擁有或可許可的任何知識產權或其他權利,則本協議授予被許可人的全部許可將在開始或提起此類訴訟或其他程序之日終止。


通義千問許可協議第7條規定了無擔保和責任限制聲明,通義千問許可協議第8條規定了存續和終止,協議的期限自被許可人接受本協議或訪問材料之日起開始,并將持續有效直至根據協議的條款和條件終止,如果被許可人違反本協議的任何條款或條件,阿里云可以終止協議。協議終止時,被許可人必須刪除并停止使用材料。第7條無擔保和責任限制和第9條適用法律和司法管轄權條款在本協議終止后仍然有效。


通義千問許可協議第9條規定了適用法律和司法管轄權,協議及由此產生或與之相關的任何爭議將受中國法律管轄,不考慮沖突法原則,并且《聯合國國際貨物銷售合同公約》不適用于協議。對于協議引起的任何爭議,位于杭州市的人民法院具有排他的司法管轄權。


(二)通義千問研究許可協議(Tongyi Qianwen RESEARCH LICENSE AGREEMENT)


通義千問研究許可協議(Tongyi Qianwen RESEARCH LICENSE AGREEMENT)在2023年11月30日發布,許可證內容包括9個條款。通義千問研究許可協議(Tongyi Qianwen RESEARCH LICENSE AGREEMENT)和通義千問許可協議(Tongyi Qianwen LICENSE AGREEMENT)主要條款和條件基本相同,主要的區別在于通義千問研究許可協議(Tongyi Qianwen RESEARCH LICENSE AGREEMENT)規定,授予被許可人權利的用途僅為研究或評估目的,即非商業用途。如果被許可人要將模型用于商業使用,應另行申請許可。


(三)千問許可協議(Qwen LICENSE AGREEMENT)


千問許可協議(Qwen LICENSE AGREEMENT)在2024年9月19日發布。千問許可協議(Qwen LICENSE AGREEMENT)在之前通義千問許可協議(Tongyi Qianwen LICENSE AGREEMENT)基礎上進行了微調。除簡單的字詞調整外,重點變化在第三條“再分發”和第五條“使用規則”。


對第三條“再分發”的修訂主要為:通義千問許可協議(Tongyi Qianwen LICENSE AGREEMENT)規定,再制造和分發材料或其衍生作品的副本,無論是否進行了修改,以源碼或目標碼形式,需要滿足第三條第二款規定abcd四個條件; 千問許可協議(Qwen LICENSE AGREEMENT)則調整為,復制和分發材料或其衍生作品的副本,或使其作為包含于任何媒介的產品或服務的一部分可獲得,無論是否進行修改,以源碼或目標碼形式,需要滿足第三條第二款規定abcd四個條件。


對第五條“使用規則”的修訂主要為:通義千問許可協議(Tongyi Qianwen LICENSE AGREEMENT)規定,不得使用材料或其任何輸出來改進任何其他大型語言模型(不包括通義千問或其衍生作品); 千問許可協議(Qwen LICENSE AGREEMENT)則調整為,用戶可以使用“材料”或任何輸出或結果來創建、訓練、微調或改進已發布或可用的AI模型,但需要在相關產品文檔中應當突出顯示“使用Qwen構建”或“使用Qwen改進”的內容。


(四)千問研究許可協議(Qwen RESEARCH LICENSE AGREEMENT)


千問研究許可協議(Qwen RESEARCH LICENSE AGREEMENT)在2024年9月19日和千問許可協議(Qwen LICENSE AGREEMENT)一起發布,許可證內容包括9個條款。千問研究許可協議(Qwen RESEARCH LICENSE AGREEMENT)和千問許可協議(Qwen LICENSE AGREEMENT)主要條款和條件基本相同,主要的區別在于千問研究許可協議(Qwen RESEARCH LICENSE AGREEMENT)規定,授予被許可人權利的用途僅為研究或評估目的,即非商業用途。如果被許可人要將模型用于商業使用,應另行申請許可。


三、復制分發利用通義千問開源大模型需要關注的合規問題


根據前文對通義千問開源大模型許可協議內容的簡要介紹,商業公司在合規復制、分發和利用通義千問開源大模型時應當關注如下問題。


(一)通義千問開源大模型許可協議授予被許可人對材料(即模型、代碼和文檔)的復制、分發和修改的許可


通義千問開源大模型系列許可協議發布于2023年8月之后,和之前2023年3月發布的AIPubs Open RAIL-M許可證比較,通義千問開源大模型系列許可協議沒有提及用于訓練、評估的數據,其授予許可的材料主要包括模型、代碼和文檔。而AIPubs Open RAIL-M許可證明確規定適用于模型,用于訓練、評估的數據和補充材料(主要為程序代碼)則未根據AIPubs Open RAIL-M許可證進行許可。


因此商業公司在部署利用、復制和分發通義千問人工智能開源大模型時,應清楚通義千問開源大模型系列許可協議的許可的知識產權(主要為版權和專利)的范圍為材料(即模型、代碼和文檔)。


(二)阿里云根據通義千問開源大模型系列許可協議對被許可人的授權范圍是不包括商標和商號權的其他知識產權。


通義千問開源大模型系列許可協議第2條規定,基于阿里云的知識產權或阿里云擁有的在材料中體現的其他權利,授予被許可人對材料非獨占的、全球性、不可轉讓且免版稅的有限許可,使用、再制造、分發、復制、創建衍生作品及對材料進行修改。


通義千問開源大模型系列許可協議相關條款規定,除許可協議要求的履行通知要求或為描述和再分發材料而合理和通常使用外,未授予使用阿里云的商號、商標、服務標志或產品名稱的商標許可。


(三)特別關注通義千問開源大模型系列許可協議對模型商業使用的限制條件


商業公司在合規使用和分發發通義千問人工智能開源大模型時應當特別關注通義千問許可協議和千問許可協議第4條規定“如果被許可人商業性地使用材料,并且被許可人的產品或服務擁有超過1億的月活躍用戶,則應當向阿里云申請許可證。未經阿里云的明確授權,不得行使通義千問許可協議/千問許可協議項下的權利”的商業使用限制,如果非商業使用則沒有被許可人的產品或服務擁有不超過1億的月活躍用戶的限制。


在2023年7月和2024年4月發布的Llama 2 和 Llama 3 社區許可證(LLAMA 2 Community License& LLAMA 3 Community License Agreement)規定,如果在 Llama 2 版本發布之日,被許可方或被許可方的關聯公司提供的產品或服務的每月活躍用戶數在上一個日歷月中超過 7 億,則必須向Meta申請單獨的商業許可證。


比較二者,可見通義千問/千問許可協議和Llama 2 和 Llama 3 社區許可證都根據被許可人產品和服務月活躍用戶數采取了限制,但通義千問/千問許可協議在計算活躍用戶時沒有涉及被許可人的關聯方,僅對商業性使用進行限制,數量限制為1億低于Llama 2 和 Llama 3 社區許可證規定的7億。


對于適用通義千問/千問研究許可協議的通義千問開源大模型,被授權的用途僅為研究或評估目的,即非商業用途。如果要將模型用于商業用途的復制分發和利用,則應另行申請許可。


(四)被許可人可對通義千問開源大模型修改形成派生作品,且無強制開源義務


通義千問許可/研究許可協議第3條規定,被許可人可以以任何媒介再制造和分發材料或其衍生作品的副本,無論是否進行了修改,以源碼或目標碼形式,其應當遵守的條件并不要求被許可人(即后續的模型使用分發者)對基于開源人工智能大模型進行修改得到的派生作品繼續進行開源/開放;千問許可/研究許可協議第3條也規定,被許可人復制和分發材料或其衍生作品的副本,或使其作為包含于任何媒介的產品或服務的一部分可獲得,無論是否進行修改,以源碼或目標碼形式,其應當遵守的條件并不要求被許可人(即后續的模型使用分發者)對基于開源人工智能大模型進行修改得到的派生作品繼續進行開源/開放。因此被許可人對修改通義千問人工智能開源大模型獲得的派生作品,有權決定是否繼續開源/開放其修改后的模型派生作品。


(五)復制、分發和利用通義千問開源大模型,其系列許可協議對于使用用途的限制少于適用RAIL許可證大模型的使用用途限制


和AI Open RAIL許可證的專門用附件A規定三方面的用途限制(違法、傷害和歧視、不符合透明度)不同,通義千問許可/研究許可協議僅規定了兩點使用規則:(1)材料(模型、代碼和文檔)可能受到中國、美國或其他國家和地區出口管制或限制的影響。被許可人在使用材料時應遵守適用的法律和法規。(2)不得使用材料或其任何輸出來改進任何其他大型語言模型(不包括通義千問或其衍生作品)。在千問許可/研究許可協議的使用規則中進一步開放了用通義千問大模型繼續訓練其他大模型的許可,只需標注通義千問的貢獻即可。由此可見通義千問系列許可協議對于使用用途的限制少于適用RAIL許可證大模型的使用用途限制。


(五)復制、分發、利用通義千問開源大模型產生的爭議適用中國法律,杭州法院具司法管轄權


一般的AI Open RAIL許可證沒有適用法律和爭議管轄法院的條款,在通義千問系列許可協議和Llama 2 和 Llama 3 社區許可證類似都規定了法律和爭議管轄法院的條款。


Llama 2 和 Llama 3 社區許可證規定,許可協議將受加利福尼亞州法律管轄和解釋,但不包括選擇法律的規則,并且《聯合國國際貨物銷售合同公約》不適用于許可協議。加利福尼亞法院對因許可協議引起的任何爭議擁有獨占的管轄權。


通義千問系列許可協議規定了適用法律和司法管轄權,協議及由此產生或與之相關的任何爭議將受中國法律管轄,不考慮沖突法原則,并且《聯合國國際貨物銷售合同公約》不適用于協議。對于協議引起的任何爭議,位于杭州市的人民法院具有排他的司法管轄權。


注釋

[1] https://huggingface.co/Qwen/Qwen-1_8B/blob/main/LICENSE

[2] https://tech.caijing.com.cn/20240628/5021311.shtml

[3] https://huggingface.co/Qwen/Qwen2-72B/blob/main/LICENSE

[4] https://huggingface.co/Qwen/Qwen2.5-72B/blob/main/LICENSE

[5] https://huggingface.co/Qwen/Qwen2.5-3B/blob/main/LICENSE


欢迎光临: 象州县| 柘荣县| 巴林左旗| 肇东市| 图片| 宣恩县| 忻州市| 华坪县| 黄山市| 昌平区| 桓台县| 红安县| 夏河县| 扬中市| 双峰县| 特克斯县| 江油市| 丰台区| 陆河县| 定兴县| 靖西县| 治多县| 泌阳县| 巫山县| 江华| 曲沃县| 本溪市| 汤阴县| 普兰县| 江华| 呼图壁县| 逊克县| 穆棱市| 株洲市| 宣恩县| 新蔡县| 南丹县| 安岳县| 伽师县| 客服| 林甸县|