,聯合中國大模型語料數據聯盟成員單位,共同開源發布“書生·萬卷” 1.0多模態預訓練語料。
中國首個開源多模態預訓練語料“書生·萬卷” 發布
上海人工智能實驗室于昨日宣布,聯合中國大模型語料數據聯盟成員單位,共同開源發布“書生·萬卷” 1.0多模態預訓練語料。目前分為文本數據集、圖文數據集、視頻數據集三部分,開源的數據總量超過2TB,包含超過5億個文本,2200萬個圖文交錯文檔,1000個節目影像視頻,覆蓋科技、文學、媒體、教育、法律等領域。
據了解,中國大模型語料數據聯盟是由上海人工智能實驗室聯合中央廣播電視總臺、人民網、國家氣象中心、中國科學技術信息研究所、上海報業集團、上海文廣集團、上海數據集團、上海市數商協會、金杜律師事務所等單位聯合發起成立的開放組織。
根據中研普華研究院撰寫的《2023-2028年中國開源軟件行業市場前瞻分析與投資戰略分析報告》顯示:
開源軟件行業市場前瞻分析與投資
隨著科技不斷創新發展,開源技術的重要價值日漸凸顯,成為企業數字化轉型發展的關鍵,開源軟件產業初具規模,且具有非常大的發展空間和潛力。按 OSI 官網上的說法,“Meta 對 LLaMa 模型和代碼的許可,對某些用戶的商業用途施加了限制,并且還限制將模型和軟件用于某些目的。其許可證不在開源類別中。”
開源者的動機有兩種,一種是純屬 Hacker 行為的 Linux,另一種是大公司的商業行為,比如 Google 的 TensorFlow。Meta 從宣傳上把自己偽裝成后一種。但不管怎么說,從開源的官方嚴謹定義講,沒有用開源許可證的,不是開源。
大數據一戰中失敗的 Google,面對這一次的容器之戰,迅速出擊,在發完論文搶占技術影響力后,為進一步搶占開發者市場,也決定發布產品,也就是 Google 內部相對成熟的容器編排調度框架,Borg。Borg 一直在內部被視作最強大的“秘密武器”,只是設計之初,也是為了內部使用需要,跟很多系統攪在一起,沒辦法直接開源。于是,Google 用 Go 語言迅速重構了 Borg,2014 年,Kubernetes 發布。
國內開源開發者參與開源的方式多種多樣,大多數開源開發者通過多重方式參與開源。其中,使用開源項目的開發者占比達71.7%;超半數的開源開發者參與了社區代碼貢獻,占比達52.9%;開發者參與文檔撰寫的比例也達到29.2%。
值得注意的是,開源開發者參與社區活動、社區運營、項目傳播等開源文化活動的比例有了顯著增加,分別達到36.6%、13.2%和10.5%;同時,開源項目、產品和文化布道師職業逐漸興起,國內參與開源布道的開發者群體不斷壯大,占比達14.2%。
如今開源軟件在中國具有可觀的市場發展潛力,“十四五”規劃對開源軟件的大力支持為行業未來發展打下了堅實的政策基礎,同時,中國開源貢獻者規模快速增長,增速全球第一,數量位居全球第二,而這也成為了中國企業軟件超車的關鍵一環和核心利器。
操作系統是數字基礎設施的底座,要實現高水平自立自強,具備根技術的操作系統及其生態突破是必須攻克的關鍵一環。與此同時,開源模式已成為全球軟件技術和產業創新的主導模式,覆蓋軟件開發的全域場景,全球97%的軟件開發者和99%的企業使用開源軟件。
據悉,開源鴻蒙歐拉生態正在蓬勃發展。目前,開源鴻蒙項目已有51家共建單位,超過5100位代碼共建者,產出近億行代碼,在教育、交通、金融、家居、安防等多個行業已有220余款軟硬件產品通過兼容性測評,開源鴻蒙操作系統裝機量已超3億臺。
工信部數據顯示,開源歐拉操作系統累計裝機量已突破430萬套,為130個國家和地區用戶提供服務,開源生態蓬勃發展,共建成員單位超980家,IPv6的活躍用戶數達到7.67億,移動網絡中的IPv6流量占比超過一半。
深圳市工業和信息化局印發《深圳市推動開源鴻蒙歐拉產業創新發展行動計劃(2023—2025年)》。深圳市瞄準最高最優最強,通過培育和吸引更多企業、更多人才、更多產業組織集聚深圳發展開源鴻蒙歐拉產業,力爭率先將深圳建成為核心技術領先、產業高度集聚、應用場景豐富、生態支撐完備、全球輻射引領的開源鴻蒙歐拉產業高地。
從深圳市工信局獲悉,開源鴻蒙是智能終端操作系統,開源歐拉是服務器操作系統。2022年9月,深圳市政府印發《深圳市推動軟件產業高質量發展的若干措施》。提出加快開源軟件推廣應用,支持相關商業發行版公司在深發展;鼓勵企業開發生產相關智能終端產品;支持企業采購相關軟件和終端產品。
近年來,深圳市大力推動智慧城市和數字政府建設,加速各行各業數字化轉型,為開源鴻蒙提供了豐富的智能化全場景。深圳市工信局介紹,深圳市發展開源鴻蒙歐拉產業具有深厚基礎和獨特優勢。目的是推動開源鴻蒙歐拉產業創新發展,助力關鍵核心技術高水平自立自強,主動擁抱新的技術與產業升級機遇,加快構建現代化產業體系。
《2023-2028年中國開源軟件行業市場前瞻分析與投資戰略分析報告》對中國開源軟件行業的發展現狀、競爭格局及市場供需形勢進行了具體分析,并從行業的政策環境、經濟環境、社會環境及技術環境等方面分析行業面臨的機遇及挑戰。還重點分析了重點企業的經營現狀及發展格局,并對未來幾年行業的發展趨向進行了專業的預判。
本報告同時揭示了開源軟件市場潛在需求與潛在機會,為戰略投資者選擇恰當的投資時機和公司領導層做戰略規劃提供準確的市場情報信息及科學的決策依據,同時對政府部門也具有極大的參考價值。
未來,開源軟件行業發展前景如何?想了解關于更多行業專業分析,請點擊《2023-2028年中國開源軟件行業市場前瞻分析與投資戰略分析報告》。
關注公眾號
免費獲取更多報告節選
免費咨詢行業專家
2023-2028年中國開源軟件行業市場前瞻分析與投資戰略分析報告
開源軟件是通過特定類型的許可證發布的軟件,這種許可證能讓最終用戶合法地使用其源代碼。早在2015年,國務院在《關于積極推進“互聯網+”行動的指導意見》中,就提出了大力發展開源社區。鼓勵...
查看詳情
近年來,我國農業基礎設施加快改善,農產品供給充裕,農民發展規模經營主動性不斷增強,為農業現代化提供不竭源動力。...
中國人工智能相關產業發展勢頭喜人智能手機出貨量1.24億部,智能車載設備制造、智能無人飛行器制造、其他智能消費設備...
隨著旅游市場強勁復蘇,海南離島免稅購物熱度持續攀升。據統計,今年一季度海南全省接待游客2680萬人次,增長20.2%,...
消費,已經越來越超越簡單的物質需求,而成為了新人類的存在方式,成為了他們心理安全的保護機制。他們把消費做為樹立...
“海洋水產品能夠提供更多的營養選擇,但我國魷魚加工業存在精深加工程度不足以及魷魚副產物高值化利用缺乏等問題。”...
商品房市場現狀:2023年1—7月份商品房銷售面積66563萬平方米1—7月份,商品房銷售面積66563萬平方米,同比下降6.5%,...
微信掃一掃