2023年7月2日,“2023全球數(shù)字經(jīng)濟(jì)大會(huì)人工智能高峰論壇”在中關(guān)村國(guó)家自主創(chuàng)新示范區(qū)會(huì)議中心舉行。此次論壇以“智能涌現(xiàn),重塑未來(lái)”為主題,聚集了10余位人工智能領(lǐng)域頂級(jí)專家學(xué)者以及企業(yè)和機(jī)構(gòu)代表,共同分享了對(duì)當(dāng)前最炙手可熱的大模型發(fā)展話題的深入洞見(jiàn)和思考。
本次論壇發(fā)布了首批“北京市人工智能大模型高質(zhì)量數(shù)據(jù)集”,晴數(shù)智慧與另外9家單位的18個(gè)高質(zhì)量訓(xùn)練數(shù)據(jù)集入選,包括晴數(shù)智慧“智能座艙人機(jī)交互高質(zhì)量數(shù)據(jù)集”與“超大規(guī)模中文多領(lǐng)域?qū)υ挃?shù)據(jù)集”、人民日?qǐng)?bào)語(yǔ)料數(shù)據(jù)集、國(guó)家法律法規(guī)語(yǔ)料數(shù)據(jù)集、兩會(huì)參政議政建言數(shù)據(jù)集、“科情頭條”全球科技動(dòng)態(tài)數(shù)據(jù)集、中國(guó)科學(xué)引文數(shù)據(jù)庫(kù)數(shù)據(jù)集、科技文獻(xiàn)挖掘語(yǔ)義標(biāo)注數(shù)據(jù)集等,涵蓋經(jīng)濟(jì)、政治、文化、社會(huì)、生態(tài)等不同領(lǐng)域,總規(guī)模超過(guò)500T,將為通用大模型和行業(yè)大模型訓(xùn)練提供有力保障。
本次論壇上還重磅發(fā)布了北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃第二批成員名單,該伙伴計(jì)劃由北京市經(jīng)信局聯(lián)合市科委中關(guān)村管委會(huì)、市發(fā)改委共同啟動(dòng),標(biāo)志著北京成為全國(guó)范圍內(nèi)率先對(duì)大模型產(chǎn)業(yè)落地出臺(tái)針對(duì)性支持政策的地區(qū)。“伙伴計(jì)劃”旨在搭建人工智能大模型的開(kāi)放合作平臺(tái),建立協(xié)同合作機(jī)制,通過(guò)持續(xù)優(yōu)化產(chǎn)業(yè)鏈布局,大幅提升優(yōu)質(zhì)算力、高質(zhì)量數(shù)據(jù)供給支撐能力,培養(yǎng)一批應(yīng)用大模型技術(shù)實(shí)現(xiàn)突破性成長(zhǎng)的標(biāo)桿企業(yè)。
據(jù)了解,第二批“伙伴計(jì)劃”征集工作引起產(chǎn)業(yè)界的廣泛響應(yīng)和積極參與。截至6月30日,共有416家京內(nèi)外大模型研發(fā)和應(yīng)用企業(yè)申請(qǐng)加入。經(jīng)學(xué)術(shù)界、產(chǎn)業(yè)界、投資界專家的充分論證以及市場(chǎng)化機(jī)制評(píng)估,北京晴數(shù)科技有限公司與其他9家企業(yè)作為數(shù)據(jù)伙伴入選第二批“伙伴計(jì)劃”,并在此次論壇上進(jìn)行了公布。
人工智能大模型的突破源于高質(zhì)量數(shù)據(jù)的不斷發(fā)展,提升高質(zhì)量數(shù)據(jù)要素供給能力是推動(dòng)通用人工智能大模型領(lǐng)域創(chuàng)新的關(guān)鍵。目前國(guó)內(nèi)中文語(yǔ)料庫(kù)數(shù)據(jù)稀缺、數(shù)據(jù)處理成本高、數(shù)據(jù)相關(guān)條例尚未完善。
晴數(shù)智慧作為一家全球領(lǐng)先高質(zhì)量數(shù)據(jù)集解決方案企業(yè),擁有近億輪次可用于大模型訓(xùn)練的高質(zhì)量成品對(duì)話數(shù)據(jù)集。晴數(shù)智慧在傳統(tǒng)采集標(biāo)注基礎(chǔ)上,圍繞構(gòu)建高質(zhì)量數(shù)據(jù),為客戶提供MLOps(機(jī)器學(xué)習(xí)運(yùn)維閉環(huán))支撐,在數(shù)據(jù)咨詢,生成,清洗,分類,微調(diào),測(cè)試等環(huán)節(jié),提供專業(yè)的DaaS(Data as a Service) 解決方案。晴數(shù)智慧核心團(tuán)隊(duì)深耕AI數(shù)據(jù)領(lǐng)域近二十年,參與起草國(guó)家標(biāo)準(zhǔn)《人工智能 面向機(jī)器學(xué)習(xí)的數(shù)據(jù)標(biāo)注規(guī)程》(GB/T 42755-2023)、《信息技術(shù) 智能語(yǔ)音交互測(cè)試方法 第1部分:語(yǔ)音識(shí)別》(GB/T 41813.1-2022)、《信息技術(shù) 智能語(yǔ)音交互測(cè)試方法 第2部分:語(yǔ)義理解》(GB/T 41813.2-2022),積累沉淀了豐富的數(shù)據(jù)治理經(jīng)驗(yàn)。
加入北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃,晴數(shù)智慧將助力打造用于大模型構(gòu)建和微調(diào)的數(shù)據(jù)專區(qū)與國(guó)家級(jí)數(shù)據(jù)訓(xùn)練基地建設(shè)、制定數(shù)據(jù)服務(wù)標(biāo)準(zhǔn),為模型訓(xùn)練提供優(yōu)質(zhì)且合規(guī)的數(shù)據(jù),降低模型訓(xùn)練成本。同時(shí)與算力、模型及各應(yīng)用領(lǐng)域的伙伴共同打造MLOps,助力大模型產(chǎn)業(yè)落地。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )