生成式人工智能:實現(xiàn)卓越數(shù)據(jù)分析成果的關(guān)鍵
當(dāng)前商業(yè)環(huán)境中的技術(shù)進步,吸引著組織尋找利用新技術(shù)的方法。生成式人工智能(GenAI)是一個廣闊的領(lǐng)域,在過去幾年中表現(xiàn)出最高的增長率。
人工智能的生成本質(zhì),正在改變?nèi)藗儗?shù)據(jù)分析及其應(yīng)用的看法和觀點。就像給出一組指令一樣簡單,任何人都可以用文本、圖像、音頻或任何想要的格式來回應(yīng)。
生成式人工智能技術(shù)
這是人工智能的一個分支,利用學(xué)習(xí)來制作創(chuàng)新類型的內(nèi)容,例如圖像、文本、視頻或音樂。它處理大型數(shù)據(jù)集,并開發(fā)必要的結(jié)構(gòu)和陰影來模擬原始數(shù)據(jù)。
這些界面的簡單性主要推動了GenAI的大肆宣傳。我們可以用自然語言編寫文本,并在幾秒鐘內(nèi)獲得高質(zhì)量的文本和圖像。它還確定了其在管理原則方面與其他模型截然不同。
生成對抗網(wǎng)絡(luò)(GAN)
值得注意的是,這項技術(shù)并不是市場上最新的。GenAI最早在60年代用于在聊天機器人中生成消息。此外,生成式AI在2014年取得了進展,并很有可能轉(zhuǎn)變?yōu)楝F(xiàn)今所看到的樣子。GenAI中廣受好評的方法之一是生成對抗網(wǎng)絡(luò)(GAN),它是由Ian Goodfellow等人首次提出的。
GAN是一種機器學(xué)習(xí)算法,它將問題構(gòu)建為具有兩個子模型的監(jiān)督學(xué)習(xí)問題。
人工智能模型經(jīng)過訓(xùn)練可以創(chuàng)建一組屬于特定領(lǐng)域的新數(shù)據(jù)點。相比之下,分類器模型,稱為鑒別器,會將新數(shù)據(jù)點識別為真或假。在這種重復(fù)訓(xùn)練中,生成器會抓住機會生成更接近現(xiàn)實的示例,而鑒別器則會在確定假樣本和真樣本方面變得更加明智。
變分自動編碼器(VAE)
生成建模中的另一種流行方法是,變分自動編碼器(VAE)。它由DiederikP.Kingma和MaxWelling于2013年提出,當(dāng)時作者分別在谷歌和高通工作;VAE與簡單的自動編碼器不同,它使用編碼器-解碼器結(jié)構(gòu)。
編碼器將原始數(shù)據(jù)壓縮成參數(shù)較少的概率分布,解碼器網(wǎng)絡(luò)再將其重構(gòu)回實際數(shù)據(jù)空間。這種方法也便于構(gòu)建人工人臉或訓(xùn)練人工智能系統(tǒng)的數(shù)據(jù)。
Transformer架構(gòu)(深度學(xué)習(xí))
還有更多的生成式AI模型,包括循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、擴散模型、基礎(chǔ)模型、Transformer模型等。
谷歌研究人員引入了自監(jiān)督的Transformer式學(xué)習(xí),該學(xué)習(xí)也已用于谷歌BERT、OpenAI的ChatGPT和谷歌AlphaFold的LLM開發(fā)。
主要是,在進行預(yù)測或開發(fā)評估民粹主義的模型時,這破壞了生成式人工智能和數(shù)據(jù)分析。
就像任何其他行業(yè)一樣,生成式人工智能對數(shù)據(jù)分析行業(yè)產(chǎn)生了重大影響,并帶來了革命。它在評估和顯示信息方面至關(guān)重要且用途廣泛。從數(shù)據(jù)清理和處理到可視化,生成式人工智能為有效分析大型復(fù)雜數(shù)據(jù)集提供了新的切入點。
用于數(shù)據(jù)分析的生成式人工智能
生成式人工智能現(xiàn)在已經(jīng)為數(shù)據(jù)分析行業(yè)帶來了范式轉(zhuǎn)變。在處理和解釋各種數(shù)據(jù)時,它在認(rèn)知和分析系統(tǒng)中發(fā)揮著重要而多樣的作用。數(shù)據(jù)清理、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)解釋和數(shù)據(jù)可視化,是傳統(tǒng)人工智能方法不足的一些領(lǐng)域?,F(xiàn)在,人工智能的產(chǎn)生為從更大、更復(fù)雜的數(shù)據(jù)中獲取洞察力提供了新的可能性。
讓我們來看看生成式人工智能在數(shù)據(jù)分析領(lǐng)域探索的一些關(guān)鍵角色:
改進數(shù)據(jù)預(yù)處理和增強
數(shù)據(jù)挖掘周期包括許多階段,包括數(shù)據(jù)預(yù)處理,以便以可理解和可用的格式獲取數(shù)據(jù)。這個過程有幾個階段,包括數(shù)據(jù)清理、轉(zhuǎn)換、縮減和規(guī)范化,因此很有挑戰(zhàn)性。
生成訓(xùn)練模型的數(shù)據(jù)
對抗性人工智能可以生成完全虛假的數(shù)據(jù),而生成式人工智能技術(shù)可以生成在大多數(shù)情況下與原始數(shù)據(jù)源相似的虛假數(shù)據(jù)。這應(yīng)該在可用數(shù)據(jù)稀缺或受到隱私協(xié)議限制的情況下使用。
生成的合成數(shù)據(jù)可用作訓(xùn)練和開發(fā)ML模型的來源,而無需依賴共享敏感數(shù)據(jù)。這可以保證用戶數(shù)據(jù)的安全,并使大型企業(yè)能夠使用更大的數(shù)據(jù)集進行訓(xùn)練,從而獲得更好的模型。
自動化分析任務(wù)
商業(yè)智能和數(shù)據(jù)分析中的大多數(shù)活動可能需要重復(fù)投入時間和精力。菜單命令可以自動完成這項工作,但編碼需要時間和精力。使用生成式人工智能可以幫助開發(fā)任意數(shù)量的升級草案。
增強數(shù)據(jù)可視化
數(shù)據(jù)可視化是數(shù)據(jù)分析的一個重要方面,因為它有助于呈現(xiàn)數(shù)據(jù)。這種方法有助于吸引利益相關(guān)者,并通過創(chuàng)建漂亮的圖表、圖形甚至儀表板來提高做出正確決策的機會。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。