无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

人工智能通識(shí)課:深度學(xué)習(xí)

0
分享至

深度學(xué)習(xí)(Deep Learning)是機(jī)器學(xué)習(xí)的重要分支,也是當(dāng)前人工智能中最具代表性的技術(shù)路線之一。它以多層神經(jīng)網(wǎng)絡(luò)為核心,通過大量數(shù)據(jù)訓(xùn)練模型,使模型能夠自動(dòng)學(xué)習(xí)數(shù)據(jù)中的特征表示,并完成識(shí)別、預(yù)測、理解、生成和決策等復(fù)雜任務(wù)。


圖 1:深度學(xué)習(xí)在人工智能體系中的位置

如果說傳統(tǒng)機(jī)器學(xué)習(xí)常常依賴人工設(shè)計(jì)特征,那么深度學(xué)習(xí)更強(qiáng)調(diào)讓模型從數(shù)據(jù)中自動(dòng)學(xué)習(xí)特征。從圖像中的邊緣、紋理,到語音中的音素、語調(diào),再到文本中的詞義、語境,深度學(xué)習(xí)模型可以通過多層結(jié)構(gòu)逐步形成從低級特征到高級語義的表示。

因此,深度學(xué)習(xí)不只是若干算法的集合,而是一套圍繞數(shù)據(jù)表示、網(wǎng)絡(luò)結(jié)構(gòu)、參數(shù)學(xué)習(xí)、訓(xùn)練優(yōu)化、計(jì)算框架和真實(shí)應(yīng)用展開的完整技術(shù)體系。理解深度學(xué)習(xí),需要同時(shí)把握三個(gè)問題:模型如何表示數(shù)據(jù)?模型如何通過訓(xùn)練學(xué)習(xí)?不同網(wǎng)絡(luò)結(jié)構(gòu)適合解決哪些任務(wù)?

一、深度學(xué)習(xí)的基本思想

深度學(xué)習(xí)的基本思想,可以概括為一句話:用多層神經(jīng)網(wǎng)絡(luò)從數(shù)據(jù)中自動(dòng)學(xué)習(xí)有效表示。

在機(jī)器學(xué)習(xí)中,模型要完成預(yù)測或判斷,首先需要把輸入數(shù)據(jù)轉(zhuǎn)換成可計(jì)算的特征。例如,圖像可以表示為像素矩陣,語音可以表示為聲學(xué)信號,文本可以表示為詞、句子或向量。傳統(tǒng)方法往往依賴人工經(jīng)驗(yàn)提取特征,而深度學(xué)習(xí)則嘗試把“特征提取”和“任務(wù)預(yù)測”統(tǒng)一到一個(gè)模型中完成。

以圖像識(shí)別為例,深度神經(jīng)網(wǎng)絡(luò)的低層可能學(xué)習(xí)邊緣、角點(diǎn)、顏色變化等簡單特征;中間層可能學(xué)習(xí)紋理、局部形狀;高層則可能學(xué)習(xí)眼睛、輪廓、車輛部件、動(dòng)物身體結(jié)構(gòu)等更抽象的語義特征。模型越往后,表示通常越接近任務(wù)需要的高級概念。

這也是“深度”二字的含義:它不只是指網(wǎng)絡(luò)層數(shù)較多,更強(qiáng)調(diào)模型能夠通過多層變換逐級抽象數(shù)據(jù)結(jié)構(gòu)。

二、從神經(jīng)元到神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)是一類受生物神經(jīng)系統(tǒng)啟發(fā)而形成的計(jì)算模型。它并不是直接復(fù)制大腦,而是抽象出“神經(jīng)元接收信號、加權(quán)整合、產(chǎn)生輸出”的基本思想,并用數(shù)學(xué)方式模擬信息處理過程。

一個(gè)通常包括四個(gè)核心部分:

? 輸入:來自外部數(shù)據(jù)或上一層神經(jīng)元的信號,例如 x?、x?、x?

? 權(quán)重:表示不同輸入信號的重要程度,例如 w?、w?、w?

? 偏置:調(diào)整整體輸出位置,使模型表達(dá)更加靈活

? 激活函數(shù):決定加權(quán)求和之后如何產(chǎn)生輸出

其基本計(jì)算過程可以表示為:

其中,x? 表示第 i 個(gè)輸入特征,w? 表示該輸入對應(yīng)的權(quán)重,b 表示偏置,z 表示加權(quán)和。神經(jīng)元的最終輸出通常由 σ(z) 決定。

在早期的 M-P 神經(jīng)元模型中,神經(jīng)元會(huì)將輸入信號加權(quán)求和,并與閾值 θ 比較。當(dāng)加權(quán)和達(dá)到或超過閾值時(shí),神經(jīng)元被激活;否則不被激活。這個(gè)模型直觀地模擬了生物神經(jīng)元“是否觸發(fā)”的機(jī)制。


圖 2:人工神經(jīng)元與 M-P 模型示意圖

不過,M-P 模型存在明顯局限:權(quán)重和閾值通常需要人為指定。當(dāng)任務(wù)變復(fù)雜、網(wǎng)絡(luò)規(guī)模變大時(shí),人很難預(yù)先設(shè)置合適參數(shù)。因此,神經(jīng)網(wǎng)絡(luò)真正走向?qū)嵱茫P(guān)鍵在于讓模型能夠通過數(shù)據(jù)自動(dòng)學(xué)習(xí)參數(shù)。

三、感知器、多層感知器與非線性表達(dá)

感知器(Perceptron)是早期人工神經(jīng)網(wǎng)絡(luò)的重要模型。它在神經(jīng)元加權(quán)求和的基礎(chǔ)上引入了可學(xué)習(xí)的,使模型能夠根據(jù)訓(xùn)練數(shù)據(jù)調(diào)整參數(shù)。

感知器的基本形式為:

然后通過階躍函數(shù)或其他激活函數(shù)得到輸出結(jié)果:

從幾何角度看,單層感知器本質(zhì)上是在特征空間中尋找一個(gè)線性分類邊界。在二維平面中,這個(gè)邊界是一條直線;在三維空間中,它是一個(gè)平面;在更高維空間中,它是一個(gè)超平面。


圖 3:單層感知器與線性分類邊界

例如,邏輯與運(yùn)算可以由單層感知器完成。

只有當(dāng) x? = 1 且 x? = 1 時(shí),輸出才為 1;其他情況下輸出為 0。這類問題在特征空間中可以被一條直線分開,因此屬于線性可分問題。

但是,單層感知器無法處理所有問題。典型例子是異或(XOR)問題。

異或的輸出規(guī)律是:兩個(gè)輸入不同則輸出 1,兩個(gè)輸入相同則輸出 0。它的正負(fù)樣本在二維平面中無法被一條直線完全分開,因此單層感知器無法正確表示這種關(guān)系。


圖 4:異或問題與多層感知器的表達(dá)能力

為了解決這類非線性問題,人們開始將多個(gè)感知器連接起來,形成多層感知器(Multilayer Perceptron,MLP)。

多層結(jié)構(gòu)配合非線性激活函數(shù),使神經(jīng)網(wǎng)絡(luò)能夠表示更加復(fù)雜的函數(shù)關(guān)系。這正是現(xiàn)代深度神經(jīng)網(wǎng)絡(luò)的重要起點(diǎn)。

四、激活函數(shù):引入非線性能力

(Activation Function)是神經(jīng)網(wǎng)絡(luò)中的關(guān)鍵組成部分。它的核心作用是為模型引入非線性。

如果一個(gè)神經(jīng)網(wǎng)絡(luò)只有線性變換,而沒有非線性激活函數(shù),那么無論堆疊多少層,整體上仍然可以等價(jià)為一個(gè)線性函數(shù)。這樣一來,深層結(jié)構(gòu)就失去了意義。深度神經(jīng)網(wǎng)絡(luò)之所以能夠?qū)W習(xí)復(fù)雜模式,很大程度上依賴于激活函數(shù)帶來的非線性表達(dá)能力。


圖 5:常見激活函數(shù)對比

1、Sigmoid 函數(shù)

可以把任意實(shí)數(shù)映射到 0 到 1 之間,常用于二分類輸出層,用來表示某個(gè)類別的概率。

它的輸出范圍清晰,適合表達(dá)概率含義。但在深層網(wǎng)絡(luò)中,Sigmoid 容易出現(xiàn)梯度變小的問題,使前面層的參數(shù)更新變慢。

2、Tanh 函數(shù)

將輸入映射到 -1 到 1 之間。相比 Sigmoid,Tanh 以 0 為中心,在某些情況下更利于優(yōu)化。

3、ReLU 函數(shù)

(Rectified Linear Unit,線性整流單元)是深度學(xué)習(xí)中最常用的隱藏層激活函數(shù)之一。

當(dāng) z > 0 時(shí),ReLU 直接輸出 z;當(dāng) z ≤ 0 時(shí),輸出 0。它計(jì)算簡單、求導(dǎo)方便,能夠緩解深層網(wǎng)絡(luò)中的問題,因此在卷積神經(jīng)網(wǎng)絡(luò)和多層前饋網(wǎng)絡(luò)中被廣泛使用。

不過,ReLU 也可能出現(xiàn)“神經(jīng)元失活”現(xiàn)象:如果某些神經(jīng)元長期輸出 0,它們可能幾乎不再參與學(xué)習(xí)。Leaky ReLU 等變體正是為緩解這一問題而提出的。

4、Softmax 函數(shù)

常用于多分類任務(wù)的輸出層。它可以將多個(gè)輸出值轉(zhuǎn)換為一個(gè)概率分布,使所有類別概率之和為 1。

其中,z? 表示第 i 個(gè)類別對應(yīng)的輸出值,S? 表示第 i 個(gè)類別的預(yù)測概率,∑? e?? 表示所有類別指數(shù)值之和。

比如,在手寫數(shù)字識(shí)別中,輸出層通常有 10 個(gè)神經(jīng)元,分別對應(yīng)數(shù)字 0 到 9。經(jīng)過 Softmax 后,模型會(huì)給出每個(gè)數(shù)字類別的概率,概率最大的類別就是預(yù)測結(jié)果。

五、前饋神經(jīng)網(wǎng)絡(luò)與深度神經(jīng)網(wǎng)絡(luò)

(Feedforward Neural Network,FNN)是最基本的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)之一。所謂“前饋”,是指信息從輸入層開始,依次經(jīng)過隱藏層,最后到達(dá)輸出層,整體方向是從前向后流動(dòng)的。

一個(gè)典型前饋神經(jīng)網(wǎng)絡(luò)通常包含三類層:

? 輸入層:接收原始特征

? 隱藏層:對輸入進(jìn)行逐層變換和抽象

? 輸出層:給出最終預(yù)測結(jié)果


圖 6:前饋神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)

在相鄰層之間,如果每個(gè)神經(jīng)元都與下一層所有神經(jīng)元連接,這種結(jié)構(gòu)稱為(Fully Connected Layer)或線性層(Linear Layer)。

例如,在手寫數(shù)字識(shí)別任務(wù)中,可以將 28 × 28 的灰度圖像展平成 784 維向量,再輸入到若干全連接層中,最后輸出 10 個(gè)類別的概率。

如果隱藏層較少,通常稱為“淺層神經(jīng)網(wǎng)絡(luò)”;如果隱藏層很多,則稱為“深度神經(jīng)網(wǎng)絡(luò)”(Deep Neural Network,DNN)。

深度神經(jīng)網(wǎng)絡(luò)能夠通過多層結(jié)構(gòu)學(xué)習(xí)更復(fù)雜、更抽象的特征表示,因此在圖像、語音、文本、視頻等復(fù)雜數(shù)據(jù)任務(wù)中具有突出優(yōu)勢。

不過,網(wǎng)絡(luò)并不是越深越好。模型深度需要與數(shù)據(jù)規(guī)模、任務(wù)復(fù)雜度、計(jì)算資源、過擬合風(fēng)險(xiǎn)等因素相匹配。

過深的網(wǎng)絡(luò)如果缺乏合適訓(xùn)練方法,可能帶來梯度消失、訓(xùn)練困難和泛化能力下降等問題。(ResNet)等結(jié)構(gòu)正是為解決深層網(wǎng)絡(luò)訓(xùn)練困難而提出的重要方法。

六、深度神經(jīng)網(wǎng)絡(luò)如何學(xué)習(xí)

神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,本質(zhì)上是通過數(shù)據(jù)不斷調(diào)整參數(shù),使模型輸出盡量接近真實(shí)結(jié)果。這個(gè)過程通常圍繞“前向傳播、損失計(jì)算、反向傳播、參數(shù)更新”四個(gè)步驟展開。


圖 7:神經(jīng)網(wǎng)絡(luò)訓(xùn)練閉環(huán)

1、前向傳播

(Forward Propagation,F(xiàn)P)是指輸入數(shù)據(jù)從輸入層進(jìn)入網(wǎng)絡(luò),經(jīng)過一層層計(jì)算,最終得到預(yù)測結(jié)果的過程。

例如,圖像分類模型接收一張圖片,經(jīng)過卷積層、激活函數(shù)、池化層、全連接層等處理,最后輸出每個(gè)類別的預(yù)測概率。

2、損失計(jì)算

模型預(yù)測結(jié)果通常不會(huì)一開始就準(zhǔn)確,因此需要用(Loss Function)衡量預(yù)測值與真實(shí)標(biāo)簽之間的差距。

回歸任務(wù)中常用(Mean Squared Error,MSE):

其中,n 表示樣本數(shù)量,y? 表示第 i 個(gè)樣本的真實(shí)值,?? 表示第 i 個(gè)樣本的預(yù)測值。

分類任務(wù)中常用(Cross-Entropy Loss),用于衡量預(yù)測概率分布與真實(shí)類別之間的差異。對于單個(gè)樣本,其基本形式可以表示為:

其中,C 表示類別數(shù)量,y? 表示真實(shí)標(biāo)簽在第 i 個(gè)類別上的取值,?? 表示模型預(yù)測該類別的概率。

損失函數(shù)越小,說明模型預(yù)測結(jié)果與真實(shí)結(jié)果越接近;損失函數(shù)越大,說明模型還需要繼續(xù)調(diào)整參數(shù)。

3、反向傳播

(Back Propagation,BP)是深度學(xué)習(xí)訓(xùn)練的核心算法之一。它利用,從輸出層向前逐層計(jì)算損失函數(shù)對各個(gè)參數(shù)的。

梯度表示:當(dāng)某個(gè)參數(shù)發(fā)生微小變化時(shí),損失函數(shù)會(huì)如何變化。模型訓(xùn)練的目標(biāo)是讓損失變小,因此參數(shù)通常沿著梯度的反方向更新。

4、參數(shù)更新

(Optimizer)負(fù)責(zé)根據(jù)梯度更新網(wǎng)絡(luò)參數(shù)。最基本的更新思想可以表示為:

其中,θ 表示模型參數(shù),η 表示學(xué)習(xí)率,?θL 表示損失函數(shù) L 對參數(shù) θ 的梯度。

(Learning Rate)控制每次更新的步長。

學(xué)習(xí)率過大,可能導(dǎo)致訓(xùn)練不穩(wěn)定甚至發(fā)散;學(xué)習(xí)率過小,則可能導(dǎo)致訓(xùn)練速度過慢。

在實(shí)際訓(xùn)練中,常見優(yōu)化方法包括:

? 批量梯度下降:每次使用全部樣本計(jì)算梯度,穩(wěn)定但計(jì)算開銷大

? 隨機(jī)梯度下降:每次使用一個(gè)樣本更新參數(shù),速度快但波動(dòng)大

? 小批量梯度下降:每次使用一小批樣本更新參數(shù),是深度學(xué)習(xí)中最常見的方式

? Adam:結(jié)合動(dòng)量和自適應(yīng)學(xué)習(xí)率機(jī)制,是當(dāng)前應(yīng)用較廣泛的優(yōu)化器之一

深度學(xué)習(xí)訓(xùn)練就是在這個(gè)閉環(huán)中不斷迭代:模型先預(yù)測,再計(jì)算誤差,再根據(jù)誤差調(diào)整參數(shù),直到模型逐漸學(xué)到數(shù)據(jù)中的有效規(guī)律。

七、深度學(xué)習(xí)框架與 PyTorch

現(xiàn)代深度學(xué)習(xí)模型通常包含大量參數(shù),訓(xùn)練過程涉及矩陣運(yùn)算、自動(dòng)求導(dǎo)、GPU 加速、模型保存與部署等復(fù)雜工作。如果完全手寫這些底層過程,不僅效率低,而且容易出錯(cuò)。因此,深度學(xué)習(xí)框架成為深度學(xué)習(xí)工程實(shí)踐的基礎(chǔ)工具。

常見深度學(xué)習(xí)框架包括 TensorFlow、PyTorch、PaddlePaddle、MindSpore 等。其中,PyTorch 由于編程風(fēng)格直觀、動(dòng)態(tài)圖機(jī)制靈活、生態(tài)活躍,在教學(xué)、研究和快速原型開發(fā)中被廣泛使用。


圖 8:PyTorch 深度學(xué)習(xí)工作流

1、Tensor:深度學(xué)習(xí)中的基本數(shù)據(jù)結(jié)構(gòu)

在 PyTorch 中,張量(Tensor)是最核心的數(shù)據(jù)結(jié)構(gòu)。它可以表示標(biāo)量、向量、矩陣以及更高維數(shù)組。

例如:

? 一個(gè)數(shù)值可以看作 0 維張量

? 一組數(shù)值可以看作 1 維張量

? 表格數(shù)據(jù)或灰度圖像可以看作 2 維張量

? 彩色圖像可以看作 3 維張量

? 視頻數(shù)據(jù)還可以擴(kuò)展為 4 維或更高維張量

Tensor 與 NumPy 數(shù)組類似,但它還支持 GPU 加速和自動(dòng)求導(dǎo),因此更適合深度學(xué)習(xí)訓(xùn)練。

2、自動(dòng)微分:讓梯度計(jì)算自動(dòng)完成

深度學(xué)習(xí)訓(xùn)練離不開求導(dǎo)。PyTorch 的機(jī)制可以自動(dòng)跟蹤計(jì)算過程,并在調(diào)用 backward() 時(shí)計(jì)算梯度。

只要某個(gè) Tensor 設(shè)置了 requires_grad=True,相關(guān)運(yùn)算就會(huì)被記錄下來,反向傳播后梯度會(huì)保存到 .grad 屬性中。

這意味著開發(fā)者不需要手工推導(dǎo)每個(gè)參數(shù)的偏導(dǎo)數(shù),而可以把更多精力放在模型結(jié)構(gòu)、數(shù)據(jù)處理和實(shí)驗(yàn)設(shè)計(jì)上。

3、神經(jīng)網(wǎng)絡(luò)訓(xùn)練的一般步驟

使用 PyTorch 訓(xùn)練神經(jīng)網(wǎng)絡(luò),一般包括以下步驟:

(1)準(zhǔn)備數(shù)據(jù),并轉(zhuǎn)換為 Tensor;

(2)定義模型結(jié)構(gòu),通常繼承 nn.Module;

(3)選擇損失函數(shù),例如 MSELoss 或 CrossEntropyLoss;

(4)選擇優(yōu)化器,例如 SGD 或 Adam;

(5)執(zhí)行訓(xùn)練循環(huán):前向傳播、計(jì)算損失、梯度清零、反向傳播、參數(shù)更新;

(6)在驗(yàn)證集或測試集上評估模型;

(7)保存模型參數(shù)或完整模型。

這個(gè)流程體現(xiàn)了深度學(xué)習(xí)工程實(shí)踐的基本閉環(huán):數(shù)據(jù)進(jìn)入模型,損失指導(dǎo)學(xué)習(xí),優(yōu)化器更新參數(shù),評估檢驗(yàn)效果。

八、典型深度網(wǎng)絡(luò)結(jié)構(gòu)

深度學(xué)習(xí)并不是只有一種網(wǎng)絡(luò)結(jié)構(gòu)。不同任務(wù)的數(shù)據(jù)特點(diǎn)不同,適合的網(wǎng)絡(luò)結(jié)構(gòu)也不同。典型深度網(wǎng)絡(luò)可以從三個(gè)方向理解:空間特征提取、序列建模和生成建模。


圖 9:典型深度網(wǎng)絡(luò)結(jié)構(gòu)對比

1、卷積神經(jīng)網(wǎng)絡(luò):面向圖像與空間結(jié)構(gòu)

(Convolutional Neural Network,CNN)主要用于處理具有空間結(jié)構(gòu)的數(shù)據(jù),尤其是圖像。

圖像不是普通的一維特征表,而是具有局部結(jié)構(gòu)的二維或三維數(shù)據(jù)。相鄰像素之間存在空間關(guān)系,局部區(qū)域中可能包含邊緣、紋理、形狀等視覺信息。

CNN 的核心思想是:通過在局部區(qū)域上滑動(dòng),逐步提取局部特征,再將局部特征組合成更高級的整體表示。


圖 10:CNN 的卷積、池化與分類流程

CNN 通常包含以下結(jié)構(gòu):

? :通過卷積核提取局部特征

? :引入非線性,常用 ReLU

? :降低特征圖尺寸,減少計(jì)算量并增強(qiáng)局部穩(wěn)定性

? :整合高層特征并輸出分類或預(yù)測結(jié)果

CNN 廣泛應(yīng)用于圖像分類、目標(biāo)檢測、人臉識(shí)別、醫(yī)學(xué)影像分析、自動(dòng)駕駛、視頻分析、工業(yè)檢測和 OCR 文字識(shí)別等場景。

2、循環(huán)神經(jīng)網(wǎng)絡(luò):面向序列與時(shí)間依賴

(Recurrent Neural Network,RNN)主要用于處理序列數(shù)據(jù),例如文本、語音、時(shí)間序列、傳感器數(shù)據(jù)等。

序列數(shù)據(jù)的特點(diǎn)是:當(dāng)前信息往往與前面的信息有關(guān)。

例如,在一句話中,一個(gè)詞的含義可能依賴前文;在語音識(shí)別中,當(dāng)前聲音片段也與前后聲音有關(guān);在天氣預(yù)測、設(shè)備故障預(yù)測等任務(wù)中,當(dāng)前狀態(tài)通常與歷史狀態(tài)存在聯(lián)系。

RNN 的核心思想是引入隱藏狀態(tài)(Hidden State),讓模型在處理當(dāng)前輸入時(shí)保留前面時(shí)間步的信息。


圖 11:RNN 的序列建模過程

簡單來說,RNN 在每個(gè)時(shí)間步都會(huì)接收當(dāng)前輸入 x?,同時(shí)結(jié)合上一個(gè)時(shí)間步的隱藏狀態(tài) h???,得到新的隱藏狀態(tài) h?。這樣,模型就具備了一定的“記憶”能力。

不過,普通 RNN 在長序列中容易出現(xiàn)或問題,因此后來發(fā)展出 (長短期記憶網(wǎng)絡(luò))、(門控循環(huán)單元)等改進(jìn)結(jié)構(gòu)。它們通過門控機(jī)制控制信息保留與遺忘,使模型能夠更好地處理較長距離的依賴關(guān)系。

3、生成模型:從識(shí)別走向創(chuàng)造

傳統(tǒng)深度學(xué)習(xí)模型多用于識(shí)別和預(yù)測,例如判斷圖像中是什么、預(yù)測用戶是否點(diǎn)擊、識(shí)別語音內(nèi)容等。而生成模型(Generative Model)的目標(biāo)是學(xué)習(xí)數(shù)據(jù)分布,并生成新的數(shù)據(jù)樣本。

典型生成模型包括(Generative Adversarial Network,GAN)和(Diffusion Model)。

GAN 包含兩個(gè)部分:

? 生成器:負(fù)責(zé)生成盡量逼真的樣本

? 判別器:負(fù)責(zé)判斷樣本是真實(shí)數(shù)據(jù)還是生成數(shù)據(jù)

二者在對抗中共同提升:生成器努力騙過判別器,判別器努力識(shí)別真假樣本。經(jīng)過不斷訓(xùn)練,生成器可以生成越來越逼真的圖像、語音或其他數(shù)據(jù)。


圖 12:從 GAN 到擴(kuò)散模型

擴(kuò)散模型則采用另一種思路:先逐步向真實(shí)數(shù)據(jù)中加入噪聲,再學(xué)習(xí)如何從噪聲中逐步還原數(shù)據(jù)。近年來,擴(kuò)散模型在圖像生成、圖像編輯、視頻生成等任務(wù)中表現(xiàn)突出。

生成模型的應(yīng)用非常廣泛,包括創(chuàng)意圖像生成、圖像修復(fù)、超分辨率重建、視頻生成、語音合成、音樂生成、文本生成、代碼生成、分子設(shè)計(jì)、工業(yè)設(shè)計(jì)、科學(xué)仿真和數(shù)據(jù)增強(qiáng)等。

九、深度學(xué)習(xí)的典型應(yīng)用

深度學(xué)習(xí)的價(jià)值不僅體現(xiàn)在模型結(jié)構(gòu)上,更體現(xiàn)在它能夠解決大量真實(shí)問題。不同數(shù)據(jù)類型、不同任務(wù)目標(biāo)和不同應(yīng)用場景,往往會(huì)對應(yīng)不同的網(wǎng)絡(luò)結(jié)構(gòu)與訓(xùn)練策略。


圖 13:深度學(xué)習(xí)典型應(yīng)用場景圖譜

1、圖像識(shí)別與人臉識(shí)別

在圖像識(shí)別中,深度學(xué)習(xí)模型可以自動(dòng)學(xué)習(xí)圖像中的局部紋理、邊緣、形狀和高級語義特征。

人臉識(shí)別則進(jìn)一步關(guān)注人臉區(qū)域檢測、特征提取與身份匹配,常用于身份驗(yàn)證、門禁系統(tǒng)、安防檢索等場景。

2、語音識(shí)別與語音合成

語音識(shí)別需要把連續(xù)聲音信號轉(zhuǎn)換為文字,涉及聲學(xué)特征提取、序列建模和語言建模。

語音合成則反向生成自然語音,使機(jī)器能夠以接近人類的方式表達(dá)文本內(nèi)容。

3、推薦系統(tǒng)

推薦系統(tǒng)需要根據(jù)用戶行為、物品特征、上下文信息預(yù)測用戶偏好。

深度學(xué)習(xí)能夠?qū)W習(xí)復(fù)雜的用戶興趣表示與物品表示,在短視頻推薦、商品推薦、新聞推薦、音樂推薦等領(lǐng)域被廣泛使用。

4、教育分析與學(xué)習(xí)預(yù)警

在教育場景中,深度學(xué)習(xí)可以分析學(xué)習(xí)行為數(shù)據(jù)、作業(yè)完成情況、測試成績、平臺(tái)訪問記錄等信息,用于學(xué)習(xí)狀態(tài)評估、成績預(yù)測、風(fēng)險(xiǎn)預(yù)警和個(gè)性化學(xué)習(xí)支持。

5、醫(yī)學(xué)影像與輔助診斷

在醫(yī)學(xué)領(lǐng)域,CNN 等模型可以用于 X 光、CT、MRI、病理圖像等影像分析,輔助醫(yī)生發(fā)現(xiàn)病灶、定位異常區(qū)域或進(jìn)行風(fēng)險(xiǎn)評估。

由于醫(yī)療場景對安全性和可靠性要求極高,模型解釋性、數(shù)據(jù)質(zhì)量和臨床驗(yàn)證尤為重要。

6、內(nèi)容生成與智能創(chuàng)作

生成式模型使人工智能從“理解數(shù)據(jù)”進(jìn)一步走向“生成數(shù)據(jù)”。它可以根據(jù)文字生成圖像、根據(jù)提示生成文章、根據(jù)描述生成代碼,也可以輔助音樂、視頻、產(chǎn)品外觀和科學(xué)實(shí)驗(yàn)數(shù)據(jù)的生成。

十、深度學(xué)習(xí)的能力邊界與學(xué)習(xí)建議

深度學(xué)習(xí)非常強(qiáng)大,但并不是萬能方法。它通常依賴較大規(guī)模的數(shù)據(jù)、較強(qiáng)的計(jì)算資源和較規(guī)范的訓(xùn)練流程。

如果數(shù)據(jù)質(zhì)量較差、樣本數(shù)量不足、標(biāo)簽存在偏差,模型可能學(xué)到錯(cuò)誤規(guī)律。

若只追求模型復(fù)雜度而忽視任務(wù)目標(biāo),也容易造成過擬合、資源浪費(fèi)或結(jié)果不可解釋。

學(xué)習(xí)深度學(xué)習(xí)時(shí),應(yīng)重點(diǎn)把握以下主線。

第一,理解神經(jīng)網(wǎng)絡(luò)如何表示問題。

輸入、權(quán)重、偏置、激活函數(shù)和層結(jié)構(gòu)共同決定了模型的表達(dá)能力。

第二,理解神經(jīng)網(wǎng)絡(luò)如何通過數(shù)據(jù)學(xué)習(xí)。

前向傳播、損失函數(shù)、反向傳播和優(yōu)化器構(gòu)成了訓(xùn)練過程的核心閉環(huán)。

第三,理解不同網(wǎng)絡(luò)結(jié)構(gòu)適合不同數(shù)據(jù)。

CNN 更適合圖像等空間結(jié)構(gòu)數(shù)據(jù),RNN 及其變體更適合序列數(shù)據(jù),生成模型則適合內(nèi)容生成和數(shù)據(jù)分布建模。

第四,理解框架是工具而不是目標(biāo)。

PyTorch、TensorFlow 等框架能夠提高開發(fā)效率,但真正重要的是理解模型結(jié)構(gòu)、訓(xùn)練流程和任務(wù)需求之間的關(guān)系。

第五,理解深度學(xué)習(xí)系統(tǒng)需要工程化支撐。

真實(shí)項(xiàng)目不僅包括模型訓(xùn)練,還包括數(shù)據(jù)采集、預(yù)處理、評估、部署、監(jiān)控、安全與倫理等環(huán)節(jié)。

小結(jié)

深度學(xué)習(xí)以多層神經(jīng)網(wǎng)絡(luò)為核心,通過數(shù)據(jù)驅(qū)動(dòng)的方式自動(dòng)學(xué)習(xí)特征表示。理解神經(jīng)元、感知器、激活函數(shù)、前饋網(wǎng)絡(luò)、反向傳播和優(yōu)化器,是學(xué)習(xí)深度學(xué)習(xí)的基礎(chǔ);進(jìn)一步掌握 CNN、RNN、生成模型與深度學(xué)習(xí)框架,有助于理解深度學(xué)習(xí)在真實(shí)任務(wù)中的應(yīng)用方式。

點(diǎn)贊有美意,贊賞是鼓勵(lì)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
財(cái)務(wù)造假!10家A股公司退市,超25萬股東踩雷

財(cái)務(wù)造假!10家A股公司退市,超25萬股東踩雷

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-06-12 18:59:56
普京再次回應(yīng)戰(zhàn)爭起源:不是俄開戰(zhàn),是基輔先向頓巴斯開火

普京再次回應(yīng)戰(zhàn)爭起源:不是俄開戰(zhàn),是基輔先向頓巴斯開火

桂系007
2026-06-12 23:57:08
美加墨世界杯第二場比賽就現(xiàn)空座,票價(jià)爭議浮出水面

美加墨世界杯第二場比賽就現(xiàn)空座,票價(jià)爭議浮出水面

澎湃新聞
2026-06-12 17:40:29
剛剛,人類歷史上首位萬億美元富豪誕生!

剛剛,人類歷史上首位萬億美元富豪誕生!

每日經(jīng)濟(jì)新聞
2026-06-12 22:32:06
英媒一語驚人:中美貿(mào)易戰(zhàn)中,美國唯獨(dú)算錯(cuò)的是中國的底牌!

英媒一語驚人:中美貿(mào)易戰(zhàn)中,美國唯獨(dú)算錯(cuò)的是中國的底牌!

流史歲月
2026-06-12 18:30:08
現(xiàn)在的年輕人不敢開房了

現(xiàn)在的年輕人不敢開房了

微微熱評
2026-06-13 00:53:53
看完世界杯第2場,球迷看清了3個(gè)不爭事實(shí),韓國最擅長踢歐洲球隊(duì)

看完世界杯第2場,球迷看清了3個(gè)不爭事實(shí),韓國最擅長踢歐洲球隊(duì)

侃球熊弟
2026-06-12 11:56:01
CCTV5直播!世界杯“重頭戲”,超21億歐元對決,姆巴佩PK哈蘭德

CCTV5直播!世界杯“重頭戲”,超21億歐元對決,姆巴佩PK哈蘭德

麥子的籃球故事
2026-06-12 17:40:17
阿里高層這次真的生氣了

阿里高層這次真的生氣了

一見財(cái)經(jīng)
2026-06-12 11:11:21
國安部披露:在我國某海域發(fā)現(xiàn)有較大型活體海洋動(dòng)物被掛上傳感器,竊取海洋敏感數(shù)據(jù)

國安部披露:在我國某海域發(fā)現(xiàn)有較大型活體海洋動(dòng)物被掛上傳感器,竊取海洋敏感數(shù)據(jù)

每日經(jīng)濟(jì)新聞
2026-06-12 13:16:05
中國斷供稀土5個(gè)多月,日本工廠無一停產(chǎn),是真擺脫了還是在硬撐

中國斷供稀土5個(gè)多月,日本工廠無一停產(chǎn),是真擺脫了還是在硬撐

次元君情感
2026-06-01 14:27:53
63歲阿湯哥被曝“越老越瘋”,同行都看不下去了

63歲阿湯哥被曝“越老越瘋”,同行都看不下去了

生活觀察員啊
2026-06-11 01:22:03
打臉CBA,懷特塞德高調(diào)加入其他聯(lián)賽沒有傷病,上海隊(duì)陷入爭議

打臉CBA,懷特塞德高調(diào)加入其他聯(lián)賽沒有傷病,上海隊(duì)陷入爭議

宗介說體育
2026-06-12 16:35:22
美軍開始空襲伊朗

美軍開始空襲伊朗

財(cái)聯(lián)社
2026-06-11 05:42:11
劉宇寧發(fā)文回應(yīng)戀情:清醒坦蕩的態(tài)度,才是明星該有的模樣

劉宇寧發(fā)文回應(yīng)戀情:清醒坦蕩的態(tài)度,才是明星該有的模樣

陳意小可愛
2026-06-13 00:50:31
“張雪機(jī)車”獲得WSBK艾米利亞-羅馬涅站桿位賽第三名

“張雪機(jī)車”獲得WSBK艾米利亞-羅馬涅站桿位賽第三名

極目新聞
2026-06-12 23:00:07
中央開始嚴(yán)查,多地機(jī)關(guān)事業(yè)單位大整頓啟動(dòng),這幾類人受影響最大

中央開始嚴(yán)查,多地機(jī)關(guān)事業(yè)單位大整頓啟動(dòng),這幾類人受影響最大

職場資深秘書
2026-06-12 14:47:02
老人入住精神病院7年后查出梅毒;哈爾濱精神專科白漁泡醫(yī)院稱系舊疾,家屬出示入院前梅毒陰性檢測報(bào)告反駁

老人入住精神病院7年后查出梅毒;哈爾濱精神專科白漁泡醫(yī)院稱系舊疾,家屬出示入院前梅毒陰性檢測報(bào)告反駁

大風(fēng)新聞
2026-06-12 12:12:20
內(nèi)塔尼亞胡:特朗普不打伊朗了,沒提前告訴我

內(nèi)塔尼亞胡:特朗普不打伊朗了,沒提前告訴我

政知新媒體
2026-06-12 19:06:11
謝娜再次翻車,這一次,她踢到鐵板了

謝娜再次翻車,這一次,她踢到鐵板了

桌子的生活觀
2026-06-12 11:58:27
2026-06-13 02:35:00
MediaTea
MediaTea
專業(yè)的數(shù)字媒體、新媒體技術(shù)
1888文章數(shù) 80關(guān)注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

美加墨世界杯第二場比賽就現(xiàn)空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場比賽就現(xiàn)空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個(gè)瓜,肖戰(zhàn)熱巴最意外

財(cái)經(jīng)要聞

萬億美元順差背后,透露這些信號

汽車要聞

標(biāo)配激光雷達(dá)/雙動(dòng)力可選 昊鉑S600限時(shí)售17.99萬起

態(tài)度原創(chuàng)

親子
時(shí)尚
教育
本地
藝術(shù)

親子要聞

給孩子報(bào)個(gè)幼兒園還要工資流水?難道這就是傳說中的“因財(cái)施教”

夏天別總穿一身白或一身黑!試試一半彩色、一半基礎(chǔ)色,高級亮眼

教育要聞

家長成了“瘋女人”,被女兒作業(yè)搞崩潰,網(wǎng)友:太真實(shí)

本地新聞

AK劉彰邂逅河北南大港濕地

藝術(shù)要聞

砸了640億,再賠160億!沙特“The Line”項(xiàng)目徹底涼了?

無障礙瀏覽 進(jìn)入關(guān)懷版