統計學習與深度學習(盧信銘教授教學) week 13－戰昇的部落格

以下是 Week 13 的上課心得整理：

重點整理

1. 循環神經網路（Recurrent Neural Network, RNN）的基本概念

- 適用場景：

- 處理時序數據或序列相關的數據（例如：語言模型、時間序列預測）。

- 與回歸或分類不同，數據間的順序對結果有重要影響。

- RNN 的特性：

- 能夠記住過去的信息並應用於當前輸出。

- 通過 Back Propagation Through Time（BPTT）進行梯度更新，但可能面臨梯度消失或爆炸問題。

2. 增強型 RNN

- LSTM（長短期記憶網路）：

- 引入記憶單元（Cell State），能夠長期保留或忘記信息。

- 由三個門組成：

- 忘記門（Forget Gate）：選擇需丟棄的過去信息。

- 輸入門（Input Gate）：決定新的信息進入多少。

- 輸出門（Output Gate）：控制輸出的內容。

- GRU（門控循環單元）：

- 簡化版的 LSTM，使用更新門（Update Gate）和重置門（Reset Gate）。

- 參數較少，收斂速度更快。

3. 語言模型與序列建模

- 語言模型的基本思想：

- 基於條件概率生成語言序列。

- 使用 n-gram 模型或深度學習方法來估算條件概率。

- 評估語言模型：

- 使用困惑度（Perplexity）作為指標，越低表示模型越好。

- 困惑度 k 相當於隨機選擇 k 個單詞的難度。

- 應用：

- 語言生成、機器翻譯、情感分析等。

4. Bidirectional RNN 與正規化方法

- 雙向 RNN：

- 同時考慮數據的前向與後向序列，適合需要整體語境的任務。

- 正規化方法：

- Dropout：防止過擬合。

- Variational Dropout：在序列建模中應用更穩定的 Dropout。

心得總結

這週課程對 RNN 的核心概念與實踐應用進行了深入講解，特別是 LSTM 和 GRU 的結構設計與應用場景分析。課堂內容讓我理解到這些增強型 RNN 如何克服基本 RNN 的局限性，如梯度消失問題。此外，困惑度的引入提供了一種直觀的方法來評估語言模型的效能。我認為，RNN 技術在處理序列數據方面具有極大潛力，特別是在自然語言處理和時間序列分析等領域。未來，我希望能通過實作進一步探索這些模型在不同場景中的性能表現。

戰昇

戰昇的部落格

戰昇發表在痞客邦留言(0) 人氣()

E-mail轉寄

戰昇的部落格

統計學習與深度學習(盧信銘教授教學) week 13

歷史上的今天

留言列表

熱門文章

文章分類

轉移 (1)

【台大課程】 (5)

程式解題 (2)

理財觀念 (1)

台股盤後分析 (3)

市場 (1)

【chatgpt】 (1)

加密貨幣 (1)

優惠活動 (1)

【學測分科歷屆】 (6)

大學微積分 (2)

家教進度 (7)

歷屆詳解 (3)

日文學習 (1)

英文學習 (7)

期末再來放 (3)

紙牌遊戲 (1)

【統計相關程式】 (1)

【程式設計】 (1)

【家教相關】 (3)

【教育與學習】 (9)

【python學習】 (4)

【休閒娛樂】 (1)

【理財投資】 (2)

【網路行銷】 (5)

【大學相關】 (3)

【文書處理】 (2)

【個人成長】 (2)

我的秘密 (2)

網路行銷 (2)

程式設計 (3)

資訊學習應用 (5)

宗教與經典 (2)

議題討論 (2)

社會政論 (3)

學習與運用 (2)

課程介紹 (1)

看抖音學習 (2)

名人系列 (1)

神秘系列 (1)

武漢肺炎 (1)

U8介紹 (3)

大學課程 (7)

升學資訊 (7)

區塊鍊 (3)

綜藝節目 (2)

書籍介紹與分析 (7)

有趣事物 (1)

網路經營與賺錢 (10)

戰昇老師分享 (12)

食記與旅遊 (4)

笑話與廢文 (5)

升學與外語學習 (8)

影論與生活 (5)

心情與夢境 (4)

大學生活 (7)

財經與文書處理 (9)

最新文章

最新留言

文章精選

誰來我家

動態訂閱