分享園地 | 凌特國際股份有限公司

2025-02-18
LLM 如何運作？用途是什麼？

週次

主講人

王旭笙

日期

20250218

分享主題

LLM 如何運作？用途是什麼？

分享內容

大型語言模型的工作原理是獲取大量的文本數據，從中學習單詞和句子之間的關係，訓練完畢後可用來分析現有文字的情感與意義或生成新的文本。而且隨著人工智慧的發展，模型能消化的數據集也越來越大，如此大量的文本使用無監督學習輸入人工智慧演算法進行訓練，當它被給予一個數據集而沒有明確的指令要如何處理它時，模型會自己學習單詞以及單詞和語句之間的關係與背後的概念。

它就像掌握一門語言的知識人，可以猜測句子和段落接下來會發生什麼，甚至想出新的單詞和概念。例如它可以學會根據上下文判斷「感冒」究竟是指身體上的不舒服，還是對某人感到排斥，又或者你和它說「今天心情不好」，它可能會關心你是不是遇到不順心的事情或身體不舒服等等。此外，大型語言模型也可以針對特定用例進行定製，通過微調或提示調整等技術，向模型提供少量數據以針對特定應用程式進行訓練。

因此，在AI底下，同樣的問題使用不同的語言或模型，得到的答案也不同。

資料來源: 數位時代

回上一頁