• 2025-02-18
    LLM 如何運作?用途是什麼?
  •  週次

     8

    主講人

    王旭笙

    日期

    20250218

    分享主題

    LLM 如何運作?用途是什麼?

    分享內容

            大型語言模型的工作原理是獲取大量的文本數據,從中學習單詞和句子之間的關係,訓練完畢後可用來分析現有文字的情感與意義或生成新的文本。而且隨著人工智慧的發展,模型能消化的數據集也越來越大,如此大量的文本使用無監督學習輸入人工智慧演算法進行訓練,當它被給予一個數據集而沒有明確的指令要如何處理它時,模型會自己學習單詞以及單詞和語句之間的關係與背後的概念。

     

    它就像掌握一門語言的知識人,可以猜測句子和段落接下來會發生什麼,甚至想出新的單詞和概念。例如它可以學會根據上下文判斷「感冒」究竟是指身體上的不舒服,還是對某人感到排斥,又或者你和它說「今天心情不好」,它可能會關心你是不是遇到不順心的事情或身體不舒服等等。此外,大型語言模型也可以針對特定用例進行定製,通過微調或提示調整等技術,向模型提供少量數據以針對特定應用程式進行訓練。

     

    因此,在AI底下,同樣的問題使用不同的語言或模型,得到的答案也不同。

    資料來源: 數位時代

我要
詢價