LLMとは:用語解説
LLM(大規模言語モデル)とは
LLMとは、Large Language Modelの略で大規模言語モデルを指します。ChatGPTに代表される、生成AI(人工知能)の一種です。インターネット上の膨大なテキストデータを学習することで、単語のつながりや文脈のパターンを習得しています。「大規模」という名前の通り、従来のAIと比べて学習する「データ量」や「計算量」が桁違いに大きい点が特徴です。この膨大な知識を基に、ユーザーの指示を理解し、質問への応答、文章の要約、翻訳、会話といった、様々な言語タスクを人間に近い流暢さで実行することができます。
LLM(大規模言語モデル)と生成AIの違い
LLMと生成AIの違いは「全体」と「部分」の関係
LLMは生成AIの一種であり、生成AI(Generative AI)の中核を担う重要な技術です。
●生成AIとは:
文章、画像、音声、プログラムコードといった、まったく新しいコンテンツを自ら「生成」できるAI技術の総称。文章生成AI、画像生成AI、音楽生成AIなど、目的別に様々な種類が存在。
●LLMとは:
生成AIの中でも、特に「言語」の処理に特化し、人間のように自然な文章を生成したり、要約したり、翻訳したりする能力を持つAIモデル。膨大なテキストデータを学習することで、単語や文脈の関係性を理解し、自然な言葉を紡ぎ出す。最近では、LLMに画像も合わせて学習させて、パワーポイントなどの画像付きのコンテンツを解釈するマルチモーダル対応が進んできている。
LLMの仕組み
LLMは以下の仕組みによって、人間のように自然な文章を生成することができます。
1.事前学習:
まず、膨大なテキストデータを学習させます。LLMはインターネット上のWebサイトや書籍、論文など、世界中の膨大な量のテキストデータを「教科書」として読み込みます。この段階でLLMが学んでいるのは「ある単語の次には、どの単語が来る確率が最も高いか」という、単語と単語のつながりのパターンです。例えば「明日の天気は」という文章の後には「晴れ」や「雨」が来やすい、といった統計的な関係性を無数に学習します。
2.ファインチューニング:
事前学習では、インターネット上の一般的なデータに基づいて学習させるため、不正確な情報に基づいて文脈に合わない回答をすることがあります。そこで、より人間にとって自然で役立つ応答ができるように、対象となる業務領域のデータを追加で学習させ、調整を行います。例えば、サプライチェーン業務に特化したデータを追加学習させることで、よりサプライチェーンに役に立つLLMを作ることができます。このファインチューニングを経ることで、LLMはよりユーザーの質問の意図を汲んだ回答を生成できるようになります。
3.推論:
ユーザーが質問や指示(プロンプト)を入力すると、LLMは稼働を開始します。学習した膨大な知識の中から、与えられた指示に最も適合する単語のつながりを確率的かつ高速に予測し、次に来る単語を一つひとつ選びながら文章を組み立てていきます。LLMは、「大量のデータ学習」と「人間による微調整」を基に、確率的な予測を繰り返すことで、驚くほど自然な文章を生成しています。指示に応じて文章を生成できるのは、この推論によるものです。
LLMの一般的な活用事例
LLMは、指示の出し方(プロンプト)を工夫することで、アイデア出し、文章の作成、情報収集や分析など、様々な「考える仕事」を劇的に効率化できます。単純作業を自動化してコア業務に集中する、あるいはアイデアの壁打ち相手として新たな発想を得るなど、その可能性は無限大です。
ビジネスシーン)生産性の劇的な向上や、新しいアイデアの創出が期待できます。
- 情報収集・資料作成を劇的に高速化:会議議事録の要約やリサーチ業務において、膨大な情報から要点を的確に抽出し、時間のかかる資料作成を高速化します。
- コミュニケーションの円滑化:専門用語や微妙なニュアンスまで汲み取った高精度かつ自然な翻訳により、文章作成の負荷を大幅に軽減し、多言語コミュニケーションを実現します。
- 創造性を刺激:優れた壁打ち相手としてアイデア創出を促し、SNS投稿などの原案を複数生成することで、コンテンツ制作をはじめとするクリエイティブ業務を加速します。
- ソフトウェア開発の効率化:自然言語によるコード生成からデバッグまで、ソフトウェア開発のあらゆる工程を効率化し、開発サイクルの劇的な短縮を実現します。
日常生活シーン)私たちの暮らしを豊かにする使い方も広がっています。
- 学習支援:難しい専門用語を解説させたり、外国語学習の会話相手にしたりできる
- 情報検索:複数のWebサイトを自分で比較する代わりに「〇〇と△△の違いを教えて」と質問するだけで、要点をまとめて回答できる
- 創作活動のパートナー: 小説のあらすじ作りや、旅行プランの立案、献立など、クリエイティブな活動のヒントを得ることができる
富士通が提供するLLM活用の主な特長
富士通は、カスタマイズ性やセキュアである必要性がある企業ユーザーのニーズにフォーカスし、プライベート環境でセキュアに利用可能なエンタープライズ向け大規模言語モデルであるTakaneを提供します。
Takaneは、世界最高レベルの日本語処理能力を持つ特化型LLMとしてCohere社と共同開発し、2024年9月に提供を開始しました。
金融や官公庁、R&D部門など、高度なセキュリティを必要とするお客様向けにプライベート環境での利用できるほか、機密性の高い業務データを安全に生成AIに活用できます。
汎用型LLMでは難しい企業・組織固有のデータでのファインチューニングが可能なLLMです。お客様がお持ちの、信頼できる業務データを使用して、お客様の業務向けにカスタマイズすることができます。また、世界トップクラスのRAG技術を使ったお客様業務への最適化が可能です。
よくある質問
Q.LLMとSLMの違いは何ですか?
A.LLM(Large Language Model/大規模言語モデル)は、膨大な知識を基に高精度な応答ができる汎用モデルです。一方、SLM(Small Language Model/小規模言語モデル)は、より軽量かつ効率的にオフラインで動作するAIモデルです。
Q.LLMとRAGの違いは何ですか?
A.LLM(Large Language Model)は、膨大なテキストデータで事前学習した知識を基に文章を生成するAIモデルです。一方、RAG(Retrieval-Augmented Generation)はLLMの能力を補完する形で、外部のデータベースなどから必要な情報を検索し、その内容を基により正確かつ最新の応答を生成する仕組みです。LLMとRAGを組み合わせることで、より具体的で信頼性の高い回答を得ることができます。