マークダウン形式で書かれている情報をそのままRAGインポートすると、LLMのスペックによっては情報を構造的に理解できず無意味なRAGデータを生成する場合があります。
そんな時は以下のプロンプトを必要に応じて修正してご活用ください。
要望:ざっくりで良いので重要そうな情報をRAGデータに登録したい
#指示
以下の制約条件と添付資料をもとに、重要な情報を抽出してQAペアを生成してください。
#制約条件
各QAペアは以下のフォーマットで出力:
Q: [質問]
A: [回答]
文書の重要なポイントを質問と回答のペアとして抽出してください
質問は具体的で明確に
回答は簡潔かつ正確に
1つのQAペアは1つの概念やトピックに焦点を当てる
質問は “何”、”なぜ”、”どのように” などの疑問詞で始める
要望:文書をチャンクで分割してRAGデータに登録したい
#指示
以下の制約条件と添付資料をもとに、論理的なチャンクに分割した上でQAペアを生成してください。
#手順
1.文書を主要なトピックごとに分割
2.各チャンクから重要な情報を抽出
3.各チャンクにつき3-5個のQAペアを生成
#制約条件
各チャンクは独立して理解可能な単位にする
チャンク間の重複を最小限に
生成するQAは以下の基準を満たすこと:
明確な質問
正確な回答
チャンクの主要な情報を網羅
単一の概念に焦点
#出力フォーマット
[チャンク 1]
Q: [質問1]
A: [回答1]
Q: [質問2]
A: [回答2]
Q: [質問3]
A: [回答3]
要望:就業規則など条項形式の資料をRAGデータに登録したい
#指示
以下の制約条件と添付資料をもとに、QAペアを生成してください。
#手順
1. 1項ごとに、すべての条項のQAを作成
2. ○章○条○項などのタイトルをQuestionに、条項内の詳細テキストをAnswerとして原文のまま抽出
#制約条件
生成するQAは以下の基準を満たすこと
日本語で出力
要約ではなく添付データ通りのテキスト
1件のQAでコンテキストが超過する場合は、QAを分割する
#出力フォーマット
Q: [第1章 総則]
A: [総則には、一般的に就業規則の作成の目的や適用範囲等を規定します。]
Q: [第1条 目的1]
A: [この就業規則規程例(以下「本規程例」といいます。)では、労働者の就業に関する事項を定めていますが、その前提にある法令上の基準は、労基法等関係法令に定められて
います。]
Q: [【第4条 採用手続1】]
A: [ 会社は、労働者の採用に当たり、男女かかわりなく均等な機会を与えなければなりません(雇用の分野における男女の均等な機会及び待遇の確保等に関する法律(昭和47
年法律第113号。以下「均等法」といいます。)第5条)。 ]