Google AI Studio(Geminiなど)を使って、Markdown形式のブログ記事を見出し部分と本文部分で別々のスピーカーに読み上げてもらうには、以下のようなステップで進めるのが現実的です。
まず、記事のMarkdownを読み込み、以下のように見出しと本文を分離します。
例(Markdown):
# タイトル
## 見出し1
ここは本文の一部です。
## 見出し2
本文の続き。
上記を構造化:
[
{ "role": "header", "text": "見出し1" },
{ "role": "body", "text": "ここは本文の一部です。" },
{ "role": "header", "text": "見出し2" },
{ "role": "body", "text": "本文の続き。" }
]
次に、見出しは「スピーカーA」、本文は「スピーカーB」と仮定して、それぞれの音声生成用のテキストを用意します。
スピーカーA: 見出し1
スピーカーB: ここは本文の一部です。
スピーカーA: 見出し2
スピーカーB: 本文の続き。