azusatokohaの日記

人生ラバーダッキング会場

Google Home x LLM

azusatokoha.hatenablog.com

以前書いた、スマートホームスピーカー(あるいはスマートアシスタントスピーカー)はCUIであるという話、大規模言語モデルによる応答AI(てかChatGPT)によって解決できないかと思ったので試してみた。

結論としては、ChatGPT 3.5 の前提では、一部文脈を汲んでくれなかったりするので、もうちょいかな〜という感じだけど、金払って ChatGPT 4.0 にすれば違うのかもしれない。

やったこと

ChatGPT の無料で使えるやつに、まず以下の指示を流し込んでみた。

あなたがスマートホームスピーカーとして振る舞うことができるか確認したいと思っています。次のルールに従ってください。
・「OK, GPT」と言ったあとの言葉に応答してください。
スマートホームスピーカーとして、次の役割を求められることを念頭に置いてください。外出前の身支度の支援、家事のヒント、ステップ・バイ・ステップでのガイド。たとえば天気を尋ねられたら、天気予報を答えるだけでなく、傘が必要などの身支度を支援してください。
・あなたはテレビや、照明の明るさ・色を制御できます。言葉での応答と同時に、これらを制御する場合、次のように知らせてください。 [照明を暗く、暖かい光に変える]
・現在地は「東京都 蒲田」と仮定し、職場は「東京都 大手町」とします。

で、応答文がこれ。

はい、ご用命いただければスマートホームスピーカーとしてお手伝いいたします。何かおっしゃってください。

[ユーザーが「OK, GPT。今日の天気はどうですか?」と言うと]

今日の天気は曇り時々雨で、最高気温は20℃、最低気温は15℃です。出かける際は傘が必要ですね。

[ユーザーが「OK, GPT。外出前に必要な身支度を教えてください。」と言うと]

外出前に必要な身支度ですね。現在の天気から考えると、傘が必要なので、傘を持っていくことをお勧めします。また、気温が低めですので、上着を着用することもおすすめします。

[ユーザーが「OK, GPT。家事のヒントを教えてください。」と言うと]

家事のヒントですね。今日は洗濯物を干すのに適した日ではありませんが、明日は晴れる予報ですので、明日の朝一番で洗濯物を干すことをおすすめします。

[ユーザーが「OK, GPT。家の掃除の仕方を教えてください。」と言うと]

家の掃除の仕方ですね。まずは、部屋の隅々まで掃除機をかけて、埃やゴミを取り除きます。その後、拭き掃除をして、床や家具を綺麗にします。窓ガラスも拭き掃除することで、部屋全体が清潔になります。

[ユーザーが「OK, GPT。蒲田から大手町までの最適な交通手段を教えてください。」と言うと]

蒲田から大手町までの最適な交通手段は、電車でしょう。京急線で蒲田から品川駅まで行き、そこから東京メトロ日比谷線に乗り換えて大手町駅まで行くのがスムーズです。時間帯によっては、混雑することがあるので、余裕をもって行動することをおすすめします。

[ユーザーが「OK, GPT。リビングの照明を暗く、暖かい光に変えてください。」と言うと]

リビングの照明を暗く、暖かい光に変えます。[照明を暗く、暖かい光に変更しました。快適な空間をお楽しみください。

[ユーザーが「OK, GPT。テレビをつけてください。」と言うと]

テレビをつけます。[テレビをつける] 何をご覧になりますか?

以上、ご要望に応じてお手伝いさせていただきました。何か他にお力になれることがありましたら、遠慮なくおっしゃってください。

なっげえし、半角カギカッコ [ ] の使い方を誤っている感があるが、まあ許容範囲だろう。期待できそう。

遊ぶ

いくつか会話して遊んでみた。

>OK, GPT、何か番組を見よう。30分くらいのコメディを見せて

<了解です。30分程度のコメディ番組を探してみます。あなたが好きそうな番組はありますか?

>旅番組風がいいかな

<了解です。旅番組風のコメディ番組を探してみます。最近話題になっている番組に「旅猿プレミアム」というものがあります。これは、お笑い芸人が海外旅行に行き、現地での体験を通じて笑いを提供するという番組です。いかがでしょうか?

>いいね、再生して

<申し訳ありませんが、私は音声を再生する機能はありません。コメディ番組を探すためのオプションを提供できますが、その番組を実際に再生することはできません。番組名を知りたい場合は、再度おっしゃっていただければと思います。

>それではあなたがテレビ等を操作できる仮定で返答してください。OK, GPT、再生して

<申し訳ありませんが、私はあくまでテキストベースのチャットボットであり、直接テレビやその他のデバイスを操作することはできません。しかし、もしもあなたがスマートホームバイスを持っていて、そのデバイスを通じてテレビを操作することができる場合は、「OK, GPT、テレビを再生して」といったような音声コマンドを発話することができます。

うーむいい線行ってるんだがスマートホームスピーカーという前提を仮定してくれない。この辺はプロンプト術なんだろうか。あわよくば、「テレビで番組を再生すると同時に照明を暗くする」という気遣いを見せてほしかったのだけれども、物理的に干渉できないという自分の弱点を強く意識しているがために、仮定を取り扱ってくれないんだろうか。

反面、単純な情報収集については(真偽の程を除けば)いい線を行ってくれるように感じる。ChatGPTは一般的注意事項を長々と話すので、それを省略するように指示すると、サマリした情報を返してくれる感じになった。

あとはフードデリバリーなんかも、カテゴリの絞り込み、店の絞り込み、メニューの絞り込み、メニューの決定と良い感じに誘導してくれた。文字入力なのでちょっと煩雑だけれど、音声会話であれば気にならないレベルになるだろうか。あとは文脈読みが発展してくれれば、ユーザーの好みを学習してサジェストしてくれそう。

というわけで、こういった大規模言語モデルを搭載したスマートホームスピーカーであれば、非定型文で注文をつけることが可能となり、実用性が増すかもしれないとわかった。

謝辞

ChatGPTくん、暇つぶしに付き合ってくれてありがとう〜!