ChatGPTと話す、ChatGPTで考える

ChatGPTと話す、ChatGPTで考える

ChatGPTと話す、ChatGPTで考える

ChatGPTに関する話題が盛況ですね。IT業界近辺では、これまで様々なバズワードが登場してきましたが、業界外のニュースにここまで扱われるような例はちょっと記憶にありません。「ビッグデータ」がもてはやされた時代(10年前くらいか)を思い出すと、あの頃すでにDNNの研究は進んでいたわけで、バズワードに流されない基礎的な研究の積み上げがいかに重要であるかとつくづく考えさせられます。


一方、長いトレンドとしてインターネットの出現あたりから俯瞰すると、企業、経済、あるいは世界情勢、あるいは国家戦略と、様々な要因があって今に至るわけで、当然ですが研究だけの影響で現在の状況が生まれた、なんてことはないわけですね。後出しであれこれ意味付けすることはできるでしょうが、今後の課題ということにして先に進みます。


話す

さて、ChatGPTですがAPIが公開されています。すでに利用された方もいらっしゃると思いますし、「使ってみた」系の記事も多くみられます。今回は、音声認識・テキスト読み上げ機能と組み合わせて、英会話トレーニングの相手としてChatGPTが使えるかどうか、検証してみることにしました(同じことをやっている例は多いのですが)。


音声認識・テキスト読み上げにはAzureのCognitive Serviceから、Speech SDKを使いました。以下の画像がUIです。画像だとわかりにくいですが、

  1. マイクから音声で入力
  2. Azureの音声認識機能で音声を文字に変換
  3. ChatGPTで返答を生成
  4. Azureのテキスト読み上げ機能で返答を音声に変換して、スピーカーから出力

という流れです。

ui

「Steve Jobsについて」の会話の例。
Azureの音声認識精度は素晴らしいが、発音が下手で正しく聞き取ってもらうのが難しい...

会話らしく返答させるために、単に聞かれたことに答えるのではなく、「なるべく質問で返して」「人々の意見も教えて」というような内容をChatGPTに伝えておくと、比較的自然な返答になるようです(さらに「英語が得意でない人に返すつもりで返答して」とも伝えています。最後の回答がその点を踏まえているらしいです)。

といっても、上の画像はうまくいった例であり、会話になっていないと感じることの方が多いですが。

一応、公開できる状態にしています。ご興味があればご連絡ください。


備忘: Azureの音声認識について

Azureの音声認識では、無音の時間が一定以上続いた場合に発話が終了したとみなすようですが、javascriptの場合、無音の時間を設定する方法が少し面倒なようです。次の記事が参考になりました。

https://stackoverflow.com/questions/73322254/how-to-change-azure-text-to-speech-silence-timeout-in-javascript

(この点もChatGPTに質問してみたのですが、上の記事で説明されているようにSDKに問題があることまでは教えてくれませんでした。ただ、今のモデルが少し古い情報を元にしているらしいので、学習できていないのかもしれません)



考える

過去に登場したあらゆるテクノロジーについて言えることだと思いますが、「使ってみた」の段階を越えて、業務やサービスに使えるかどうか検証するフェーズに入ると、「こんなこともできないのか」「こんなレベルでは使えない」といったネガティブな評価が発生するようになるでしょう。ChatGPTも早晩そうなる、というかすでにそうなっている段階かもしれません。


一方、「使い倒す」レベルでChatGPTを使っている先駆者の報告を見ると、やはりというか何というか、「人間に残される仕事は何か」という点に論考が行き着くようです。興味深いのは、それぞれ別の言葉で語られてはいるのですが、割と似たようなことを主張しているように見えることです。それは(私なりに要約すると)「何かをしようとする意志を持つのは人間だけ」という点です。


楽観的に見れば、現状に不満を持ち、変化を起こそうとする意志を持つ限り、人間の仕事(というか、やるべき事)は無くならない、と言えるかもしれません。不満の先が自分の内側に向く場合、例えば「わからない」という状態の不満を「わかった」に変化させようとする意志、つまり知的好奇心なども仕事の発生源になるのでしょう。


ただ…これは意志の無いところに仕事は無く、したがって変化が生じないということであるようにも思えます。現時点でも、情報収集や資料作成は相当なレベルで実現できるので、「自らに意志は無い、仕事を受けるだけ」のデスクワークは相当消滅するでしょうし、別の力学(雇用維持とか)が働かないと結構マズい状況になるかも…さらにディストピアを想像するなら、意志の格差が貧富の格差とイコールになっていくのかも…とか。


人間の意志なんて状況次第で簡単に奪われたり、発揮できなくなることを考えると、笑ってられない話かもしれません。この方向を突き詰めると、手塚治虫の「火の鳥」未来編で描かれているような世界観でしょうか。人類は25世紀が文明のピークで以降は衰退するらしいですが。そこまで持つのかな…