トップへ

「AIより人間がつくった作品のほうがいい」という価値観は変化するのか。AI研究者・今井翔太に聞く

2024年06月27日 17:10  CINRA.NET

CINRA.NET

写真
Text by 生田綾
Text by 廣田一馬

凄まじいスピードで発展を続けるAI。クリエイティブの領域でもさまざまなかたちで利用が広がっている。

今回はAIについて考える連載企画の一環として、AI研究者の今井翔太にインタビュー。「AIを使いこなすには、まずAIを使わない『素の実力』を身につけないと意味がない」と話す今井に、AIと共存していく未来や、AIがカルチャーの関わりや考えかたなどについて、話を聞いた。

─5月に発表されたChat GPT-4oは大きな話題になりました。今井さんが特に注目した部分を教えていただきたいです。

今井:まず一つは音声、テキスト、画像すべてを処理できること。もう一つが、それを極めて高速に処理できるというところですね。

いままでの生成AIでは、音声を処理できるAIでも音声をいったんテキストに直して入力と出力を行ない、音声合成エンジンで出力するような手間を取っていました。GPT-4oでは、音声を物理学的な波形データで入力し、音声の形で出力できます。従来のようにテキストにすると失われてしまっていた人間の感情や、誰が喋っているかの情報が残るので、同じ言葉でも「怒っている」「怒っていない」という判別や、たくさん人がいる状況で誰が喋っているのかの判別ができる。非常に大きい変化だと思います。

─GPT-4oの出現によってよりAIの導入が進むと予想される業界や職業、今井さんが注目している活用事例があれば教えてください。

今井:一番に導入が進むのはコールセンターではないかと思います。カスタマーサービスへのGPT利用はすでに行なわれていて、リストラが多く発生したニュースも、2023年の時点で起きていました。ただ、従来のGPTのようにいちいち返事に5秒、30秒と時間がかかるようだと電話はまともに処理できないですし、音声もすべて機械音声で微妙でした。

GPT-4oでは電話の対応もかなり柔軟にできるということで、いままでのカスタマーサービスでは難しかったリアルタイムでの電話応対が完全に置き換えられると思います。

今井:これはまだ可能性の話ですが、感情表現ができるようになったことで「人間の本格的なパートナー」としてのAIのかたちも考えられると思います。

僕はもともとゲーマーでして、『ポケモン』の日本代表決定戦や世界大会に出場していた人間なんです。だから『ポケモン』や『ロックマンエグゼ』シリーズなんかも非常に好きなのですが、それらに登場するキャラクターやガジェット、あるいはドラえもん、アトムといったフィクションに登場するような、人間に寄り添う人間以外の知的存在が誕生する可能性が開かれたと思います。「パーソナルAI」とも呼べるような存在ですね。

─例えば『ポケモン』に登場するピカチュウにもそれぞれ性格の違いがありますが、「パーソナルAI」では性格の差異なども表現できるのでしょうか?

今井:一般的な大企業が目指しているかどうかはわかりませんが、僕個人としては目指しています。じつは、しばらくしたら起業しようと思っているところで、まさにそういったAIのパーソナライゼーションへの挑戦も視野に入れているんです。

先ほど例に挙げたような、個人に特有の知的パートナーをゲームやフィクションなどの分野で生み出したり描いたりしてきた文化的な中心は日本にあると思っているので、そういう形態でのAI活用が日本から生まれるといいなと思います。

─CINRAでは業務効率化のため、文章の要約などでAIを試験的に取り入れようとしています。一方でAIが生成した文章には間違いも多いですし、活用しきれているとは言い切れません。AI活用にまだ課題を感じている人は少なくないのではと思います。

今井:AIを使いこなそうとするのであれば、まずはしっかりその分野のエキスパートになったうえで、最低限のプロンプトエンジニアリングの知識とスキルを上げる必要があると思います。

例えばいま、イラストなどはAIによって誰でも綺麗な出力ができるようになっているわけです。でも、みんながすごいことをできるようになった瞬間、「みんなができる」ので価値がなくなってしまう。

そのなかで価値を出すには、その分野での専門知識や、みんなと違うプロンプトを入力​​することが必要です。絵を描く人であれば絵を描く技法、新聞記者であれば取材や編集、構成の技術、弁護士であるなら法律の知識、金融であれば金融の知識など、AIとはかけ離れた、いわゆる独立した専門知識のことです。

AIを使いこなすには、まずAIを使わない、「素の実力」を身につけないとダメだという話です。専門知識があるからこそ、明らかに素晴らしいものをつくることができるんだと思います。

─なるほど。クリエイティブ業界でもAIの活用が進んでいますが、著作権侵害の問題もありますし、人間の創造性を脅かすという懸念も指摘されています。今井さんが著書『生成AIで世界はこう変わる』で、人々の意識のなかには、AIよりも人間がつくったアート作品のほうが「良い」と感じる価値観が根強くあると指摘していたことが印象的でした。

今井:著作権の問題については議論が重ねられていますが、どう線引きしていくのかということは重要になってくると思います。

「人間がつくったほうが良い」というのは、僕個人としてもそうだと思っています。「機械が人間っぽいことするようなった」という、人類史のなかでも特殊な時期のいま、初めて気づいたことだと思うのですが、人間は国家同士では戦争もするものの、同じ種族で同胞なので、「人間は人間に感動する」というか、「人間を意識する」みたいなものが本能的にあるのではないかと思ってます。

僕もそうなんですが、素晴らしい映画や音楽を見て感動していたのに「じつはAIによって生成されたものでした」とネタばらしされたら、人間の本能からするとなにか「ハックされた、騙された」という感じにどうしてもなってしまうと思うんですね。

ちゃんと人間を評価したいのに、じつは機械でつくられたものだった、素晴らしいものをつくった裏に人間がいなかった、というのは本能的な部分でも気持ち的な部分でも寂しく空虚なものですし、繰り返しになりますが、人間は人間に感動するものなのだと思います。

─AI自体を受け入れはしても、AIがつくったものを受け入れられない気持ちを捨て去るのは難しいと。

今井:そうですね。でも最近は、その意識がいつまで変わらないかもわからなくなってきています。先日、ある創作物にふれて素晴らしいなと思った瞬間があったのですが、それがAIがつくった作品だったということをあとから知ったんです。そういう体験もあって、機械によって生み出された作品を社会全体がどう受け入れていくのか、確証が持てなくなりました。じつは機械が生み出しても受け入れていく未来があるんじゃないかと不本意ながら少し思ってしまった。

とはいえ、いま起きていることは人類史上初めての事態なので、実際にどう転がるかは、たかが1人の研究者に聞いたところでわからないと思います。

─例えば、いま公開中の映画『マッドマックス:フュリオサ』では、フュリオサの幼少期からの変化を子役の顔と主演のアニャ・テイラー=ジョイの顔をAIで合成することで表現していることが話題になっています。

今井:ハリウッドなどの場合、仮に生成された子役を使っていたとしてもそのセリフや動きを考えているのは裏にいる人間で、つまりそこには人間の意図があるんです。映画をつくっている人が、AIの動きも含めて考えてつくったもので、それが事前知識としても伝わっているので、観客は「機械がつくった」とはそこまで意識しないのではないでしょうか。あくまで外見が機械的につくられているだけで、裏には人間がいる。その利用方法は妥当なものだと思っています。

今井:ほかにも、映画だと『トップガン マーヴェリック』では闘病によって声が出なくなったヴァル・キルマーの声をAIで生成していました。ちゃんと裏に人間の手が入っていて、表現手段としてAIを使わざるを得ないということであれば、人々からそこまで違和感が持たれないのではないかと思います。

例えば、僕は映像をつくる知識はありませんが、少なくとも表面上はAIを使って映像をつくることができる。でも、僕が映像に気持ちを込めてつくったとか、すごい工夫をしたとか、そういうものはないわけじゃないですか。たかがAI研究者がいくつかプロンプトを入れてつくっただけで、それはまったく努力ではない。そういったものを、人間も評価したくないと思います。

ハリウッドの事例のように、手の込んだ表現手段として使うことと、映像やイラスト、音楽について何の知識もない人が、創作に対して熱意なくいいものを生み出してしまうことは、一線を画していると思いますね。