分散化ソクラテス:(13)レトリック操作の特性を逆手に取って検出する
前回述べた「マイナス→プラス」型のレトリック操作は、以下の理由で原理的には自動検出可能だ。
その理由:
たいていのポジショントークでは、印象操作でプラスにしたい銘柄や立場はあまり頻繁に変えられない
ゆえに、あるサイトの複数の文章が「特定銘柄のニュースに関して、ほぼ常に「マイナス→プラス」の形をしている」などはファクトチェックなしに検出できる。そして、文書作成者がポジションを変えてしまわない限り、安定した検出結果が期待できる。そして、ポジショントークで、押し付けたい立場を頻繁に変えるのはとても難しい。ヒトラーが言うように、プロパガンダは、執拗に同じ立場を繰り返すことではじめて効果を表すものだからだ。この「立場の固着」はポジショントークに固有の属性で、それ故に次の推定がとてもやりやすくなる。
「 あるサイト・人の複数の言動」から「立場×レトリック」を推定できる
現在のAI技術水準は、文章の単純な読解やスタイルについての推定は、平均的な人間に近くなりつつある。AIが苦手なのは、実世界の事実を使った推定だ。たとえば、「人類が滅びた」という文の後に「海外ツアー旅行にでかけた」はありえない(人類が滅びていたら、ツアー旅行を遂行してくれる人間もいないので)が、このタイプの矛盾検出はまだ難しい。
だが、レトリック検出なら、こうした実世界と文章の整合性は関係ない。レトリックの検出は文章のスタイル検出と話者が推奨するポジションを推測するタスクを結合したものだ。まず、話者がどの立場をプッシュしているかの推定は、特定トピックへの評価が結局プラスになるかマイナスになるか推定するタスクだ。これは、あるレビューが結局ポジティブなのかネガティブなのかを判定する「感情推定」というタスクに近い。これらは、文章外の現実を無視してもかなりうまくAIがこなせる事柄だ。映画のレビュー分類などで、すでにこなれた技術でもある。一方、文章のスタイル判定も現在のAI技術でこなせる範囲のタスクだ。
ポジション推定とスタイル検出ができたら、「話者Aは、トピックXについて語るときは、スタイル(レトリック)タイプnを使う率が高い」という両者を結合した推定を行う。これがレトリック検出で、上の例では、トピックX=株価の今後、「タイプn」=「マイナス→プラス」型のレトリック、となっている。これを各話者ごとに、全トピックについて計算すると、その話者のレトリック傾向が分かる。なお、何度も指摘するように、この結果はその話者が真実を話しているかどうか?とは関係がない。
もし、このようなレトリック検出の仕組みをボジショントークの作成者が知ったとしても、単純には回避できない
たとえば、「株価が上昇し続ける」という雰囲気をつくるためニュース作成者が「マイナス→プラス」型のレトリック操作をしていたとする。そして、この操作がレトリック検出に引っかかったことを、彼が知ったとする。だが、もし検出器を騙そうとして、単純に「プラス→マイナス」の順番にすると、マイナスの意見が最後に来るので、伝わる印象が、彼の要望であるプラスとは逆になってしまう。それではレトリック操作の意味がない。
もちろん、「マイナス→プラス」や「プラス→マイナス」ではなく、もっと手の込んだ文章にすることもできる。だが、それは恐らく「マイナス→プラス」のような単純な印象操作に比べ、労力は増加する一方、逆に効果は低くなってしまうだろう。複雑なレトリックほど、認識できる率が下がるからノイズに近くなるからだ。
また、先に触れたようにポジショントークは立場を固着させることではじめて効果を発揮する。だから、立場を変えて回避するのも難しい。
このような仕組みがあると、任意のサイトや人物に関して、それが「どの立場に対するポジショントークをしがち」であるかを自動検出することが、ファクトチェックとは無関係にできる。
もちろん、このチェックはファクトチェックや、SNS上のフォロー関係を使った影響性分析など、他の技術とも併用可能だ。
しかし、すぐわかるように、このチェックには膨大な計算リソースが必要になる。それを誰が提供できるのか?あるいは誰が提供すべきなのか?
次回はその点の扱いから分散組織でしかできないことの話に戻る。