データ利用による専門性や信頼性、権威性の評価の危険性

データ利用による専門性や信頼性、権威性の評価の危険性について少しだけ触れていきます。

最近、コロナウイルスに関連したデマがよく広がっていると見聞きしますが、内容を聞くと爆笑レベルであり、感情によって理性が抑制され、妄想が広がるととんでもないような暴論に行き着くということがよくよく示されているような気がします。

そんな爆笑レベルに反応する人も民主主義の中では一人一票で、さらに騒いで声が大きい人の声は一票以上の効果を持つということがいかに危険かということが垣間見れたりもします。

「それでもビッグデータですか?」という気がしてしまいます。

機械的には「重要な話題」として認識される

ネガティビティバイアスによって、そうした情報が評価されるということは普通の流れですが、そうした中でバズ(拡散)が起これば機械的には「重要な話題」として認識されます。

いわば機械任せにしていると「盛り上がっていることは重要」ということでデマがさらに広がりやすくなるということです。

そしてその裏にはもう一つの要因が潜んでいます。

それは情報の価値を計算するにあたっての専門性や信頼性、権威性の評価方法です。

専門性や信頼性、権威性の評価

曖昧な情報を嫌い、具体的で信頼性の高い情報を好むというのが、コンピュータを利用した情報の取り扱いでは一般的になっています。まあ機械にできるのはその分野のみということでもありますが、そうした専門性、信頼性、権威性といった要素をアルゴリズムでスコアリングしていくという感じになっています。

では、本当に専門的かとか信頼性が高いかとか、権威性があるかという部分についてどうやって判定しているのか、ということになりますが、結局は、形態素としての「語」の関連性や独自性、他の空間での引用や言及の頻度といったものが利用されているわけです。まあ後は、実在の法人格などの署名的な部分と連絡先等々の情報開示性くらいでしょう。

感情的に発信される情報の取り扱い

それはそれである程度の範囲であれば情報価の高さを判断するものとして使えると思いますが、問題はこうした人が感情的に騒ぐ時に発信される情報の取り扱いです。

妄想に取り憑かれている人が妄想で語ったことであっても、情報の中に構成される要素が専門的であり、論理一貫性があり、権威性のあるような実在の法人名称が掲載され、そしてその情報が、多数の空間で引用、言及されていれば、機械の計算としては専門性や信頼性、権威性がある「情報価の高い情報」として認識されるわけです。

専門用語が示されることで錯覚される専門性・信頼性

まあ例としては、先日デマとして取り上げられた花崗岩に関する情報です。花崗岩の持つ機能などが、それが本当のことかどうかはわからなくても、具体的に専門用語が示されていれば専門性・信頼性があると判断されるわけです。そしてそれを見たデマに反応する人も同様です。

そして、それがインターネット空間で「重要な情報」として判断されると、「より届きやすい情報」ともなりますし、さらに「前に出てきているのだから信頼の置ける情報」というふうに生の人間にも判断されていったりします。

本来は情報の価値を考えるにあたって「本当かどうか?」というところだけでなく、もし本当であったとしても多種多様な要素の中での重要性や寄与度なども考えねばなりません。

形態素の並びによるその時の情報価の判定

まああと、そうした「その時の情報価の判定」には、ワードの並びが影響しています。

最初は、デマ情報を構成する形態素(語)が並んでいることが評価されます。すなわち、例えばデマ情報であっても、「コロナウイルス」と「花崗岩」と「効果」のようなものが並べば、それが実際に有効であるかのようなデマ情報が表出するわけです。実際には形態素なので「コロナ」といった区切りになるでしょう。

それらの語を含んだ情報が、その時の盛り上がり情報として評価されてしまうといった感じです。

そしてその後、広い意味での権威性がある大手の情報配信元が、「コロナウイルス」「花崗岩」「効果」に「デマ」という語を並べたりすることで、その情報がデマであることを機械が認識するといった具合です。

そういうわけなのでタイムラグがあります。

情報を隠したりデマ扱いすることもできる

しかし逆に考えると、隠したい情報を大手の情報配信元がデマや不正確情報として配信しまくると、本当のことでもデマ扱いになるということでもあります。

それは大手配信元が意図的にしていると言うよりも、国際機関や政府などもっと大きな存在の公式情報としての配信を元に情報を配信するという構造から起こるという感じになるでしょう。

また、大学の名前さえついていれば信頼が置けるというふうに評価されたりもするので、議論が分かれているような事柄についても、都合の良い方を大学の名称をつけて大量に配信し、都合の悪い方は不正確情報として扱うということもできるわけです。

所詮データによる情報の価値の判断などその程度なのです。

そういうわけなので、保つべきは「理性」ということになりましょう。

データを利用した最適化への疑い

設計者・開発者たちの「評価への迷い」

Category:IT &Internet パソコンとか通信とか

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語のみ