異常な「?」や「意味・解説」「類語と例文を示すこと」を評価すること

最近では、そのへんから引っ張ってきたような意味や解説を並べたもの、類語と例文を並べるだけのページが増えてきました。

それ自体が確かに言葉の学習としての価値があるのならは良いのですが、概ね類語として示されているものは類語であってイコールではない、決定的な差異もあるのにそれが示されていないという形で、本質的な部分からは乖離しているような気がしてなりません。

異常に「?」がついていたり、意味や解説というワードを入れていたり類語や例文をよくよく吟味もしないまま掲載している感じです。

単純には、あまり良く考えていない人たちが、あまり良くも考えずにページを量産しているのでしょう。

問題は、そうして量産されたページに対する評価です。

仮に「国語的・言語的な価値」を算出することであっても、現代の人工知能が本当に正確に算出できるのかという点です。まあいずれはされていくでしょうが、現在は汚染状態という感じではないでしょうか。

異常な「?」

この数年でタイトルに「?」がたくさんついたページが増えてきました。

「価格は?使い方は?注意点は?」といったものや「出身校は?奥さんはいるの?」みたいなやつですね。

おそらく基本的に「疑問に対する答えが掲載されていること」が、検索エンジン的にも実際の人間の行動選択においても重要だと認識されやすいというところが原因となっているのでしょう。

しかしながら、確かに直接的に一つの問いに対する答えが掲示されているものであればそれほど違和感は感じないものの、やたらと連発されています。

そうした様を見ると、「私を見て♡」感を感じるので、僕はあえてスルーしています。

それを選ぶということは、それに投票するということにもつながるからです。

意味・解説

また、やたらと「意味は?」とか「解説します」というタイトルのものも目立つようになりました。

それで本当に深く考えられた上で意味や解説を行っているのならばまだいいですが、そうしたタイトル付けがなされたものは、概ね広告収入か売名目的のものばかりなので、そうした人たちの知能に沿ったレベルでしか意味が示されていなかったりします。

「解説」と言いながら、本人も本質的な意味がわかっていないという絶望です。

まあそれでも本人の学習として、覚書として書いておくのはいいですが、問題はそうしたものが不完全なアルゴリズムによって正確性の高いものとして判断されている場合があることです。

評価を決定するアルゴリズム上においては、形態素的な点とか権威性とか評価の転送という点くらいでしか「確からしさ」を算出することができないという感じです。

そしてその結果として、意味・解説として本質からずれたものが世の基準となってしまうという問題が生じます。

しかし、人工知能などにすべてを委ねるということ自体がナンセンスです。根本をたどると、情報リテラシーの問題となります。

すなわち「嘘を嘘であると見抜ける人でないとインターネットの利用は難しい」というやつであり、基礎的なリテラシーが備わっていないと、電〇汚染と同様、歪んだ観念を植え付けられていってしまうということにも繋がります。

インターネットの情報を信じて学校のテストやレポートで「×」をくらう程度ならいいですが、それでは済まないような領域のものもたくさんあります。

類語と例文を示すこと

類語と例文を示すことが何だかすごいことのように評価されていたりします。が、類語であるからには、類語としての差異を示す必要があるはずです。

近い概念でありながら決定的な差異があるものとか、文脈によっては意味が異なるものとか、少なからず差があるから類語であって、その単語の略語等々、同義語ではないからです。

「類語であるからには必ず違いがある」という感じになります。

類語や例文にしても、それが非常に吟味されていたものであればいいのですが、何となくの雰囲気だけでピックアップされたものを「数は多ければ多いほどいい」という安易な発想で大量に掲示していたりします。類語のその微かな差異について劃然たる区別がついているとは思えません。

まあ単に時間をかけて検討すればよいというものではありませんし、共通項としての部分を捉えるということさえできれば、後は自ずと差異も見えてくるので、そこまで目くじらを立てて掣肘する必要はないのかもしれません。

しかしながら、社会においては「それでは済まないような領域」があります。わかりやすいのは法的な領域です。

後々「そんなつもりじゃなかった」では済まされない領域ですね。

「みなす」と「推定する」

例えば類語として「みなす」と「推定する」という言葉があります。

日常会話であれば「そうみなされるよ」と「そう推定されてしまうよ」は、同じような意味で使われたりしますが、法律の領域になるとそれは通用しません。

まあ簡単に示すとするならば、反証をもって覆すことができるか否かという点です。「みなす」は反証があっても覆せませんし、「推定する」は反証があれば覆ることがあります。誰の判断かといえば裁判所の裁判官です。

いわば「自分の中での印象」という主観領域では、曖昧でもいいですが、社会的に、他人を含めてやりくりする時にはそれが通用しないという感じです。

だから類語や例文における単語の意味が曖昧であることは、個人のこととしてはいいですし、問題が生じない間柄とか、問題が生じない領域での国語表現としてはいいですが、社会においては時に問題を生じさせることがあります。

そういうわけなので、国語としての「意味や解説」を示すのであれば、そうした点を意識していないと品質が高いとは言えませんし、品質という面で考えれば、類語や例文の掲示においても本来は共通する部分と違いの部分をある程度しっかり示しておく必要があります。

しかしそうした、品質自体を今のアルゴリズムでは正確に算出することができません。

そんな中、時に問題が生じるような領域で「現代の人工知能が高品質だと判定する」ものの本質的には低品質のものが、インターネット空間を占めてしまえば、遅効性はあるもののいずれ社会に歪みが生じてしまうことになります。

といっても、先に触れたとおりに根本をたどると、情報ソースの選択という領域を含めて情報リテラシーの問題になります。

なので、検索エンジンやソーシャルネットワークなどだけのせいにすることはできません。

テストのための偽物で勝手にコンテンツが量産された

最後に少し触れておきますが、かなり前に本ブログで実験をしたことがあります。

それは書庫において学問領域として「あえて間違った記述」をしたものの、まんまと「広告収入が欲しい人達」などが「そうしたものがこの世にあるんだ」と思い込み、転載・リライトしてページを作っていました。はっきりと作成されていたもので言えば、概ね7つから10程度でしょうか。

この世のどこにもそんな言葉はないのに、まるでそれがあるかのようにページを生成していたわけです。しかも引用の旨は無しでです。

情報ソースは確実に本ブログ

情報ソースは確実に本ブログであり、本ブログを参考として「この世にある概念」を示したことになりますが、僕が遊びで作った概念だったというオチです。

まあ既に修正はしましたが、「もしかすると…」くらいに思っておいていただいたほうが良いですからね。

まあ本人たちの尊厳として、あえてそれが何だったのかは示しませんが、そうした人たちの知能の程度と邪念がよく見えて面白かったです。

リライト転載モノが根拠となっていく

で、面白いのが、一人が無断にも近い形で転載していくと、本ブログのそのページとその「リライト転載モノ」を見た人たちが、「そうした概念がこの世にあるんだ。パクろう」と思っていくということです。

まさに烏合の衆という感じです。

烏は知能が高いですが、その人達はどうでしょうか。

という遊びをやっている時、少しデスノート的で面白かったです。まあ究極の遊びです。

「テストのために偽物を作ったなんてひどいじゃないか」

と思う人もいるかもしれませんが、「正確かどうかはわかりませんよ」という旨を書いていたはずです。

「嘘を嘘であると見抜ける人でないとインターネットの利用は難しい」ということを適当に言っているわけではないというふうに捉えていただければと思います。

まあ単純には、意味の説明や解説を行ったり、類語や例文を示すなら「それが思考実験というものであれ、調査というものであれ、可能な限り経験し、消化したことを語れ」ということです。

細かなニュアンスがもたらす恩恵

極論的には、言語などただの印象へのラベリングでしかありません。もちろん社会においては、ある領域ではそれがどう扱われるかがだいたい決まっているという場合もあります。

しかし、誰かが意味を決めていて、その言葉はその意味しか持たないというものでもありません。

ただそんな中でも、「自分はその言葉を何だと思っているのか?」ということを関係性の中でよりくっきりと印象づけることが言語を取り扱う上では大切です。

例えば、意味に微差のある類語を知ることで、自分の感情をより的確に表現することもできるようになります。

そんな中、類語を同義語と同じように扱うと、細かなニュアンスがもたらす恩恵が削ぎ落とされてしまいます。

Category:IT &Internet パソコンとか通信とか

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語のみ