近年ウェブ検索の質の著しい低下を感じたりします。その中でもとりわけ取り消し線付きで「含まれない: キーワード| 含めて検索:」という感じで「キーワードを勝手に除外する」というような機能に酷さを感じます。
誤字ならばまだしも、入力したものを勝手に除外するというのはいかがなものでしょうか。
それだけでなく「キーワードは含まれているものの、キーワードとは特に関係ないようなページが上位に表示される」というような感じで、普通に検索結果が酷いということを感じたりします。
確かにキーワードは含まれているものの、キーワードとは特に関係ない
「確かにキーワードは含まれているものの、キーワードとは特に関係ないじゃないか」と思うようなものが多くなりました。
これはきっと、情報の精度を測る上で、配信元の信頼性のようなものを重視しすぎているからと言うようなものになるでしょう。
配信元の信頼性が関係しているのなら、情報の精度も高いはずじゃないか、となりそうなものですが、実際にはそうでもありません。
大手メディアのスパム行為
例えば、「コロナ」というキーワードを単体で入力したとしましょう。
すると、トップニュースとして「アフターコロナの留学先として注目されているのは…」
というようなものが表示されるわけです。
「いやいやいやいや…」
というふうに感じたりはしないでしょうか。
そうしたものが表示される背景には、それを配信しているのが大手メディアだからというような理由になります。
「大手が配信しているのだから信頼性があるだろう」
というような判断になりますが、そういう問題ではありません。
こうなると、キーワードを利用したスパムと変わりありません。
情報の信頼性が求められ、その信頼性には配信元の信用性が関わるというのはわかりますが、そうした判断基準を重視し、それ以外の対策をしないのであれば、「信用性を悪用した大手メディアのスパム行為」を容認しているというふうに感じてしまいます。
複合キーワードの意図するところ
そうした信頼性・信用力の部分ばかり重視するからこそ、「キーワードを勝手に除外する」というようなことにもなるのでしょう。
先の例は単体のキーワードでしたが、モノによっては複合キーワードでも勝手に除外されるので、意図しない情報を見せられる危険性が高まります。
元々複合キーワードというものは、「求めているものとは関係ないものを除外するための絞り込み」という意図が強いはずですが、そうしたものも勝手に除外され、挙げ句、大手メディアだからと広告臭いページばかりが表示されるのはいかがなものかと思ったりします。
配信されては蓄積していくので、情報量が指数関数的に多くなっていく中、精度を高めるのも一筋縄ではいかないというのはわかりますが、大手メディアとか、監修者が学者だからということでそればかり重視するとロクな情報には当たらなくなります。
それを悪用した電○臭いグレーゾーンスパムが横行してしまうからです。
そうなると、インターネット空間の面白さが半減してしまいます。
まあまた何かしらの対策が必要になるでしょう。
bossuさんこんばんは。
キーワードを勝手に除外する機能ほど余計なお世話という言葉の似合う機能は他にないでしょう・・・
この手の機能だと検索候補の予測などはうろ覚えのときに役立つこともありましたが、
除外に関しては本当にデメリットを感じたことしかありません。
マイナーな語句や固有名詞のときに起こりがちですが、
何も検索エンジン相手に「そんな言葉聞いたことないしどうせ間違っているに決まっているから消しておいた」
「いいえこれであってますので勝手に消さないでいただきたい」という感じの不愉快なやり取りをさせてこなくてもいいでしょうに・・・
こうした検索内容の「矯正」じみた構造が野放しになる原因はAIの欠陥だけでなく、あまりにマイナーな単語で検索されても
大手スポンサーへのアクセスにあまり繋がらないという収益構造の都合もあるのではないかなどと勘繰ってしまいました。
検索エンジンに限らず各種プラットフォームが間に割り込み、あの手この手で情報にフィルタリングをかけてくる今の時代、
ネットサーフィンにも相応のサーフィンスキルが求められるなぁなどと思いました。
コメントどうもありがとうございます。
一応ダブルクォーテーションで囲ってフレーズとして検索するとか、完全一致指定をするといった多少の対策はできますが、そんな対策もある程度の知識がないとできなかったり、煩わしかったりします。「ワードの揺れには対応して欲しいが、除外されるのは困る」といった時に面倒なことになってきます。
原則と例外を逆転させて、意図する方向、均質化や運営側の収益最大化の方に向かわせるという風潮が多くなってきました。
こうした検索における情報の取り扱いや、各種プラットフォームのハイライトなどにおける「重要」とか「フェイク」の判定をする判断材料は何なのかを聞かせて欲しい、といったところです。